【技术实现步骤摘要】
一种钻完井设计文献搜索方法、系统、设备及介质
[0001]本专利技术涉及知识图谱构建
,特别是关于一种钻完井设计文献搜索方法、系统、设备及介质。
技术介绍
[0002]传统的钻完井知识库构建方式是通过对文献进行入库属性登记,构建非结构话文本的主数据方式实现的。
[0003]然而,这种基于属性表单的数据库构建方式存在以下几个问题:1)知识没有关联,不同表单之间形成信息孤岛,在跨表单应用场景中,无法建立知识之间的关联,不能模仿人的联想思维,因此对人思维能力的扩展有限。业务数据以行政管理组织结构为参照建立,每一部门建立自己的数据库,部门之间的数据访问有严格的管理限制,即使内部也无法看到需要的数据,且内部数据系统很多,会出现重复建设、数据分散、应用价值不高的问题。2)知识无法按照业务需要进行组织,在应用时一篇文章的属性描述不全,文献只有项目编号没有统一的业务编号,就无法进入相关业务研究。另外,文献之间也没有关联,搜索得到的文献第一篇和第二篇有词的长短包含关系,没有业务的包含关系。
技术实现思路
[000 ...
【技术保护点】
【技术特征摘要】
1.一种钻完井设计文献搜索方法,其特征在于,包括:获取项目的某一文献,并对获取的文献进行加工处理,得到文献的属性作为搜索词;将搜索词输入至预先建立的基于知识图谱的知识库中的搜索框上,进行基于知识图谱的扩展搜索,得到对应的文献;将加工处理后的文献加入至基于知识图谱的知识库中。2.如权利要求1所述的一种钻完井设计文献搜索方法,其特征在于,所述基于知识图谱的知识库的构建过程包括:建立知识体系,确定知识的概念图谱;采集钻完井数据和钻完井数据库文件数据,建立文献的知识库;根据建立的知识体系和确定的知识概念图谱,对采集的数据进行知识加工和内容提取,得到属性和五元组图谱文件;对已有文献结构化数据库中的正文进行知识加工和内容提取,得到五元组图谱文件,并追加至上述建立的文献的知识库和得到的五元组图谱文件中;在建立的文献的知识库上增加知识扩展,得到基于知识图谱的知识库;根据文献的知识库和基于知识图谱的知识库,建立实例图谱。3.如权利要求2所述的一种钻完井设计文献搜索方法,其特征在于,所述基于知识图谱的知识库的构建过程还包括:基于建立的实例图谱,以建立的知识体系为引导,可视化展示知识图谱全景。4.如权利要求2所述的一种钻完井设计文献搜索方法,其特征在于,所述知识体系包括知识分类体系、知识模板和知识关系,所述知识分类体系包括业务维度分类指标和技术维度分类指标。5.如权利要求2所述的一种钻完井设计文献搜索方法,其特征在于,所述钻完井数据和钻完井数据库文件数据的采集方式包括知识采集方式、接口采集、网络爬虫和模板导入,采用的知识资源包括历史设计报告、现场作业数据、科研报告、标准库和专题报告。6.如权利要求2所述的一种钻完井设计文献搜索方法,其特征在于,所述根据建立的知识体系和确定的知识概念图谱,对采集的数据进行知识加工和内容提取,得到属性和五元组图谱文件,包括:对采集的数据进行预处理,得到全文句子序列;通过标签字典对全文句子序列进行处理,将全文句子序列变换为文...
【专利技术属性】
技术研发人员:刘兆年,岳家平,谢仁军,范白涛,幸雪松,李中,王宁,刘宇沛,王名春,仝刚,姬煜晨,张兴全,潘豪,
申请(专利权)人:中海石油中国有限公司北京研究中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。