建立油气田领域项目案例知识图谱、案例检索方法及装置制造方法及图纸

技术编号:37503608 阅读:14 留言:0更新日期:2023-05-07 09:39
本发明专利技术公开了一种建立油气田领域项目案例知识图谱方法、油气田领域项目案例的检索方法及装置。所述方法包括:搜集油气田领域目标项目相关的各案例的文本;对目标项目的案例的文本内容进行分词处理,并将分词处理后得到的各个第一分词,分别划归于预设的多个分类维度中;所述分类维度包括下述任一项或多项的组合:文本题目、关键词、项目实施主体标识、项目实施周期、应用层级、项目效益、项目投资、涉及的装置、涉及的工艺流程和能源类型;根据分类的结果创建所述油气田领域项目案例的知识图谱,所述知识图谱中的每个实体,分别与所述分类维度对应。本发明专利技术扩大了项目案例或实例的推荐范围,利用知识图谱的方式,也有效提升了项目案例的推送效果。目案例的推送效果。目案例的推送效果。

【技术实现步骤摘要】
建立油气田领域项目案例知识图谱、案例检索方法及装置


[0001]本专利技术涉及知识图谱
,特别涉及一种建立油气田领域项目案例知识图谱方法、油气田领域项目案例的检索方法及装置。

技术介绍

[0002]目前随着知识图谱技术的兴起,在石油石化行业,国际石油企业如Shell、BP、Statoil、Chevron等都引入并实施以知识图谱为中心的知识管理项目,来提高企业的生产效率,并从这些知识管理的项目中得到了较大的收益。
[0003]以节能项目为例,国内各个油气田企业内部积累了大量的节能技改措施,缺乏整体地、有效地分享,节能节水技术管理较为零散,油气田企业在节能改造项目的过程中关联技术推荐较弱,未能对各类节能技改措施项目实施过程中的知识进行沉淀积累和复用,同时,相关学术研究也缺乏油气田节能技术案例推荐技术研究。除了节能项目,在该行业的其他项目领域,也存在类似的问题,缺少方便、可靠的技术手段来帮助油气田企业检索、推送适用的案例,以促进生产效率提高和节能降耗。

技术实现思路

[0004]鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种建立油气田领域项目案例知识图谱方法、油气田领域项目案例的检索方法及装置,以帮助油气田企业检索、推送项目适用的案例,促进油气田企业的生产效率提高和节能降耗。
[0005]第一方面,本专利技术实施例提供一种建立油气田领域项目案例知识图谱的方法,包括:
[0006]搜集油气田领域目标项目相关的各案例的文本;
[0007]对目标项目的案例的文本内容进行分词处理,并将分词处理后得到的各个第一分词,分别划归于预设的多个分类维度中;所述分类维度包括下述任一项或多项的组合:文本题目、关键词、项目实施主体标识、项目实施周期、应用层级、项目效益、项目投资、涉及的装置、涉及的工艺流程和能源类型;
[0008]根据分类的结果创建所述油气田领域项目案例的知识图谱,所述知识图谱中的每个实体,分别与所述分类维度对应。
[0009]对目标项目的案例的文本内容进行分词处理之后,还包括:
[0010]剔除各个第一分词中的停用词和/或无意义词。
[0011]在一个实施例中,将分词处理后得到的各个第一分词,分别划归预设的多个分类维度中,包括:
[0012]对剔除停用词和/或无意义词后的各第一分词进行语义识别,根据语义,将各第一分词划归预设的多个分类维度中。
[0013]在一个实施例中,根据分类的结果创建所述油气田领域项目案例的知识图谱,包
括:
[0014]遍历所搜集的案例的文本,针对每个案例的文本,将分词处理得到的各个第一分词,按照其所属的分类维度,分别创建知识图谱中对应类别的实体节点;
[0015]根据文本的内容,在知识图谱中,分别创建文本题目类别的实体节点,与关键词项目实施主体标识、项目实施周期、应用层级、项目效益、项目投资、涉及的装置、涉及的工艺流程和能源类型类别的各实体节点之间的关联关系。
[0016]第二方面,本专利技术实施例提供一种油气田领域项目案例的检索方法,包括:
[0017]获取用户至少一条搜索记录,并对所述搜索记录进行分词处理,得到各第二分词;
[0018]使用各第二分词,与预先建立的油气田领域项目案例知识图谱中各关键词类别的实体节点进行匹配,确定与所述各第二分词所匹配的关键词类别的实体节点;
[0019]在所述知识图谱中,查找所述关键词类别的实体节点相连的文本题目类别的实体节点;
[0020]根据所述知识图谱中所述文本题目类别的实体节点与其他类别的实体节点的关联关系,查找与所述文本题目类别的实体节点关联的一跳其他类型的实体节点;
[0021]查找与所述其他类型的实体节点存在直接关联关系的一跳文本题目类型的实体节点;
[0022]根据查找出来的文本题目类型的实体节点,将文本题目所对应的案例的文本作为检索结果进行推荐。
[0023]在一个实施例中,查找与所述其他类型的实体节点存在直接关联关系的一跳文本题目类型的实体节点之后,还包括:
[0024]去掉所述文本题目类型的实体节点中重复出现的实体节点。
[0025]第三方面,本专利技术实施例提供一种建立油气田领域项目案例知识图谱的装置,包括:
[0026]文本搜集模块,用于搜集油气田领域目标项目相关的各案例的文本;
[0027]分词模块,用于对目标项目的案例的文本内容进行分词处理;
[0028]分类模块,用于将分词处理后得到的各个第一分词,分别划归于预设的多个分类维度中;所述分类维度包括下述任一项或多项的组合:文本题目、关键词、项目实施主体标识、项目实施周期、应用层级、项目效益、项目投资、涉及的装置、涉及的工艺流程和能源类型;
[0029]知识图谱创建模块,用于根据分类的结果创建所述油气田领域项目案例的知识图谱,所述知识图谱中的每个实体,分别与所述分类维度对应。
[0030]在一个实施例中,知识图谱创建模块,具体用于遍历所搜集的案例的文本,针对每个案例的文本,将分词处理得到的各个第一分词,按照其所属的分类维度,分别创建知识图谱中对应类别的实体节点;根据文本的内容,在知识图谱中,分别创建文本题目类别的实体节点,与关键词项目实施主体标识、项目实施周期、应用层级、项目效益、项目投资、涉及的装置、涉及的工艺流程和能源类型类别的各实体节点之间的关联关系。
[0031]第四方面,本专利技术实施例提供一种油气田领域项目案例的检索装置,包括:
[0032]获取模块,用于获取用户至少一条搜索记录,并对所述搜索记录进行分词处理,得到各第二分词;
[0033]匹配模块,用于使用各第二分词,与预先建立的油气田领域项目案例知识图谱中各关键词类别的实体节点进行匹配,确定与所述各第二分词所匹配的关键词类别的实体节点;
[0034]查找模块,用于在所述知识图谱中,查找所述关键词类别的实体节点相连的文本题目类别的实体节点;根据所述知识图谱中所述文本题目类别的实体节点与其他类别的实体节点的关联关系,查找与所述文本题目类别的实体节点关联的一跳其他类型的实体节点;查找与所述其他类型的实体节点存在直接关联关系的一跳文本题目类型的实体节点;
[0035]推荐模块,用于根据查找出来的文本题目类型的实体节点,将文本题目所对应的案例的文本作为检索结果进行推荐。
[0036]第五方面,本专利技术实施例提供一种服务器,所述服务器包括存储器和处理器;其中,所述存储器存储有计算机程序,所述程序被处理器执行时能够实现如前述的建立油气田领域项目案例知识图谱的方法或实现如前述的油气田领域项目案例的检索方法。
[0037]第六方面,本专利技术实施例提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由系统芯片的处理器执行时,使得处理器能够执行如权利要求1

4任一项所述的建立油气田领域项目案例知识图谱的方法或实现如权利要求5或6所述的油气田领域项本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种建立油气田领域项目案例知识图谱的方法,其特征在于,包括:搜集油气田领域目标项目相关的各案例的文本;对目标项目的案例的文本内容进行分词处理,并将分词处理后得到的各个第一分词,分别划归于预设的多个分类维度中;所述分类维度包括下述任一项或多项的组合:文本题目、关键词、项目实施主体标识、项目实施周期、应用层级、项目效益、项目投资、涉及的装置、涉及的工艺流程和能源类型;根据分类的结果创建所述油气田领域项目案例的知识图谱,所述知识图谱中的每个实体,分别与所述分类维度对应。2.如权利要求1所述的方法,其特征在于,对目标项目的案例的文本内容进行分词处理之后,还包括:剔除各个第一分词中的停用词和/或无意义词。3.如权利要求2所述的方法,其特征在于,将分词处理后得到的各个第一分词,分别划归预设的多个分类维度中,包括:对剔除停用词和/或无意义词后的各第一分词进行语义识别,根据语义,将各第一分词划归预设的多个分类维度中。4.如权利要求1所述的方法,其特征在于,根据分类的结果创建所述油气田领域项目案例的知识图谱,包括:遍历所搜集的案例的文本,针对每个案例的文本,将分词处理得到的各个第一分词,按照其所属的分类维度,分别创建知识图谱中对应类别的实体节点;根据文本的内容,在知识图谱中,分别创建文本题目类别的实体节点,与关键词项目实施主体标识、项目实施周期、应用层级、项目效益、项目投资、涉及的装置、涉及的工艺流程和能源类型类别的各实体节点之间的关联关系。5.一种油气田领域项目案例的检索方法,其特征在于,包括:获取用户至少一条搜索记录,并对所述搜索记录进行分词处理,得到各第二分词;使用各第二分词,与预先建立的油气田领域项目案例知识图谱中各关键词类别的实体节点进行匹配,确定与所述各第二分词所匹配的关键词类别的实体节点;在所述知识图谱中,查找所述关键词类别的实体节点相连的文本题目类别的实体节点;根据所述知识图谱中所述文本题目类别的实体节点与其他类别的实体节点的关联关系,查找与所述文本题目类别的实体节点关联的一跳其他类型的实体节点;查找与所述其他类型的实体节点存在直接关联关系的一跳文本题目类型的实体节点;根据查找出来的文本题目类型的实体节点,将文本题目所对应的案例的文本作为检索结果进行推荐。6.如权利要求5所述的方法,其特征在于,查找与所述其他类型的实体节点存在直接关联关系的一跳文本题目类型的实体节点之后,还包括:去掉所述文本题目类型的实体节点中重复出现的实体节点。7.一种建立油气田领域项目案例知识图谱的装置,其特征在于,包括:文本...

【专利技术属性】
技术研发人员:李峻郭以东余洋祁滢曾丽花王亦然
申请(专利权)人:中国石油天然气股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1