一种基于高精度的油气知识图谱问答方法、系统、存储介质和设备技术方案

技术编号:42843500 阅读:28 留言:0更新日期:2024-09-27 17:14
本发明专利技术涉及自然语言理解和知识图谱的领域,具体提出了一种基于高精度的油气知识图谱问答方法、系统、存储介质和设备,将用户提问的问句作为q;通过替换函数Dict将q替换成q’;利用命名实体识别结合专用词典对比的方式,提取问句中的实体关键信息,构建问句中的实体信息的集合Entities;利用Graph查询找出知识图谱中对应的实体关键信息,构建油气知识图谱问答系统的数据库中的实体信息的集合metaData;判断问句类型和用户查询意图,访问该油气知识图谱问答系统的数据库获得相应的查询结果,将查询结果转换成可理解的答案返回给用户。本发明专利技术解决了传统方法面对包括同义词、歧义、多义性及不同语序等语义多样性的情况,增加了解释用户意图的挑战的问题。

【技术实现步骤摘要】

本专利技术涉及自然语言理解和知识图谱的领域,涉及一种基于高精度的油气知识图谱问答方法、系统、存储介质和设备


技术介绍

1、知识图谱是一种语义网络,知识图谱通常包括有关实体和关系以及属性的关联,这些关联以图形式表示事实和概念之间的关系。知识图谱问答是一项自然语言处理任务,目的在于通过自然语言提问来检索知识图谱中的信息。知识图谱问答为用户提供了精确且结构化的答案,包括但不限于智能搜索、虚拟助手和智能推荐系统。

2、已知的知识图谱问答方法依赖自然语言处理技术的向量化和图谱随机游走,且在小规模知识图谱上展现出较高的可解释性,但对于油气知识图谱问答,传统方法通过计算向量相似度来进行油气问答的方法将知识进行向量化存储所需的时间和算力资源与数据量成正比,导致其难以适应超大规模的数据集,不适用与知识谱图等结构化数据,研究人员通过性能更强的大语言模型来做向量化,尝试得到维度更高的自然语义表征向量,但是语义表征丰富的同时也增加了问答的时间复杂度和空间复杂度,难以满足油气知识图谱问答的时间要求。

3、传统方法面对包括同义词、歧义、多义性及不同语序等语义本文档来自技高网...

【技术保护点】

1.一种基于高精度的油气知识图谱问答方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,通过替换函数Dict将查询问句q替换成新的问句q’,包括:

3.根据权利要求1所述的方法,其特征在于,所述命名实体识别模型需要训练,包括:

4.根据权利要求1所述的一种基于高精度的油气知识图谱问答方法,其特征在于,构建油气知识图谱问答系统的数据库中的实体信息的集合metaData,包括:

5.根据权利要求1所述的一种基于高精度的油气知识图谱问答方法,其特征在于,所述问句类型通过分析具体的业务场景、按照实体数量及路径长度分为四大类:...

【技术特征摘要】

1.一种基于高精度的油气知识图谱问答方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,通过替换函数dict将查询问句q替换成新的问句q’,包括:

3.根据权利要求1所述的方法,其特征在于,所述命名实体识别模型需要训练,包括:

4.根据权利要求1所述的一种基于高精度的油气知识图谱问答方法,其特征在于,构建油气知识图谱问答系统的数据库中的实体信息的集合metadata,包括:

5.根据权利要求1所述的一种基于高精度的油气知识图谱问答方法,其特征在于,所述问句类型通过分析具体的业务场...

【专利技术属性】
技术研发人员:李立隋泽栋梁晓飞唐国清龚吉轩郭媛媛赵好雨
申请(专利权)人:中国石油天然气集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1