一种知识图谱问答方法、终端设备及存储介质技术

技术编号:35063441 阅读:37 留言:0更新日期:2022-09-28 11:19
本发明专利技术涉及一种知识图谱问答方法、终端设备及存储介质,该方法中包括:根据知识图谱中的实体、关系和属性的名称构建词库;基于词库对问句进行实体、关系和属性进行识别;对问句进行句法分析;判断问句是否属于单跳类型,如果是,采用模板匹配方式获取问句对应的查询语句;否则,采用子图匹配方式获取问句对应的查询语句;基于查询语句从知识图谱中进行查询。本发明专利技术通过对问句类型进行区分,对简单问句沿用模板匹配的方式,而对复杂问句采用子图匹配的方式来获取查询语句,在保证简单问题准确回答的基础上,又能支持多跳、推理等复杂类型问题的答案检索,能显著提升知识图谱问答能力。能显著提升知识图谱问答能力。能显著提升知识图谱问答能力。

【技术实现步骤摘要】
一种知识图谱问答方法、终端设备及存储介质


[0001]本专利技术涉及知识图谱
,尤其涉及一种知识图谱问答方法、终端设备及存储介质。

技术介绍

[0002]基于知识图谱的问答(Knowledge Graph Question Answering,KGQA)是自然语言处理领域的研究方向。知识图谱是知识的结构化表示,由三元组(主语,谓词,宾语)构成,表示实体和实体间存在的语义关系,例如:厦门市花是三角梅,可以表示为:(厦门,市花,三角梅)。通过把非结构化、半结构化和结构化的数据抽取出来组成一种基于图的数据格式,由点和边组成一个庞大的关系网络图,这大大的优化了搜索性能。
[0003]知识图谱问答可以解决传统搜索的问题。同时,结合自然语言处理技术,通过近似匹配、语义理解、关系判断等,在数据库中检索出相似度最高的数据。知识图谱问答主要任务是给定自然语言问题,理解问题中包含的实体、语义关系和逻辑组合,到知识图谱中检索并返回答案。
[0004]现有的知识图谱问答产品通过模板匹配的方式组装查询语句,对单实体单属性、单实体多属性、多实体单属性、多实体多属性等简单问句查询的准确率高、效果较好,目前在装备图谱测试准确率90%以上,但模板生成需要较专业的语言学知识且可扩展性不强,问句泛化能力弱,对于复杂问句类型穷举难,尤其对于条件约束、时间约束多跳问句或者最值、比较、是否、并列推理复杂类型问句兼容不够难以返回准确答案,难以满足用户的需求。

技术实现思路

[0005]为了解决上述问题,本专利技术提出了一种知识图谱问答方法、终端设备及存储介质。
[0006]具体方案如下:
[0007]一种知识图谱问答方法,包括以下步骤:
[0008]S1:根据知识图谱中的实体、关系和属性的名称构建词库;
[0009]S2:基于词库对问句进行实体、关系和属性进行识别;
[0010]S3:对问句进行句法分析;
[0011]S4:判断问句是否属于单跳类型,如果是,采用模板匹配方式获取问句对应的查询语句;否则,采用子图匹配方式获取问句对应的查询语句;
[0012]S5:基于查询语句从知识图谱中进行查询。
[0013]进一步的,步骤S1中还包括对知识图谱中的实体、关系和属性的名称进行同义词生成操作,基于原词和同义词共同构建词库。
[0014]进一步的,基于词库对问句进行实体进行识别的过程包括:通过命名实体识别模型对问句中的实体进行识别;通过实体链接从词库中提取识别到的实体在知识图谱中对应的实体名称。
[0015]进一步的,基于词库对问句进行关系和属性进行识别的过程包括:基于词库中的
关系和属性的名称对问句的关系和属性进行查找。
[0016]进一步的,单跳类型的问句包括单实体单属性单跳类型和单实体多属性单跳类型。
[0017]进一步的,采用子图匹配方式获取问句对应的查询语句的过程包括:基于句法分析结果获取问句的所有查询子图,将各查询子图分别与知识图谱进行匹配,根据匹配程度对所有查询子图进行排序,将排序最高的查询子图作为问句对应的查询语句。
[0018]进一步的,基于句法分析结果获取问句的所有查询子图的过程包括:
[0019]S101:根据知识图谱以键值对的方式构建关系词典,关系词典中键为关系,值为关系对应的两个实体;
[0020]S102:根据句法分析结果构建问句的依存关系树;
[0021]S103:基于关系词典,在依存关系树中查找所有节点名称为关系词典中的关系名称的节点作为关系节点;
[0022]S104:遍历依存关系树中所有以关系节点为根节点的子树,如果该子树与关系词典中的任一键值对完全匹配,则设定该子树为关系子树;
[0023]S105:根据依存关系树中边的词性,获取关系子树中各边的词性;
[0024]S106:基于关系子树中各边的词性,获取关系子树中关系节点对应的主语节点和宾语节点并进行标注,将标注后的关系子树作为查询子图。
[0025]一种知识图谱问答终端设备,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本专利技术实施例上述的方法的步骤。
[0026]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本专利技术实施例上述的方法的步骤。
[0027]本专利技术采用如上技术方案,通过对问句类型进行区分,对简单问句沿用模板匹配的方式,而对复杂问句采用子图匹配的方式来获取查询语句,在保证简单问题准确回答的基础上,又能支持多跳、推理等复杂类型问题的答案检索,能显著提升知识图谱问答能力。
附图说明
[0028]图1所示为本专利技术实施例一的流程图。
具体实施方式
[0029]为进一步说明各实施例,本专利技术提供有附图。这些附图为本专利技术揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本专利技术的优点。
[0030]现结合附图和具体实施方式对本专利技术进一步说明。
[0031]实施例一:
[0032]本专利技术实施例提供了一种知识图谱问答方法,如图1所示,所述方法包括以下步骤:
[0033]S1:根据知识图谱中的实体、关系和属性的名称构建词库。
[0034]用于构建词库的知识图谱应与问句属于相同的领域,通过cypher查询语句遍历图
谱节点,可以获取知识图谱中的实体、关系、属性等的名称,将实体、关系和属性的名称添加至词库内。
[0035]进一步的,由于一个词可能有多种不同的表达方式,当问句中出现的词与知识图谱中出现的词属于相同含义但不同表达方式时,则无法进行查询,为了避免该问题,本实施例中还包括对知识图谱中的实体、关系和属性的名称进行同义词生成操作,将生成的同义词同样添加至图库内,当查询时将所有的同义词(表示和词条意思相同的词汇或短语)转换为知识图谱中的词即可完成查询,提升问句的识别能力,例如词条“打印机”下设置同义词“云打印”,当问句中出现的词为“云打印”时,将其转换为“打印机”后,再根据“打印机”从知识图谱中进行查询。
[0036]S2:基于词库对问句进行实体、关系和属性进行识别。
[0037]基于词库对问句进行实体进行识别的过程包括:通过命名实体识别模型对问句中的实体进行识别;通过实体链接从词库中提取识别到的实体在知识图谱中对应的实体名称。
[0038]基于词库对问句进行关系和属性进行识别的过程包括:基于词库中的关系和属性的名称对问句的关系和属性进行查找。
[0039]S3:对问句进行句法分析。
[0040]S4:判断问句是否属于单跳类型,如果是,采用模板匹配方式获取问句对应的查询语句;否则,采用子图匹配方式获取问句对应的查询语句。
[0041]所述跳是指节点固定方向出现边的次数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识图谱问答方法,其特征在于,包括以下步骤:S1:根据知识图谱中的实体、关系和属性的名称构建词库;S2:基于词库对问句进行实体、关系和属性进行识别;S3:对问句进行句法分析;S4:判断问句是否属于单跳类型,如果是,采用模板匹配方式获取问句对应的查询语句;否则,采用子图匹配方式获取问句对应的查询语句;S5:基于查询语句从知识图谱中进行查询。2.根据权利要求1所述的知识图谱问答方法,其特征在于:步骤S1中还包括对知识图谱中的实体、关系和属性的名称进行同义词生成操作,基于原词和同义词共同构建词库。3.根据权利要求1所述的知识图谱问答方法,其特征在于:基于词库对问句进行实体进行识别的过程包括:通过命名实体识别模型对问句中的实体进行识别;通过实体链接从词库中提取识别到的实体在知识图谱中对应的实体名称。4.根据权利要求1所述的知识图谱问答方法,其特征在于:基于词库对问句进行关系和属性进行识别的过程包括:基于词库中的关系和属性的名称对问句的关系和属性进行查找。5.根据权利要求1所述的知识图谱问答方法,其特征在于:单跳类型的问句包括单实体单属性单跳类型和单实体多属性单跳类型。6.根据权利要求1所述的知识图谱问答方法,其特征在于:采用子图匹配方式获取问句对应的查询语句的过程包括:基于句法分析结果获取问句的所有查询子图...

【专利技术属性】
技术研发人员:洪万福黄勇苏金钟
申请(专利权)人:厦门渊亭信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1