【技术实现步骤摘要】
一种知识图谱问答方法、装置、设备和存储介质
[0001]本申请涉及自然语言处理
,特别是涉及一种知识图谱问答方法
、
装置
、
设备和存储介质
。
技术介绍
[0002]知识图谱问答是一种基于知识图谱的自然语言理解和生成技术,旨在解决人类与计算机之间的交互问题
。
近年来,随着人工智能技术的快速发展,知识图谱问答也得到了广泛的关注和研究
。
[0003]目前,无论是通用图谱还是一定领域的图谱,其构建的简单问答效果都达到了一个比较好的水平,但在特定领域内,存在着知识图谱不完善
、
链接缺失等问题给多跳问答带了的诸多挑战,许多方法缺失了对于复杂问句的解析和对于问句的主题信息获取,从而难以在知识图谱中寻找问题答案
。
技术实现思路
[0004]基于此,本申请提供了一种知识图谱问答方法
、
装置
、
设备和存储介质,能够在在知识图谱中准确地找到多跳
、
聚合等复杂问句的答案
。
[0005]第一方面,提供一种知识图谱问答方法,该方法包括:
[0006]获取用户输入的询问信息,其中,询问信息包括询问语句;
[0007]解析询问语句,得到主题查询图;
[0008]根据主题查询图和预设知识图谱,生成询问语句的结果候选图;
[0009]计算主题查询图和结果候选图的相似值;
[0010]根据相似值最大的结果候选图,生 ...
【技术保护点】
【技术特征摘要】
1.
一种知识图谱问答方法,其特征在于,所述方法包括:获取用户输入的询问信息,其中,所述询问信息包括询问语句;解析所述询问语句,得到主题查询图;根据所述主题查询图和预设知识图谱,生成所述询问语句的结果候选图;计算所述主题查询图和所述结果候选图的相似值;根据相似值最大的结果候选图,生成答复信息
。2.
根据权利要求1所述的方法,其特征在于,所述解析所述询问语句,得到主题查询图,包括:通过预先训练的主题抽取模型获取所述询问语句的字向量;采用数据降维分析算法对所述字向量进行降维处理,得到降维字向量;根据所述降维字向量,选取所述询问语句的至少一个主题词;根据所述询问语句和所述至少一个主题词,生成主题查询图
。3.
根据权利要求2所述的方法,其特征在于,所述根据所述询问语句和所述至少一个主题词,生成主题查询图,包括:对所述询问语句进行语法分析,得到问句依存树图,其中,所述问句依存树图包括至少一个顶点;对所述询问语句进行顶点识别,得到问句实体信息;对所述询问语句进行关系抽取,得到实体关系信息;根据所述问句依存树图
、
所述至少一个主题词
、
所述问句实体信息
、
所述至少一个顶点和所述实体关系信息,生成主题查询图
。4.
根据权利要求1所述的方法,其特征在于,所述主题查询图包括第一顶点和目标实体信息,所述预设知识图谱包括第二顶点;所述根据所述主题查询图和预设知识图谱,生成所述询问语句的结果候选图,包括:将所述第一顶点作为实体链接到所述第二顶点;根据所述目标实体信息,匹配所述主题查询图中的目标实体与所述预设知识图谱中对应的第二顶点,得到目标第二顶点;连接所述目标第二顶点,得到所述询问语句的结果候选图
。5.
根据权利要求1所述的方法,其特征在于,计算所述主题查询图和所述结果候选图的相似值,包括:提取所述主题查询图和所述结果候选图中节点的节点信息;根据所述节点信息,计算所述主题查询图和所述结果候选图的节点相似值;根据所述主题查询图和所述结果候选图的节点相似值,计算所述主题查询图和所述结果候选图的相似值
。6.
根据权利要求5所述的方法,其特征在于,所述节点信息包括节点总数
、
节点总集合和链接节点向量;所述提取所述主题查询图和所述知识图谱子图中节点的节点信息,包括:采用第一公式计算所述主题查询图和所述结果候选图中节点的节点总数,所述第一公式表示为:
n
=
|R1|+|R2|
其中,
n
表示节点总数,
R1表示主题查询图的节点集合,
R2表示结果候选图的节点集合,
|
R1|
表示主题查询图的节点个数,
R2表示结果候选图的节点个数;采用第二公式计算所述主题查询图和所述结果候选图中节点的节点总集合,所述第二公式表示为:
U
=
R1∪R2其中,
U
表示节点总集合,
R1表...
【专利技术属性】
技术研发人员:李平,刘天奇,屈小强,田志欣,张慧颖,孙岩,刘渭滨,邢薇薇,何伟,邹智元,
申请(专利权)人:北京交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。