一种知识图谱问答方法技术

技术编号:39853608 阅读:12 留言:0更新日期:2023-12-30 12:53
本申请涉及一种知识图谱问答方法

【技术实现步骤摘要】
一种知识图谱问答方法、装置、设备和存储介质


[0001]本申请涉及自然语言处理
,特别是涉及一种知识图谱问答方法

装置

设备和存储介质


技术介绍

[0002]知识图谱问答是一种基于知识图谱的自然语言理解和生成技术,旨在解决人类与计算机之间的交互问题

近年来,随着人工智能技术的快速发展,知识图谱问答也得到了广泛的关注和研究

[0003]目前,无论是通用图谱还是一定领域的图谱,其构建的简单问答效果都达到了一个比较好的水平,但在特定领域内,存在着知识图谱不完善

链接缺失等问题给多跳问答带了的诸多挑战,许多方法缺失了对于复杂问句的解析和对于问句的主题信息获取,从而难以在知识图谱中寻找问题答案


技术实现思路

[0004]基于此,本申请提供了一种知识图谱问答方法

装置

设备和存储介质,能够在在知识图谱中准确地找到多跳

聚合等复杂问句的答案

[0005]第一方面,提供一种知识图谱问答方法,该方法包括:
[0006]获取用户输入的询问信息,其中,询问信息包括询问语句;
[0007]解析询问语句,得到主题查询图;
[0008]根据主题查询图和预设知识图谱,生成询问语句的结果候选图;
[0009]计算主题查询图和结果候选图的相似值;
[0010]根据相似值最大的结果候选图,生成答复信息

[0011]根据本申请实施例中一种可实现的方式,解析询问语句,得到主题查询图,包括:
[0012]通过预先训练的主题抽取模型获取询问语句的字向量;
[0013]采用数据降维分析算法对字向量进行降维处理,得到降维字向量;
[0014]根据降维字向量,选取询问语句的至少一个主题词;
[0015]根据询问语句和至少一个主题词,生成主题查询图

[0016]根据本申请实施例中一种可实现的方式,根据询问语句和至少一个主题词,生成主题查询图,包括:
[0017]对询问语句进行语法分析,得到问句依存树图,其中,问句依存树图包括至少一个顶点;
[0018]对询问语句进行顶点识别,得到问句实体信息;
[0019]对询问语句进行关系抽取,得到实体关系信息;
[0020]根据问句依存树图

至少一个主题词

问句实体信息

至少一个顶点和实体关系信息,生成主题查询图

[0021]根据本申请实施例中一种可实现的方式,主题查询图包括第一顶点和目标实体信
息,预设知识图谱包括第二顶点;根据主题查询图和预设知识图谱,生成询问语句的结果候选图,包括:
[0022]将第一顶点作为实体链接到第二顶点;
[0023]根据目标实体信息,匹配主题查询图中的目标实体与预设知识图谱中对应的第二顶点,得到目标第二顶点;
[0024]连接目标第二顶点,得到询问语句的结果候选图

[0025]根据本申请实施例中一种可实现的方式,计算主题查询图和结果候选图的相似值,包括:
[0026]提取主题查询图和结果候选图中节点的节点信息;
[0027]根据节点信息,计算主题查询图和结果候选图的节点相似值;
[0028]根据主题查询图和结果候选图的节点相似值,计算主题查询图和结果候选图的相似值

[0029]根据本申请实施例中一种可实现的方式,节点信息包括节点总数

节点总集合和链接节点向量;提取主题查询图和知识图谱子图中节点的节点信息,包括:
[0030]采用第一公式计算主题查询图和结果候选图中节点的节点总数,第一公式表示为:
[0031]n

|R1|+|R2|
[0032]其中,
n
表示节点总数,
R1表示主题查询图的节点集合,
R2表示结果候选图的节点集合,
|R1|
表示主题查询图的节点个数,
R2表示结果候选图的节点个数;
[0033]采用第二公式计算主题查询图和结果候选图中节点的节点总集合,第二公式表示为:
[0034]U

R1∪R2[0035]其中,
U
表示节点总集合,
R1表示主题查询图的节点集合,
R2表示结果候选图的节点集合;
[0036]采用第三公式和第四公式计算主题查询图和结果候选图中节点的链接节点向量,第三公式表示为:
[0037][0038]其中,表示中节点度的向量,为原始节点
u

k
跳邻居节点的节点集合,
k≥0

u∈U

vector()
表示变长数组函数;
[0039]当
k∈[1,K]时,第四公式表示为:
[0040][0041]其中,
K
为设定的直径,
d
u
表示链接节点向量,表示为中节点度的向量

[0042]根据节点信息,计算主题查询图和结果候选图的节点相似值,包括:
[0043]根据链接节点向量,采用相似度算法计算主题查询图和结果候选图的节点相似值,相似度算法表示为以下公式:
[0044][0045]其中,
sim(n1,n2)
表示节点相似值,
γ
s
表示标量参数,表示节点总集合
U
中主题查询图的节点
n1的链接节点向量,表示节点总集合
U
中结果候选图的节点
n2的链接节点向量

[0046]根据本申请实施例中一种可实现的方式,根据主题查询图和结果候选图的节点相似值,计算主题查询图和结果候选图的相似值,包括:
[0047]根据主题查询图和结果候选图的节点相似值,生成节点相似矩阵;
[0048]基于所述节点相似矩阵,采用第五公式计算所述主题查询图和所述结果候选图的相似值,所述第五公式可以表示为:
[0049][0050]其中,
α
表示主题查询图与结果候选图的相似值,
sim
ij
表示主题查询图中第
i
个节点和结果候选图中第
j
个节点的节点相似值,
|R1|
表示主题查询图的节点个数,
|R2|
表示结果候选图的节点个数

[0051]第二方面,提供了一种知识图谱问答装置,该装置包括:
[0052]获取模块,用于获取用户输入的询问信息,其中,询问信息包括询问语句;
[0053]解析模块,用于解析询问语句,得到主题查询本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种知识图谱问答方法,其特征在于,所述方法包括:获取用户输入的询问信息,其中,所述询问信息包括询问语句;解析所述询问语句,得到主题查询图;根据所述主题查询图和预设知识图谱,生成所述询问语句的结果候选图;计算所述主题查询图和所述结果候选图的相似值;根据相似值最大的结果候选图,生成答复信息
。2.
根据权利要求1所述的方法,其特征在于,所述解析所述询问语句,得到主题查询图,包括:通过预先训练的主题抽取模型获取所述询问语句的字向量;采用数据降维分析算法对所述字向量进行降维处理,得到降维字向量;根据所述降维字向量,选取所述询问语句的至少一个主题词;根据所述询问语句和所述至少一个主题词,生成主题查询图
。3.
根据权利要求2所述的方法,其特征在于,所述根据所述询问语句和所述至少一个主题词,生成主题查询图,包括:对所述询问语句进行语法分析,得到问句依存树图,其中,所述问句依存树图包括至少一个顶点;对所述询问语句进行顶点识别,得到问句实体信息;对所述询问语句进行关系抽取,得到实体关系信息;根据所述问句依存树图

所述至少一个主题词

所述问句实体信息

所述至少一个顶点和所述实体关系信息,生成主题查询图
。4.
根据权利要求1所述的方法,其特征在于,所述主题查询图包括第一顶点和目标实体信息,所述预设知识图谱包括第二顶点;所述根据所述主题查询图和预设知识图谱,生成所述询问语句的结果候选图,包括:将所述第一顶点作为实体链接到所述第二顶点;根据所述目标实体信息,匹配所述主题查询图中的目标实体与所述预设知识图谱中对应的第二顶点,得到目标第二顶点;连接所述目标第二顶点,得到所述询问语句的结果候选图
。5.
根据权利要求1所述的方法,其特征在于,计算所述主题查询图和所述结果候选图的相似值,包括:提取所述主题查询图和所述结果候选图中节点的节点信息;根据所述节点信息,计算所述主题查询图和所述结果候选图的节点相似值;根据所述主题查询图和所述结果候选图的节点相似值,计算所述主题查询图和所述结果候选图的相似值
。6.
根据权利要求5所述的方法,其特征在于,所述节点信息包括节点总数

节点总集合和链接节点向量;所述提取所述主题查询图和所述知识图谱子图中节点的节点信息,包括:采用第一公式计算所述主题查询图和所述结果候选图中节点的节点总数,所述第一公式表示为:
n

|R1|+|R2|
其中,
n
表示节点总数,
R1表示主题查询图的节点集合,
R2表示结果候选图的节点集合,
|
R1|
表示主题查询图的节点个数,
R2表示结果候选图的节点个数;采用第二公式计算所述主题查询图和所述结果候选图中节点的节点总集合,所述第二公式表示为:
U

R1∪R2其中,
U
表示节点总集合,
R1表...

【专利技术属性】
技术研发人员:李平刘天奇屈小强田志欣张慧颖孙岩刘渭滨邢薇薇何伟邹智元
申请(专利权)人:北京交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1