【技术实现步骤摘要】
一种知识图谱的关系预测方法、装置、设备及存储介质
[0001]本专利技术涉及自然语言处理
,特别涉及一种知识图谱的关系预测方法、装置、设备及存储介质。
技术介绍
[0002]知识图谱问答主要有基于语义解析的方法和基于信息检索的方法,而基于语义解析的方法更加适用于复杂问句的解析,且解析过程也更具可解释性。其中,基于查询图的方法属于语义解析方法,在针对复杂问句解析中,解析方式更加直观和全面,且由于查询图本身具备明显的推理过程,更加适合复杂问句的知识图谱问答。
[0003]基于查询图的方法,其关键技术可以包括查询图生成与排序、查询图编码、问句与查询图的相似度计算,以上关键技术没有很好的结合,其中,在对查询图进行编码时没有选择合适的编码方式,导致查询图生成质量不高。
[0004]有鉴于此,提出本申请。
技术实现思路
[0005]本专利技术公开了一种知识图谱的关系预测方法、装置、设备及存储介质,旨在解决查询图生产质量不高的问题。
[0006]本专利技术第一实施例提供了一种知识图谱的关系预测
【技术保护点】
【技术特征摘要】
1.一种知识图谱的关系预测方法,其特征在于,包括:获取待预测问句,并对待预测问句进行提取生成链接实体集,将所述链接实体集结合知识图谱以生成候选查询图;调用语义匹配网络对所述候选查询图和所述问句进行处理,以生成相似度值;根据所述相似度值,对所述候选查询图进行排序,以确定最优查询图;根据所述最优查询图生成所述问句中所有实体之间的关系。2.根据权利要求1所述的一种知识图谱的关系预测方法,其特征在于,所述获取待预测问句,并对预测问句进行提取生成链接实体集,将所述链接实体集结合知识图谱以生成候选查询图,具体为:对所述待预测问句进行提取,生成链接实体集,并在链接实体集中任选一个实体作为主题实体,其余实体作为约束实体;获取给定的知识图谱,并根据所述知识图谱生成所述主题实体的多条第一查询路径,以及所述约束实体的多条第二查询路径,保留多条第一查询路径与多条第二查询路径相同的多条第三查询路径;对多条所述第三查询路径和多条所述第一查询路径进行任意组合,以生成候选查询图。3.根据权利要求1所述的一种知识图谱的关系预测方法,其特征在于,还包括对语义匹配网络进行训练,具体为:将问句q和候选查询图g的拼接送入编码层,将[CLS]标记的解码输出向量确定为问句q和候选查询图g的联合向量rep
q,g
,具体表示如下:rep
q,g
=BertLayer({[CLS],q,[SEP],g,[SEP]})
[CLS]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)将所述联合向量rep
q,g
送入到BiLSTM网络和CNN网络,具体表示如下:h
q
=BiLSTM(rep
q,g
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)h
q
=CNN(rep
q,g
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)接着,将两个输出向量进行拼接:h
q,g
=concat(h
q
,h
g
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)再采用sigmoid函数进行非线性变换:sim
q,g
=sigmoid(h
q,g
W+b)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中,W为权重,b为偏置;调用二分类交叉熵损失函数在数据集上进行更新训练,直至训练精确达到预设阈值时停止,生成语义匹配网络,其中,二分类交叉熵损失函数的表达式为:loss
BBlC
=
‑
ylog(sim
q,g
)
‑
(1
‑
y)log(1
‑
sim
q,g
)。4.根据权利要求1所述的一种知识图谱的关系预测方法,其特征在于,所述语义匹配网络的输入层为BERT预训练模型、中间层为融合BiLSTM和CNN的多通道网络结构、输出层为二分类层。5.一种知识图谱的关系预测装置,其特征在于,包括:候选查询图生成单元,用于获取待预测问句,并对待预测问句进行提取生成链接实体集,将所述链接实体集结合知识图谱以生成候选查询图;相似度值生成单元,用于...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。