一种基于强化状态建模的知识图谱多跳推理方法技术

技术编号：38836259 阅读：8 留言：0更新日期：2023-09-17 09:52

本发明专利技术公开了一种基于强化状态建模的知识图谱多跳推理方法，包括以下步骤：利用一组嵌入模型对知识图谱数据进行预训练，得到实体和关系的嵌入表示，并使用测试集评估各嵌入模型的预测性能，得到一组MRR指标；根据MRR指标计算模型权重，并对各嵌入模型进行排序，得到带权重的嵌入模型；根据带权重的嵌入模型，对每个查询计算对应的全局目标嵌入表示；根据全局目标嵌入表示，构建强化学习状态模型；对强化学习状态模型进行训练，并使用训练完成的强化学习状态模型进行知识图谱的推理补全工作，完成基于强化状态建模的知识图谱多跳推理。本发明专利技术解决了针对强化代理全局信息表征不足，在稀疏图谱上的推理缺乏依据，从而限制了模型链接预测性能的问题。接预测性能的问题。接预测性能的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于强化状态建模的知识图谱多跳推理方法

[0001]本专利技术属于知识图谱补全
，具体涉及一种基于强化状态建模的知识图谱多跳推理方法。

技术介绍

[0002]近年来，知识图谱KG作为人类知识结构化表示的一种形式，在人工智能领域得到了广泛运用，为多样化的下游任务如问答、推荐和决策等提供了坚实基础。然而，随着对知识图谱KG研究的不断拓展，其固有的缺陷如不完整性和不充分性日益明显，这成为了限制知识图谱KG实际应用性能的关键因素。考虑到许多知识图谱是通过人工或者半自动方式构建的，因此，哪怕是大规模的知识图谱，其实体关系的挖掘程度仍然呈现稀疏特点。对于具有更丰富主题类型、更广泛应用场景的中小型或者领域知识图谱，稀疏性问题表现得更为突出。为此，行业从业者亟待找寻一种解决图谱稀疏性的方法。为了应对这一需求，知识图谱补全KGC技术，即链接预测技术应运而生。知识图谱补全KGC旨在对知识图谱中缺失的实体和关系进行预测，探究未知事实，从而尽量完善和丰富知识图谱的信息内容，这是提升知识图质量的关键手段。
[0003]最初，研究者采用基于嵌入的方法，通过将实体和关系映射到同一特征空间来进行知识图谱补全，但其预测结果缺乏解释性，并且无法对复杂关系路径进行建模。后来，基于路径的方法通过在图结构中添加路径信息进行编码，在一定程度上克服这个缺陷，然而受限于寻路随机性和路径爆炸的问题，其结果表现难以提高。最近，领域内逐步兴起了基于强化学习的多跳推理模型，该推理方法与人类推理过程和直觉相符，通过在知识图谱KG上进行有限步推理预测缺失的三

【技术保护点】

【技术特征摘要】
1.一种基于强化状态建模的知识图谱多跳推理方法，其特征在于，包括以下步骤：S1、利用一组嵌入模型对知识图谱数据进行预训练，得到实体和关系的嵌入表示，并使用测试集评估各嵌入模型的预测性能，得到一组MRR指标的集合MRRs；S2、根据MRR指标，计算各个嵌入模型的模型权重，并按照嵌入模型的模型权重递减的顺序对各个嵌入模型进行重新排序，得到带权重的嵌入模型；S3、根据带权重的嵌入模型，对每一个查询计算对应的全局目标嵌入表示；S4、根据全局目标嵌入表示，构建强化学习状态模型；S5、利用知识图谱对强化学习状态模型进行训练，并使用训练完成的强化学习状态模型进行知识图谱的推理补全工作，完成基于强化状态建模的知识图谱多跳推理。2.根据权利要求1所述的基于强化状态建模的知识图谱多跳推理方法，其特征在于，所述步骤S2中计算各个嵌入模型的模型权重的公式为：其中，α
i
表示第i个嵌入模型的权重，MRR
i
表示第i个嵌入模型的MRR指标，k'表示集合内MRR元素的总个数。3.根据权利要求1所述的基于强化状态建模的知识图谱多跳推理方法，其特征在于，所述步骤S3具体步骤为：S31、将查询q输入至一组带权重的嵌入模型中，并通过每个带权重的嵌入模型分别对查询q进行预测，得到一组全局目标的集合Targets；S32、将一组全局目标的集合Targets中的每个置信度分别乘上每个带权重嵌入模型对应的权重，将预测到相同答案实体的置信度累加，并将所有结果按照置信度递减的顺序排列，取前L个答案构成针对查询q的全局目标候选列表T0；S33、利用置信度过滤器过滤掉全局目标候选列表T0中质量不优的答案，得到全局目标列表T1；S34、基于全局目标列表T1，通过加权平均计算全局目标嵌入表示e
gt
。4.根据权利要求4所述的基于强化状态建模的知识图谱多跳推理方法，其特征在于，所述步骤S34中计算全局目标嵌入表示e
gt
的公式为：其中，e
gt
表示全局目标嵌入表示，N表示全局目标列表中的目标数量，e
i
表示第i个嵌入模型的答案实体的嵌入表示，p
i
表示由第i个嵌入模型输出的该实体对应的置信度。5.根据权利要求1所述的基于强化状态建模的知识图谱多跳推理方法，其特征在于，所述步骤S4具体步骤为：S41、根据全局目标嵌入表示e
gt
，定义代理进行到第t个时间步时的状态；S42、根据知识图谱定义行动空间，并基于行动空间进行代理；S43、选取长短期记忆网络LSTM和全连接网络分别作为记忆网络和策略网络；S44、在第t个时间步，由代理将状态输入至策略网络，并执行某个行动；S45、在代理执行某个行动后，将代理移动到与这个行动连接的实体节点；
S46、定义代理的奖励值，完成学习状态模型的构建。6.根据权利要求5所述的基于强化状态建模的知识图谱多跳推理方法，其特征在于，所述步骤S41中定义代理进行到第t个时间步时的状态的表达式为：s
t
＝(e
t
,h
t
,(e
s
,r
q
,e
gt
))其中，s
t
表示强化学习模型在第t个时间步下的状态，e
t
表示在第t个时间步时代理在知识图谱上的位置，h
t
表示在第t个时间步中代理经过长短期神经网络得到的历史决策信息，e
s
表示查询中的头实体，...

【专利技术属性】
技术研发人员：张栗粽，田玲，郑旭，尹晓宇，黄嘉豪，杨筠，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人