基于潜在高阶信息的知识图谱尾实体预测方法技术

技术编号：41311337 阅读：4 留言：0更新日期：2024-05-13 14:54

一种基于潜在高阶信息的知识图谱尾实体预测方法，由数据预处理、聚合高阶信息、确定历史路径有效性、确定奖励函数、构建并优化策略网络步骤组成。本发明专利技术采用了聚合高阶信息的状态信息，具有更丰富的语义表达能力，能够帮助模型在预测过程中区分动作空间中每个动作的微妙差异，提升了预测准确性。确定历史路径有效性，并根据历史路径有效性改进奖励函数，缓解了虚假证据路径对模型可解释性和泛化能力的损害。本发明专利技术具有预测准确率高、预测解释性好等优点，可用于增强知识图谱的问答系统、推荐系统、文本分类、情感分析。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于知识图谱，具体地涉及到知识图谱尾实体。

技术介绍

1、知识图谱kg以图的形式表示了关于现实世界中实体和关系的结构知识。在知识图谱kg中用边表示关系，用节点表示实体，通过关系连接两个实体，表示一个三元组事实(头实体，关系，尾实体)。知识图谱kg支持多种查询回答、对话生成、机器阅读理解、信息检索、层推荐系统等。虽然知识图谱kg应用广泛，但是现实世界中许多知识图谱kg仍然面临着严重的不完整性问题，即缺少了大量的三元组事实。知识图谱kg补全，是指利用知识图谱kg中存在的知识(三元组事实)获得新知识(新三元组事实)的过程，是解决知识图谱kg不完整性的重要方法。而尾实体预测是知识图谱kg补全的一个重要问题，知识图谱kg中的尾实体预测是指给定一个头实体和关系，预测与该头实体以指定关系相连的尾实体，在知识图谱kg中非常重要，因为它可以帮助发现新的实体关系、填补知识图谱kg中的缺失信息，提高知识图谱kg的完整性和丰富性。考虑到人工智能的应用和推广，未来通用人工智能发展将会呈现出更加可信和可解释的趋势，即能够清晰地向人类解释其决策过程和依据，使人们能够理解智能体的决策逻辑和原因。

2、现有的知识图谱kg补全方法，在预测尾实体时往往缺乏可解释性，然而，利用基于强化学习的方法预测尾实体，因其可解释性成为了众多研究者关注的热点。

3、目前常见的几种尾实体预测方法主要分为三类，即基于知识图谱kg嵌入方法、基于逻辑规则方法、基于强化学习方法。基于知识图谱kg嵌入方法，将实体和关系的语义特征映射到向量空间，在表达实体和关系

技术实现思路

1、本专利技术所要解决的技术问题在于克服上述现有技术的缺点，提供一种预测精度高，预测准确率高、预测解释性好、能够缓解虚假路径问题的基于潜在高阶信息的知识图谱尾实体预测方法。

2、解决上述问题所采用的技术方案由下述步骤组成：

3、(1)数据预处理

4、1)构建知识图谱

5、从数据集fb15k-237-10中选取所有的事实三元组，事实三元组包括头实体、关系、尾实体，所有头实体和尾实体作为节点，所有的关系作为边，连接头实体和尾实体，构成知识图谱kg。

6、2)确定状态信息

7、按式(1)确定历史路径信息ht:

8、ht＝lstm(ht-1,at) (1)

9、at＝(rt,et)

10、其中，ht-1表示前t-1个动作确定的历史路径信息，at表示第t次选择的动作，rt是与节点et相连的边，t表示知识图谱搜索路径所包含的动作数，t取值为[1,3]，lstm为长短时记忆网络，r1表示起始边，e1表示起始节点。

11、按式(2)确定状态信息st：

12、st＝(et,ht,q) (2)

13、其中，et表示第t个动作选择后所到达的节点，q为全局查询关系。

14、(2)聚合高阶信息

15、按式(3)聚合高阶信息得到et'：

16、

17、

18、cti＝relu(w1×st)×ki

19、ctn＝relu(w1×st)×kn

20、其中，et'表示节点et聚合高阶信息后的节点，j表示与节点et相连边的数量，取值范围为有限正整数，w1和w2是两个全连接网络，exp为以自然常数e为底的指数函数，relu为激活函数，ki是节点et的第i条连边，kn是节点et的第n条连边。

21、按式(3)聚合高阶信息得到状态信息st'：

22、s′t＝(e′t，ht，q)

23、(3)确定历史路径有效性

24、1)构建历史路径

25、按式(4)构建历史路径p：

26、p＝(a0(r0,e0),a1(r1,e1),a2(r2,e2),...,at(rt,et)) (4)

27、2)确定可替换路径

28、按式(5)确定可替换节点的得分

29、

30、其中，为可替换节点，m是替换路径的数量，m取值为有限的正整数，et-1为上一个动作包含的节点，为conve模型预测事实的得分函数；取中最大的t个节点构成可替换节点列表

31、

32、按式(6)生成可替换路径pr：

33、

34、

35、3)确定历史路径的有效性

36、按式(7)确定路径的有效性rr(pr)：

37、

38、

39、其中，为conve模型预测事实的得分函数，e0是三元组的知识图谱头实体，是三元组的知识图谱尾实体。

40、(4)确定奖励函数

41、按式(8)确定奖励函数

42、

43、

44、其中，α、β为超参数，α、β的取值为[0，1]，且α+β＝1。

45、(5)构建并优化策略网络

46、所述的策略网络由高阶信息聚合器与动作序列预测器串联构成。

47、所述的高阶信息聚合器由全连接层1与relu激活函数层1、全连接层2依次串联构成。

48、所述的动作序列预测器由全连接层3与relu激活函数层2、全连接层4、softmax层依次串联构成。

49、策略网络的构建方法如下：

50、按式(9)构建策略网络πθ(at,s't)：

51、πθ(at,s't)＝σ(at×w4×relu(w3×[ht||e't||q])) (9)

52、其中，σ是softmax操作，at是第t个动作的动作空间，w3和w4是两个全连接网络，relu是激活函数，||是拼接向量操作，πθ(at,s't)的每一个分量表示每一个执行动作被选中的概率，根据这一个概率采样选择下一个动作。

53、按式(10)，通过随机梯度下降方法，对策略网络进行优化，得到知识图谱尾实体的预测评分

54、

55、其中，t表示路径信息的个数，t取值为[1,3]，θ为优化的参数，取值范围为实数，st'为聚合了高阶信息后的状态信息，rs'为改进后的奖励函数。

56、按式(11)预测出知识图谱尾实体

57、

58、其中，是确定使得达到最大的的值。

59、在本专利技术的步骤(3)的式(5)中，所述的为可替换节点，m是替换路径的数量，m取值为[100,150]。

60本文档来自技高网...

【技术保护点】

1.一种基于潜在高阶信息的知识图谱尾实体预测方法，其特征在于由下述步骤组成：

2.根据权利要求1所述的基于潜在高阶信息的知识图谱尾实体预测方法，其特征在于：在步骤(3)的式(5)中，所述的为可替换节点，m是替换路径的数量，m取值为[100,150]。

3.根据权利要求1或2所述的基于潜在高阶信息的知识图谱尾实体预测方法，其特征在于：在步骤(3)的式(5)中，所述的为可替换节点，m是替换路径的数量，m取值为125。

4.根据权利要求1所述的基于潜在高阶信息的知识图谱尾实体预测方法，其特征在于：在步骤(4)的式(8)中，所述的α、β为超参数，α取值为0.1，β取值为0.9，且α+β＝1。

5.根据权利要求1所述的基于潜在高阶信息的知识图谱尾实体预测方法，其特征在于：在步骤(1)的式(5)中，所述的ht-1表示前t-1个动作确定的历史路径信息，at表示第t次选择的动作，rt是与节点et相连的边，t表示知识图谱搜索路径所包含的动作数，t取值为2。

【技术特征摘要】

1.一种基于潜在高阶信息的知识图谱尾实体预测方法，其特征在于由下述步骤组成：

<...

【专利技术属性】
技术研发人员：陈建芮，孙聪聪，邵仲世，郝飞，雷鸣，吴迪，王志慧，陈德光，
申请(专利权)人：陕西师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人