System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于图神经网络的知识图谱补全方法技术_技高网
当前位置: 首页 > 专利查询>三峡大学专利>正文

一种基于图神经网络的知识图谱补全方法技术

技术编号:41277261 阅读:6 留言:0更新日期:2024-05-11 09:29
一种基于图神经网络的知识图谱补全方法,包括:Step1、收集知识图谱数据集;Step2、获取初始表征;Step3、构建图神经网络,将实体从三种邻域进行聚合;Step4、在三种邻域聚合过程引入注意力衰减机制;Step5、使用多头注意力机制对三种邻域聚合信息进行更新然后与中心实体嵌入相加,得到最终实体嵌入;Step6、使用ConvE模型作为解码器,计算三元组的得分;Step7、重复step2‑step6对模型效果进行优化。使用图神经网络对知识图谱进行补全,将邻域信息分为实体邻域,关系邻域以及组合邻域,充分利用了实体的邻域信息,同时考虑不同距离邻居的影响力,在图神经网络中引入注意力衰减机制,对于给定的中心实体,邻域中关系和实体的影响力随着距离的增加而减弱。

【技术实现步骤摘要】

本专利技术涉及知识图谱,具体涉及一种基于图神经网络的知识图谱补全方法


技术介绍

1、知识图谱是一种基于图的数据结构,由节点和边组成,节点表示实体,边表示两个实体之间的关系。真实世界中实体和关系以三元组的形式建模,其被表示为(h,r,t),其中h和t对应头部和尾部实体,r表示头尾实体之间的关系。随着大数据的不断发展,如何从海量的数据中提炼出有价值的知识,是大数据分析的关键。知识图谱技术提供了一种从海量数据中提取结构化知识的手段,是推动人工智能发展的核心驱动力,拥有着广阔的应用前景。

2、目前,针对知识图谱的研究还处于探索阶段,现有的知识图谱技术普遍存在效率低、限制多、拓展性差等问题。而在构建知识图谱过程中,知识图谱补全作为其中一种扩充实体及关系数据的重要手段,往往起到了决定知识图谱最终完成度的作用。目前构建知识图谱往往依赖人工或半自动方式,因此存在三元组缺失和噪音等现象和其他技术原因,得到的大多数知识图谱往往不完整或者可能存在一些错误。因此,需要进行知识图谱补全,即预测不完整三元组中的缺失值。基于图神经网络的模型克服了传统神经网络在处理知识图谱的局限性,能够更好地处理图结构的数据,并在知识图谱中的推理和补全任务中取得了良好的性能。


技术实现思路

1、本专利技术所要解决的技术问题是提供一种基于图神经网络的知识图谱补全方法,模型采用编码器-解码器结构,使用图神经网络作为编码器,将实体的邻域分为实体邻域、关系邻域以及组合邻域,在三种邻域中融入注意力衰减机制,并使用多头注意力机制对三种邻域进行聚合,充分利用实体的多跳邻域信息,使用conve作为模型解码器,获取候选三元组得分,验证三元组合理性。

2、为解决上述技术问题,本专利技术所采用的技术方案是:

3、一种基于图神经网络的知识图谱补全方法,包括:

4、step1、收集知识图谱数据集;

5、step2、获取知识图谱数据集中实体节点和关系嵌入的初始表征;

6、step3、将邻域分为实体邻域、关系邻域以及组合邻域,通过图神经网络将实体从三种邻域进行聚合;

7、step4、在三种邻域聚合过程引入注意力衰减机制;

8、step5、为使模型关注不同维度语义空间的信息,使用多头注意力机制对三种邻域聚合信息进行更新然后与中心实体嵌入相加,得到最终实体嵌入;

9、step6、使用conve模型作为解码器,计算三元组的得分;

10、step7、通过梯度下降方法最小化损失函数训练模型参数,重复step2~step6对模型效果进行优化。

11、上述的step2中还包括获取知识图谱中实体节点和关系节点的初始表征。

12、上述的step3具体步骤为:

13、step3.1、构建图神经网络,将实体从实体邻域,关系邻域以及组合邻域进行聚合;

14、step3.2、关系邻域:通过聚合所有连接的关系,可以得到实体邻域的向量表示,公式如下:

15、

16、其中,srel表示实体ei的关系邻域,其中n为嵌入维度,rj是关系rj的嵌入,j∈ni,ni为节点i的邻居节点的集合,wrel是关系层级的线性变换矩阵,σ是非线性的激活函数;

17、step3.3、实体邻域:描述中心实体与其相邻实体的关系,通过聚合中心实体的相邻实体,得到实体邻域向量表示,公式如下:

18、

19、其中,sent表示实体ei的实体邻域;

20、step3.4、组合邻域:既考虑邻居实体,又考虑邻居关系,通过聚合中心实体连接的实体和关系,得到组合邻域的向量表示,公式如下:

21、

22、组合邻域聚合的过程中,设置了两种节点和关系的表征方式,分别是减法和点乘形式,公式如下:

23、φsub(ej,rj)=ej-rj

24、φmult(ej,rj)=ej*rj。

25、上述的step4具体步骤为:

26、step4.1、定义注意力衰减系数ηx,计算方式如下:

27、ηx=η0θx-1

28、其中,η0为初始的距离感知系数,默认为1,x表示与中心实体相距x

29、跳,θ是一个介于0和1之间的超参数;

30、step4.2、引入注意力衰减机制,实体的关系邻域,实体邻域以及组合邻域的表示公式如下:

31、

32、

33、

34、上述的step5具体步骤为:

35、step5.1、采用相互独立的多头注意力机制对节点邻域信息的向量进行更新,公式如下:

36、

37、

38、

39、step5.2、将三个邻域嵌入与中心实体嵌入合并,得到最终的向量表示:

40、ei′=ei+srel+sent+stri。

41、上述的step6具体步骤为:

42、step6.1、使用conve作为该模型的解码器;conve通过卷积层和全连接层对输入实体和关系之间的交互进行建模;给定(h,r,t)三元组,conve首先将h和r的嵌入重塑为2d张量,然后根据重塑后的张量计算三元组的分数;conve的评分函数公式如下:

43、p(h,r,t)=relu(vec(relu([h;r]*w))q)t

44、其中,w表示一组滤波器,*表示卷积算子,vec(.)是向量化函数,并且q是权重矩阵;

45、step6.2、图神经网络的损失函数如公式如下:

46、

47、其中,pi是三元组得分,ti是三元组标签,n表示尾实体的候选者数量,g表示sigmoid函数。

48、本专利技术提供的一种基于图神经网络的知识图谱补全方法,使用图神经网络对知识图谱进行补全,将邻域信息分为实体邻域,关系邻域以及组合邻域,充分利用了实体的邻域信息,同时考虑不同距离邻居的影响力,在图神经网络中引入注意力衰减机制,对于给定的中心实体,邻域中关系和实体的影响力随着距离的增加而减弱。

本文档来自技高网...

【技术保护点】

1.一种基于图神经网络的知识图谱补全方法,其特征在于,包括:

2.根据权利要求1所述的一种基于图神经网络的知识图谱补全方法,其特征在于,所述的Step2中还包括获取知识图谱中实体节点和关系节点的初始表征。

3.根据权利要求2所述的一种基于图神经网络的知识图谱补全方法,其特征在于,所述的Step3具体步骤为:

4.根据权利要求3所述的一种基于图神经网络的知识图谱补全方法,其特征在于,所述的Step4具体步骤为:

5.根据权利要求4所述的一种基于图神经网络的知识图谱补全方法,其特征在于,所述的Step5具体步骤为:

6.根据权利要求5所述的一种基于图神经网络的知识图谱补全方法,其特征在于,所述的Step6具体步骤为:

【技术特征摘要】

1.一种基于图神经网络的知识图谱补全方法,其特征在于,包括:

2.根据权利要求1所述的一种基于图神经网络的知识图谱补全方法,其特征在于,所述的step2中还包括获取知识图谱中实体节点和关系节点的初始表征。

3.根据权利要求2所述的一种基于图神经网络的知识图谱补全方法,其特征在于,所述的step3具体步骤为:

...

【专利技术属性】
技术研发人员:吴义熔李思慧李小龙孙水发唐庭龙
申请(专利权)人:三峡大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1