一种层次实体邻居多关系融合的知识图谱补全方法技术

技术编号：44492046 阅读：10 留言：0更新日期：2025-03-04 17:57

本发明专利技术公开了一种层次实体邻居多关系融合的知识图谱补全方法，具体步骤包括：划分知识图谱，将知识图谱三元组中的头实体作为中心实体，将尾实体作为邻居实体，并构建同构子图；其中，所述知识图谱三元组还包括：关系；对中心实体和邻居实体进行聚合处理，完成中心实体、邻居实体的聚合；将关系融合入中心实体中，完成实体邻接关系的融合；根据融合实体和关系信息的嵌入向量，通过多头自注意力机制，计算多头自注意力的输出矩阵；利用前馈神经网络获得编码器的输出矩阵；通过负采样获得损失函数并优化，计算损失函数的最小值，完成知识图谱的补全。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种人工智能领域，具体涉及一种层次实体邻居多关系融合的知识图谱补全方法。

技术介绍

1、知识图谱(knowledge graph)是一种采用结构化的事实表达方式，将现实世界中的事实用两个实体以及其之间的关系组成的三元组来表示。随着知识图谱的规模不断扩大，知识图谱将越来越趋于不完整，存在大量缺失的、隐藏的事实。知识图谱补全旨在寻找知识图谱中缺失的部分，挖掘出其中隐藏的实体及其之间的关系，从而使知识图谱蕴含的信息更加丰富完整。

2、现有的知识图谱补全模型在链接预测中更注重实体间的关系建模，而忽视了实体与其关系表示之间的深度交互，无法充分捕捉关系在知识图谱中的关键作用，存在处理实体与关系的深度融合方面的不足。且现有的知识图谱补全模型在处理长路径依赖的复杂关系时，长路径的关系信息往往依赖复杂的语义；在处理跨越多跳实体时，往往无法有效提取远距离实体之间的深层次关系信息，导致在大规模知识图谱中，知识图谱补全模型对全局语义的感知能力受限，进而影响了知识图谱的整体预测效果。

技术实现思路

1、本专利技术的目的是提供一种层次实体邻居多关系融合的知识图谱补全方法，更好地实现实体与关系的交互，有效解决了现有模型在实体与关系深度融合上的不足，大幅提升了知识图谱补全模型的预测性能。

2、为了达到上述目的，本专利技术提供了一种层次实体邻居多关系融合的知识图谱补全方法，具体步骤包括：

3、步骤1，划分知识图谱，将知识图谱三元组中的头实体作为中心实体，将尾实体作为

4、步骤2，对中心实体和邻居实体进行聚合处理，获得邻居实体的自适应权重向量，并对邻居实体进行加权聚合，获得聚合后中心实体的邻居信息；基于聚合后中心实体的邻居信息、邻居实体的自适应权重向量和中心实体进行聚合，获得更新后中心实体的特征向量，完成中心实体、邻居实体的聚合；

5、步骤3，将关系融合入中心实体中，获得融合实体和关系信息的嵌入向量，完成实体邻接关系的融合；

6、步骤4，根据融合实体和关系信息的嵌入向量，通过多头自注意力机制，计算多头自注意力的输出矩阵；

7、步骤5，利用前馈神经网络获得编码器的输出矩阵；

8、步骤6，通过负采样获得损失函数并优化，计算损失函数的最小值，完成知识图谱的补全。

9、可选地，在步骤2中，分别对中心实体和邻居实体进行线性变换和缩放处理，获得中心实体、邻居实体经线性变换和缩放处理后的特征向量，可表示为:

10、h′v＝w1hv

11、

12、式中，h′v为中心实体经线性变换和缩放处理后的特征向量，h′i为邻居实体经线性变换和缩放处理后的特征向量，w1为线性变换的权重矩阵，d′i为归一化处理后的第i个邻居实体的度数信息；

13、通过聚合器对邻居实体经线性变换和缩放处理后的特征进行聚合，获得每个邻居实体的自适应权重向量，可表示为：

14、

15、式中，为利用第k个聚合器计算第i个邻居实体的自适应权重向量，w2为线性变换的权重矩阵，为利用第k个聚合器时的偏置的参数。

16、可选地，在步骤2中，通过聚合后的中心实体的邻居信息和每个邻居实体的自适应权重向量计算综合特征向量，可表示为：

17、

18、式中，zagg为中心实体和邻居实体聚合后的综合特征向量，z(k)为第k个聚合器对中心实体聚合后中心实体的邻居信息，αk为第k个聚合器后的邻居实体的自适应权重向量，k为聚合器的总数；

19、对综合特征向量和经线性变换和缩放变换的中心实体特征进行聚合，获得更新后中心实体的特征向量h″v，可表示为：

20、h″v＝σ(w3h′v+uzagg)

21、式中，w3为线性变换的权重矩阵，σ(·)为非线性激活函数，u为聚合后的邻居信息的权重矩阵；

22、基于中心实体对更新后中心实体的特征向量进行更新，直至更新后的中心实体的特征向量不再变化，可表示为：

23、

24、式中，为第t次迭代后更新的中心实体的特征向量；当t＝0时，为中心实体特征向量hv。

25、可选地，步骤3中，从同一中心实体对应的三元组中的关系提取关系信息，同时建立嵌入向量，可表示为：

26、r＝r0w4

27、式中，r为关系嵌入向量，且hr∈r；r0为初始化的嵌入向量，用于关系嵌入向量r的训练更新；w4∈rd×d为线性变换矩阵，其中，rd×d为一个d×d的实数矩阵空间；

28、将关系信息嵌入中心实体中，获得融合实体和关系信息的嵌入向量，可表示为：

29、

30、式中，hr为关系信息，为融合实体和关系信息的嵌入向量。

31、可选地，步骤4中，将融合实体和关系信息的嵌入向量输入编码器中，通过线性变换获得查询q、键k、值v，可表示为：

32、q＝hwq

33、k＝hwk

34、v＝hwv

35、式中，wq,wk和wv均为可学习的权重矩阵，h为所有融合实体和关系信息的嵌入向量组成的输入序列。

36、可选地，步骤4中，通过多头自注意力机制，将查询q、键k、值v进行多头分割，获得与邻居实体数量相同的头部注意力机制；计算每个头部注意力机制的得分矩阵，可表示为：

37、

38、式中，si为头部注意力机制的得分矩阵，n为邻居实体的数量，dk为多头自注意力每个头的维度，qi、ki分别为多头分割后的查询、键，kit为分割后的键ki的转置；

39、将每个头部注意力机制的得分矩阵与多头分割后的值相乘，获得每个头部注意力的输出矩阵；并将所有头部注意力的输出矩阵拼接在一起，得到完整的多头自注意力输出矩阵。

40、可选地，步骤5中，将多头自注意力的输出矩阵通过一个前馈神经网络进行处理，获得最终的编码器输出矩阵，可表示为：

41、e＝layernorm(z+ffn(z))

42、式中，e为编码器输出矩阵；z为多头自注意力的输出矩阵，laternorm()为一个归一化层；ffn为全连接前馈神经网络。

43、可选地，步骤6中，将知识图谱中的三元组分为正样本集合和负样本集合，所述负样本集合可表示为：

44、

45、式中，s′为负样本集合，e′i为负样本集合中中心实体的嵌入向量，r为关系的嵌入向量，ej为负样本集合中邻居实体的嵌入向量。

46、可选地，步骤6中，利用transe方法定义损失函数，并使用adam优化器对损失函数进行优化，所述优化后的损失函数可表示为：

47、

48、式中，为优化后的损失函数，为标签函数，s为正样本集合，s′为负样本集合，λ为正则化项的超参数，ti，j，k为知识图谱中的三元组，f(ti，j，k)为计算三元本文档来自技高网...

【技术保护点】

1.一种层次实体邻居多关系融合的知识图谱补全方法，其特征在于，具体步骤包括：

2.根据权利要求1所述的层次实体邻居多关系融合的知识图谱补全方法，其特征在于，在步骤2中，分别对中心实体和邻居实体进行线性变换和缩放处理，获得中心实体、邻居实体经线性变换和缩放处理后的特征向量，可表示为:

3.根据权利要求2所述的层次实体邻居多关系融合的知识图谱补全方法，其特征在于，在步骤2中，通过聚合后的中心实体的邻居信息和每个邻居实体的自适应权重向量计算综合特征向量，可表示为：

4.根据权利要求3所述的层次实体邻居多关系融合的知识图谱补全方法，其特征在于，步骤3中，从同一中心实体对应的三元组中的关系提取关系信息，同时建立嵌入向量，可表示为：

5.根据权利要求4所述的层次实体邻居多关系融合的知识图谱补全方法，其特征在于，步骤4中，将融合实体和关系信息的嵌入向量输入编码器中，通过线性变换获得查询Q、键K、值V，可表示为：

6.根据权利要求5所述的层次实体邻居多关系融合的知识图谱补全方法，其特征在于，步骤4中，通过多头自注意力机制，将查询Q、键K

7.根据权利要求6所述的层次实体邻居多关系融合的知识图谱补全方法，其特征在于，步骤5中，将多头自注意力的输出矩阵通过一个前馈神经网络进行处理，获得最终的编码器输出矩阵，可表示为：

8.根据权利要求1所述的层次实体邻居多关系融合的知识图谱补全方法，其特征在于，步骤6中，将知识图谱中的三元组分为正样本集合和负样本集合，所述负样本集合可表示为：

9.根据权利要求8所述的层次实体邻居多关系融合的知识图谱补全方法，其特征在于，步骤6中，利用TransE方法定义损失函数，并使用Adam优化器对损失函数进行优化，所述优化后的损失函数可表示为：

10.根据权利要求1所述的层次实体邻居多关系融合的知识图谱补全方法，其特征在于，步骤1中，利用中心实体、关系、邻居实体构建同构子图，将同一关系路径下的邻居实体划分在一起。

...

【技术特征摘要】

1.一种层次实体邻居多关系融合的知识图谱补全方法，其特征在于，具体步骤包括：

5.根据权利要求4所述的层次实体邻居多关系融合的知识图谱补全方法，其特征在于，步骤4中，将融合实体和关系信息的嵌入向量输入编码器中，通过线性变换获得查询q、键k、值v，可表示为：

6.根据权利要求5所述的层次实体邻居多关系融合的知识图谱补...

【专利技术属性】
技术研发人员：陈赟，周敏，王佳裕，谢邦鹏，沈浩，潘智俊，赵文恺，傅超然，王晓慧，杜海舟，曹渝昆，徐康乐，
申请(专利权)人：国网上海市电力公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人