基于图神经网络的知识图谱对齐模型的训练方法技术

技术编号:31498905 阅读:82 留言:0更新日期:2021-12-18 12:45
本公开的实施例提供了一种基于图神经网络的知识图谱对齐模型的训练方法、对齐方法。该方法包括获取训练样本,训练样本包括知识图谱及知识图谱中实体对应的标识,其中,知识图谱包括实体信息、边类型信息、边属性信息;基于预设的关系图神经网络模型,得到知识图谱中所包括的实体的特征向量;根据实体对应的标识,计算同一标识下多个实体的特征向量的差值,根据差值对关系图神经网络模型进行训练,得到知识图谱对齐模型,以用于实体对齐。以此方式,可以使得到的知识图谱对齐模型考虑知识图谱上除边类型信息和实体信息之外的其他重要信息,使得实体对齐效果较好。使得实体对齐效果较好。使得实体对齐效果较好。

【技术实现步骤摘要】
基于图神经网络的知识图谱对齐模型的训练方法


[0001]本公开属于知识图谱融合领域,尤其设计基于图神经网络模型的实体对齐领域。

技术介绍

[0002]实体对齐是知识图谱构建中的一项重要技术,也是近年来研究热点之一。实体对齐是指对异构数据源构成的知识图谱中,找出表述不同,但对应现实世界中同一实体的关系,通过实体对齐,可以将互相隔离的,不同来源的数据汇总融合,构成包含信息更为丰富的新知识库。
[0003]但是在现有的实体对齐方法中,对齐的效果比较差。

技术实现思路

[0004]本公开提供了一种基于图神经网络的知识图谱对齐模型的训练方法、对齐方法、装置、设备以及存储介质。
[0005]根据本公开的第一方面,提供了一种基于图神经网络的知识图谱对齐模型的训练方法,该方法包括:获取训练样本,训练样本包括知识图谱及知识图谱中实体对应的标识,其中,知识图谱包括实体信息、边类型信息、边属性信息;基于预设的关系图神经网络模型,得到知识图谱中所包括的实体的特征向量;根据实体对应的标识,计算同一标识下多个实体的特征向量的差值,根据差值对本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络的知识图谱对齐模型的训练方法,其特征在于,所述方法包括:获取训练样本,所述训练样本包括知识图谱及知识图谱中实体对应的标识,其中,所述知识图谱包括实体信息、边类型信息、边属性信息;基于预设的关系图神经网络模型,得到所述知识图谱中所包括的实体的特征向量;根据所述实体对应的标识,计算同一标识下多个实体的特征向量的差值,根据所述差值对所述关系图神经网络模型进行训练,得到知识图谱对齐模型;其中,所述基于预设的关系图神经网络模型,得到所述知识图谱中所包括的实体的特征向量,包括:基于预设的关系图神经网络模型,根据所述实体信息、边类型信息以及边属性信息,将所述知识图谱拆解为多个子图集合;对多个子图集合中的每个子图对应的边类型信息以及边属性信息进行卷积,得到多个实体的特征向量;其中,一个子图集合属于同一实体,一个子图集合中的每个子图对应一个实体的至少一种边类型信息以及至少一种边属性信息。2.根据权利要求1所述的方法,其特征在于,对多个子图集合中的每个子图对应的边类型信息以及边属性信息进行卷积,得到多个实体的特征向量,包括:对多个子图集合中的每个子图对应的边类型信息以及边属性信息进行卷积,得到每个子图集合中每个子图对应的实体的特征向量;对每个子图集合中每个子图对应的实体的特征向量进行聚合,得到多个实体的特征向量。3.根据权利要求2所述的方法,其特征在于,所述对多个子图集合中的每个子图对应的边类型信息以及边属性信息进行卷积,得到每个子图集合中每个子图对应的实体的特征向量,满足公式:其中,表示所述关系图神经网络模型第层的节点的特征向量,表示非线性激活函数,是归一化因子,R表示边类型信息,表示所述关系图神经网络模型第l层对于边类型为r的子图需要学习的参数,表示所述关系图神经网络模型的隐藏层l的节点的特征向量,表示第l层对于边类型为r的子图对应的需要学习的边上的属性参数,表示隐藏层l的节点j连接边的属性向量,表示为了保留节点自身的信息设置的权值参数,表示隐藏层l的节点j的特征向量。4.根据权利要求1所述的方法,其特征在于,所述根据所述实体对应的标识,计算同一标识下多个实体的特征向量的差值,根据所述差值对所述关系图神经网络模型进行训练,得到知识图谱对齐模型,包括:根据实体对应的标识,计算同一标识下多个实体的特征向量的差值;
根据所述差值更新所述关系图神经网络模型中的参数;当更新参数后的关系图神经网络模型计算同一标识的多个实体的特征向量的差值小于第一预设阈值,且不同标识对应的实体之间的特征向量的差值大于第二预设阈值时,基于更新参数后的关系图神经网络模型得到知识图谱对齐模型。5.根据权利要求1所述的方法,其特征在于,在所述边类型信息为大于预设维度的高维向量的情况下,所述基于预设的关系图神经网络模型,根据所述实体信息、边类型信息以及边属性信息,将所述知识图谱拆解为多个子图集合,包括:基于预设的关系图神经网络模型,根据所述实体信息...

【专利技术属性】
技术研发人员:刘禹汐姜青涛侯立旺马荣宋建强
申请(专利权)人:北京道达天际科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1