【技术实现步骤摘要】
一种基于异构图注意力网络的实体对齐方法
[0001]本专利技术属于知识融合领域,具体地涉及实体对齐相关的基于异构图注意力网络的实体对齐方法。
技术介绍
[0002]随着知识库规模的扩大和实体数量的增加,不同知识库之间的实体链接的重要性日益凸显,多知识图谱的实体对齐成为研究的热点方向。
[0003]目前的实体对齐相关技术与方法来源于数据库中的实体匹配,但是,在实际应用中,存在许多问题和挑战,其中最突出的是计算复杂度、数据对齐质量的问题。在大数据条件下,知识库数据量庞大繁杂,传统的实体对齐算法时间复杂度高,实体对齐精度不足。
技术实现思路
[0004]专利技术目的:为了克服现有技术中存在的不足,本专利技术提供一种时间复杂度低、实体对齐精度高的基于异构图注意力网络的实体对齐方法。
[0005]技术方案:为实现上述目的,本专利技术采用的技术方案为:一种基于异构图注意力网络的实体对齐方法,包括以下步骤:步骤1,基于BERT预训练实体名称得到的词向量,根据词向量计算得到实体语义名称向量,并根据得到的实体语 ...
【技术保护点】
【技术特征摘要】
1.一种基于异构图注意力网络的实体对齐方法,其特征在于,包括以下步骤:步骤1,基于BERT预训练实体名称得到的词向量,根据词向量计算得到实体语义名称向量,并根据得到的实体语义名称向量进行聚类,将实体划分为类,得到实体类别信息;步骤2,根据步骤1得到的实体语义名称向量和实体类别信息采用异构图注意力网络聚合不同类别的邻居信息,学习更新实体嵌入向量;基于异构图注意力网络聚合邻居实体的信息以学习实体嵌入向量,实体嵌入向量更新公式为:其中,为非线性激活函数,表示类型相关的邻接矩阵,其每一行表示一种实体,每一列表示一个类型为的邻居实体,表示所有实体在神经网络第层的嵌入向量矩阵,表示类型为的邻居实体在神经网络第层的嵌入向量矩阵,是类型实体的特征变换矩阵;将实体嵌入向量更新公式分解为节点级注意力和类型级注意力,实体嵌入向量更新公式由节点级注意力和类型级注意力结合更新得到,将类型相关的注意力权重矩阵作为类型相关的邻接矩阵,其行列的元素即为实体与类型为的邻居的节点级注意力权重;采用损失函数训练异构图注意力网络,通过最小化已知对齐实体的嵌入向量距离得到最佳的实体表示向量;损失函数为:其中,表示异构图注意力网络的损失函数,表示分属于知识图谱一和知识图谱二的一对等价实体,表示知识图谱一中的一个实体,表示知识图谱二中的一个实体,表示一组等价实体对,表示知识图谱二中的一个实体二,表示一组不等价的实体对,表示两个向量之间的欧式距离,表示已知的对齐种子集合,表示负样本集合,在每一轮迭代之前,通过选取知识图谱二中
与知识图谱二中的一个实体的嵌入向量距离最小的实体与知识图谱一中的一个实体结合形成本轮训练的负样本, 表示一个正的阈值,表示函数;步骤3,基于实体对嵌入向量的距离计算不同实体类别之间的相似性,结合嵌入向量相似性得到实体对之间的相似性;实体,实体表示知识图谱一中的实体类别一,表示知识图谱二中的实体类别二,实体类别一包含的所有实体的嵌入向量为,表示类别一的实体数量,实体类别二包含的所有实体的嵌入向量为,表示类别二的实体数量,基于所含实体的成对嵌入向量之间的距离得到实体类别一和实体类别二之间的相似性:其中,表示实体类别一和实体类别二之间的相似性,为正数;结合实体所属类别之间的相似性,实体与实体之间的相似性为:其中, 表示实体与实体之间的相似性,为常数;根据实体与实体之间的相似性得到两知识图谱实体相似性矩阵;步骤4,结合两知识图谱实体相似性矩阵,基于0
‑
1整数规划识别等价实体对,得到实体对齐结果;将等价实体对的识别问题建模为0
...
【专利技术属性】
技术研发人员:王晓,杨林瑶,程振荣,辛柯俊,王飞跃,
申请(专利权)人:南京樯图数据研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。