一种基于属性嵌入和图注意力网络的实体对齐方法技术

技术编号:40081200 阅读:25 留言:0更新日期:2024-01-23 14:45
本发明专利技术涉及一种基于属性嵌入和图注意力网络的实体对齐方法,获取网络信息;对收集的网络信息进行处理,生成文本数据集;对文本数据集进行预训练词嵌入,生成向量矩阵;利用图注意力网络GAT作为编码器,对实体进行结构嵌入;构建属性信息编码器,从初始特征开始选择性地向目标实体聚合属性和属性值的特征,完成属性嵌入;结合结构嵌入和属性嵌入,生成实体对齐模型;对实体对齐模型进行训练,将训练好的模型作为最终的实体对齐模型;将实时获取的网络信息输入最终的实体对齐模型,输出对齐后的实体对集合。本发明专利技术解决了以往方法通常依赖于图的结构信息,结合属性信息进行嵌入,将实体对齐的准确率大大提高。

【技术实现步骤摘要】

本专利技术属于神经网络和数据挖掘,具体说是一种通过基于属性嵌入和图注意力网络的实体对齐对软件园知识图谱进行融合的方法。


技术介绍

1、随着互联网的发展,国内的软件园数量不断增加,使用知识图谱技术可以更直观地展示软件园的各项发展数据。但由于软件园信息种类繁多且数据类型多样化,需要利用知识融合去解决软件园知识图谱的异构性问题,实体对齐是知识融合的一种重要手段。

2、早期的实体对齐方法通常需要人工参与或依赖于他人构建的外部信息,这使得效率大大降低。最近的研究提出了一些崭新的实体对齐方法来减少人工参与,即知识图谱嵌入模型,可以有效地利用知识图谱中的结构信息来预测缺失的实体或关系,但基于嵌入的模型无法学习良好的表示来对非英语知识图谱的结构进行建模,因为对实体的约束相对不足,所以对齐结果较差。基于图的方法是当前实体对齐的一种主流方法,但对结构差异很敏感,很难缩小对齐的差异。因此本文模型使用引入注意力机制的gat网络,改善了基于图的方法的缺点,并融合属性信息,有效减轻了异构知识图谱的负面影响,成功地提高了实体对齐的效果。


技术实现本文档来自技高网...

【技术保护点】

1.一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于:所述网络信息为包含单位的政策信息、企业信息、所获荣誉、特色项目、举办活动、地理位置的文本信息。

3.根据权利要求1所述的一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于:所述对收集的网络信息进行处理,具体如下:

4.根据权利要求1所述的一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于:所述对文本数据集进行预训练词嵌入,生成向量矩阵,具体为:将文本数据集中的关系三元组和属性三元组分...

【技术特征摘要】

1.一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于:所述网络信息为包含单位的政策信息、企业信息、所获荣誉、特色项目、举办活动、地理位置的文本信息。

3.根据权利要求1所述的一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于:所述对收集的网络信息进行处理,具体如下:

4.根据权利要求1所述的一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于:所述对文本数据集进行预训练词嵌入,生成向量矩阵,具体为:将文本数据集中的关系三元组和属性三元组分别表示成向量,生成关系向量矩阵和属性向量矩阵,即两个待对齐的知识图;将三元组抽象成图结构,实体表征为图中的节点,关系表征为连接节点的边。

5.根据权利要求1所述的一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于:所述利用图注意力网络gat作为编码器,对实体进行结构嵌入,包括以下步骤:

6.根据...

【专利技术属性】
技术研发人员:王宁周晓磊步格格苏谟范秋枫刘凡力黄迪
申请(专利权)人:中国科学院沈阳计算技术研究所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1