【技术实现步骤摘要】
本专利技术属于神经网络和数据挖掘,具体说是一种通过基于属性嵌入和图注意力网络的实体对齐对软件园知识图谱进行融合的方法。
技术介绍
1、随着互联网的发展,国内的软件园数量不断增加,使用知识图谱技术可以更直观地展示软件园的各项发展数据。但由于软件园信息种类繁多且数据类型多样化,需要利用知识融合去解决软件园知识图谱的异构性问题,实体对齐是知识融合的一种重要手段。
2、早期的实体对齐方法通常需要人工参与或依赖于他人构建的外部信息,这使得效率大大降低。最近的研究提出了一些崭新的实体对齐方法来减少人工参与,即知识图谱嵌入模型,可以有效地利用知识图谱中的结构信息来预测缺失的实体或关系,但基于嵌入的模型无法学习良好的表示来对非英语知识图谱的结构进行建模,因为对实体的约束相对不足,所以对齐结果较差。基于图的方法是当前实体对齐的一种主流方法,但对结构差异很敏感,很难缩小对齐的差异。因此本文模型使用引入注意力机制的gat网络,改善了基于图的方法的缺点,并融合属性信息,有效减轻了异构知识图谱的负面影响,成功地提高了实体对齐的效果。
【技术保护点】
1.一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于:所述网络信息为包含单位的政策信息、企业信息、所获荣誉、特色项目、举办活动、地理位置的文本信息。
3.根据权利要求1所述的一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于:所述对收集的网络信息进行处理,具体如下:
4.根据权利要求1所述的一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于:所述对文本数据集进行预训练词嵌入,生成向量矩阵,具体为:将文本数据集中的关系
...【技术特征摘要】
1.一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于:所述网络信息为包含单位的政策信息、企业信息、所获荣誉、特色项目、举办活动、地理位置的文本信息。
3.根据权利要求1所述的一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于:所述对收集的网络信息进行处理,具体如下:
4.根据权利要求1所述的一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于:所述对文本数据集进行预训练词嵌入,生成向量矩阵,具体为:将文本数据集中的关系三元组和属性三元组分别表示成向量,生成关系向量矩阵和属性向量矩阵,即两个待对齐的知识图;将三元组抽象成图结构,实体表征为图中的节点,关系表征为连接节点的边。
5.根据权利要求1所述的一种基于属性嵌入和图注意力网络的实体对齐方法,其特征在于:所述利用图注意力网络gat作为编码器,对实体进行结构嵌入,包括以下步骤:
6.根据...
【专利技术属性】
技术研发人员:王宁,周晓磊,步格格,苏谟,范秋枫,刘凡力,黄迪,
申请(专利权)人:中国科学院沈阳计算技术研究所有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。