一种基于图注意力机制的跨语言知识图谱链接预测方法技术

技术编号:33657272 阅读:45 留言:0更新日期:2022-06-02 20:37
一种基于图注意力机制的跨语言知识图谱链接预测方法,包括以下步骤:设置图注意力机制模块、知识模块、对齐模块、集成推理模块和链接预测模块;将跨语言知识图谱中各种类型实体和关系统一映射到向量空间中,通过局部级邻居节点注意力学到每个实体连接到邻居相关实体的权重;通过全局的注意力联合学习每个关系上的权重,根据权重融合不同邻居信息进行实体嵌入表示;计算损失同时进行端到端的优化。精确度高:对多图谱获取的数据信息进行融合,根据融合后的结果来进行对齐和预测,相较于采用单一图谱的预测,其精确度更高。有助于将世界范围内多国多民族具有个性化知识的知识图谱联系并融合起来,实现世界范围内的知识共享。实现世界范围内的知识共享。实现世界范围内的知识共享。

【技术实现步骤摘要】
一种基于图注意力机制的跨语言知识图谱链接预测方法


[0001]本专利技术涉及信息
,尤其涉及图谱预测方法,特别是一种基于图注意力机制的跨语言知识图谱链接预测方法。

技术介绍

[0002]构建web规模级的知识图谱(knowledge graphs,kg)与日俱增,知识图谱能够准确反映真实世界的事实,并能良好地表达概念、层次等抽象知识。近年来,知识图谱被应用于多个领域,并围绕其开展了大量的研究。知识图谱研究领域的愿景是构建一个结构化的知识库,服务于人工智能领域的方方面面。并用知识图谱解决实际问题如dbpedia,wikidata,freebase,yago和probase等广泛用于智能问答、智能搜索,以及知识推理、融合和补全等。
[0003]人们在知识图谱嵌入模型上投入了大量的精力,编码实体作为低维向量,并捕捉关系作为对实体向量的代数运算。这些模型为完成任务提供了有益工具,代表性模型包括平移模型,双线性模型。这些模型在预测实体都具有优秀表现能力。绝大多数知识图谱基于单一语言的数据源构建,由单一语言描述,并为单一语言的用户服务,跨语言知识图谱的研究尚处于起步阶段。由于不同语言在特定知识图谱的数据质量和覆盖范围上有各自的优势和限制,使用不同语言的人会在他们自己的语言中拥有不同的知识图谱,独立完成每个知识图谱融合可能不是最优的,由此跨语言图谱融合被越来越多人所研究。
[0004]知识图谱通常是不完整的,这是因为图谱的更新需要不断紧跟现实世界信息的步伐。因此,知识图谱融合是一个动机很强的问题,主要研究对知识图谱未知的真实事实的预测。但结合来自多个知识图谱的预测仍然是一个不小的技术挑战。一方面,由于缺乏连接不同知识图谱可靠对齐信息,另一方面,不同嵌入式之间的知识转移受到阻碍。

技术实现思路

[0005]本专利技术的目的在于提供一种基于图注意力机制的跨语言知识图谱链接预测方法,所述的这种基于图注意力机制的跨语言知识图谱链接预测方法要解决现有技术中单一图谱的预测精度低的技术问题。
[0006]本专利技术的一种基于图注意力机制的跨语言知识图谱链接预测方法,包括以下步骤:
[0007]步骤一:设置图注意力机制模块、知识模块、对齐模块、集成推理模块和链接预测模块;
[0008]图注意力机制模块用于实现跨语言图谱的词嵌入,学习各邻居信息的注意力权重,对各个节点进行加权平均,训练每个节点的词向量,为后续任务提供语义表示;
[0009]知识模块用于对跨语言图谱进行实体和关系嵌入,在统一的嵌入空间使用平移向量或者旋转向量对关系建模,表示每个特定语言知识图谱所描述事实的置信度;
[0010]对齐模块用于在多语言场景下,找到不同语言中的匹配实体对的任务;假设多个实体表征同一个对象,则在这些实体之间构建对齐关系,同时对实体包含的信息进行融合
和聚集;
[0011]集成推理模块用于对多个知识图谱进行事实预测,对跨语言图谱查询和知识转移的集成,主要是为了利用源知识图谱的知识,完成目标图谱预测的任务。集成推理模块通过在同一任务上组合多个模型来提高学习准确率;
[0012]链接预测模块用于在候选实体集合中通过打分函数寻找最高的候选排名,在尾实体预测问题中,在所有待选的实体集合中,选出评分最高的作为尾实体预测的结果;
[0013]将跨语言知识图谱中各种类型实体和关系统一映射到向量空间中,通过局部级邻居节点注意力学到每个实体连接到邻居相关实体的权重;
[0014]步骤二:通过全局的注意力联合学习每个关系上的权重,根据权重融合不同邻居信息进行实体嵌入表示;
[0015]步骤三:计算损失同时进行端到端的优化。
[0016]进一步的,通过TransE将关系转化为欧几里得空间中头实体和尾实之间的平移,其公式为:f
TransE
(h,r,t)=

||h+r

t||2;通过RotatE将关系建模为复杂空间中的旋转,认为尾实体是由头实体在复向量空间中通过关系进行旋转后派生出来的,其公式为:f
RotatE
(h,r,t)=

||h
°
r

t||2。
[0017]进一步的,在对齐过程中使用杰卡德相似度的方法判断多语言知识图谱中相同实体,利用种子监督的学习方法自适应学习实体对齐,通过训练不断增加种子实体,连接和融合不同语言的知识图谱,形成新的知识。
[0018]进一步的,利用源知识图谱的信息候选实体集辅助目标图谱从候选实体中挑选最高得分的实体作为预测最终结果。
[0019]进一步的,使用集成学习算法对跨语言图谱的目标图谱进行查询和转移,包括对目标图谱的语义信息使用对齐进行查询以及查询之后结果进行知识转移。
[0020]本专利技术与现有技术相比,其效果是积极和明显的。
[0021]1.精确度高:对多图谱获取的数据信息进行融合,根据融合后的结果来进行对齐和预测,相较于采用单一图谱的预测,其精确度更高。
[0022]2.利用多语言图谱中丰富的结构特征与实例特征,通过局部与全局注意力机制的相互作用,为每个实体和关系计算与它相关的不同邻居对其的影响即重要性程度。
[0023]3.有助于将世界范围内多国多民族具有个性化知识的知识图谱联系并融合起来,实现世界范围内的知识共享。有助于为跨语言知识服务提供便利,实现无障碍的跨语言信息检索与自然语言处理。
附图说明
[0024]图1为本专利技术的一种基于图注意力机制的跨语言知识图谱链接预测方法的步骤流程图。
[0025]图2为本专利技术的一种基于图注意力机制的跨语言知识图谱链接预测方法中的对齐过程示意图。
具体实施方式
[0026]以下结合附图和实施例对本专利技术作进一步描述,但本专利技术并不限制于本实施例,
凡是采用本专利技术的相似结构及其相似变化,均应列入本专利技术的保护范围。本专利技术中的上、下、前、后、左、右等方向的使用仅为了描述方便,并非对本专利技术的技术方案的限制。
[0027]实施例1
[0028]如图1和图2所示,本专利技术的一种基于图注意力机制的跨语言知识图谱链接预测方法,包括以下步骤:
[0029]步骤1:基于freebase下跨语言知识图谱数据集,包括五个不同语言数据集,其中包括实体集合,关系集合和每个图谱三元组集合作为图卷积输入;
[0030]步骤2:将多语言图谱中的实体和关系统一初始化映射到向量空间中,初始化关系向量和实体向量,对于向量的每个维度在内随机取一个值,k为低维向量的维数对所有的向量初始化之后要进行归一化对数据集中正样本(h,r,t)。其中h,t表示三元组头实体、尾实体,r表示头、尾之间的关系。通过随意替换尾实体构成负样本,联合构成训练数据集;
[0031]步骤3:输入f={h1,h2...h
n
},h
n
∈R,对这N个节点进行随机初始化得到每个节点的featu本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图注意力机制的跨语言知识图谱链接预测方法,其特征在于,包括以下步骤:步骤一:设置图注意力机制模块、知识模块、对齐模块、集成推理模块和链接预测模块;图注意力机制模块用于实现跨语言图谱的词嵌入,学习各邻居信息的注意力权重,对各个节点进行加权平均,训练每个节点的词向量,为后续任务提供语义表示;知识模块用于对跨语言图谱进行实体和关系嵌入,在统一的嵌入空间使用平移向量或者旋转向量对关系建模,表示每个特定语言知识图谱所描述事实的置信度;对齐模块用于在多语言场景下,找到不同语言中的匹配实体对的任务;假设多个实体表征同一个对象,则在这些实体之间构建对齐关系,同时对实体包含的信息进行融合和聚集;集成推理模块用于对多个知识图谱进行事实预测,对跨语言图谱查询和知识转移的集成,主要是为了利用源知识图谱的知识,完成目标图谱预测的任务;集成推理模块通过在同一任务上组合多个模型来提高学习准确率;链接预测模块用于在候选实体集合中通过打分函数寻找最高的候选排名,在尾实体预测问题中,在所有待选的实体集合中,选出评分最高的作为尾实体预测的结果;将跨语言知识图谱中各种类型实体和关系统一映射到向量空间中,通过局部级邻居节点注意力学到每个实体连接到邻居相关实体的权重;步骤二:通过全局的注意力联合学习每个关系上的权重,根据权重融合不同邻居信息进行实体嵌入表示;步骤三:计算损失同时进行端到端的优化。2.如权利要求1所述的...

【专利技术属性】
技术研发人员:张世洁高永彬方志军余文俊
申请(专利权)人:上海工程技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1