当前位置: 首页 > 专利查询>四川大学专利>正文

基于嵌入学习的知识超图链接预测方法技术

技术编号:33709998 阅读:14 留言:0更新日期:2022-06-06 08:40
本发明专利技术公开了一种基于嵌入学习的知识超图链接预测方法,通过知识超图中现有实体间的链接自动学习潜在空间中实体和关系的嵌入,根据学习得到的嵌入进行计算,从而推理出知识超图中缺失的链接。其中,通过引入关系角色矩阵,显式地为不同关系中不同位置上的实体角色信息进行建模,以灵活表示实体在不同元组中的嵌入。并对关系进行细化分解,以增加实体和关系之间的交互。同时,提出组块的概念以增加元组嵌入不同位置元素之间的交互。在真实知识超图数据集上的实验结果表明,本发明专利技术能够有效地对知识超图中的链接进行预测。知识超图中的链接进行预测。知识超图中的链接进行预测。

【技术实现步骤摘要】
基于嵌入学习的知识超图链接预测方法


[0001]本专利技术涉及信息
,具体来讲涉及的是一种基于嵌入学习的知识超图链接预测方法。

技术介绍

[0002]知识超图是一种以多元组形式存储事实的知识库,通常被视作知识图谱的一般化。知识库在学术界和工业界中发挥着十分重要的作用,广泛应用于问题回答、推荐系统、信息检索和自然语言处理等领域的研究与应用。然而,知识库是高度不完整的,即部分实体间的链接是缺失的,因此导致使用知识库的下游工作受到更多的挑战。例如,文献(RobertWest,EvgeniyGabrilovich,Kevin Murphy,Shaohua Sun,Rahul Gupta,Dekang Lin.Knowledge base completion via search

based question answering[C]//Proceedings of the 23rd
[0003]InternationalConference on World Wide Web,Seoul,Korea,April 7

11,2014.New York:ACM,2014:515

526)中提出在Freebase知识库中,71%的人与出生地之间缺少链接,94%的人与父母之间缺少链接,99%的人与种族之间缺少链接。面对知识库的高度不完整性,链接预测方法致力于通过实体间的已知链接来推理缺失链接,从而成为研究焦点。
[0004]目前关于链接预测的研究主要集中在仅包含二元关系的知识图谱上,但是这些专门为二元关系设计的模型不一定能够很好地扩展到包含多元关系的知识超图上。然而,多元关系在知识库中是十分普遍的,文献(Bahare Fatemi,PerouzTaslakian,David Vazquez,David Poole.Knowledge hypergraphs:prediction beyond binary relations[C]//Proceedings of the 29th International Joint Conference on Artificial Intelligence,Yokohama,Japan,January 5

15,2021.San Francisco:Morgan Kaufmann,2020:2191

2197)发现在Freebase知识库中,超过三分之一的实体参与到了多元关系中,超过61%的关系是多元的。从上述数据中可以看出,多元关系是一种普遍存在的关系。此外,文献(JianfengWen,JianxinLi,Yongyi Mao,Shini Chen,Richong Zhang.On the representation and embedding of knowledge bases beyond binary relations[C]//Proceedings of the 25th International Joint Conference on Artificial Intelligence,New York,USA,July9

15,2016.San Francisco:Morgan Kaufmann,2016:1300

1307)证明了通过现有转换方法将知识超图转换为知识图谱会导致结构信息的丢失。因此,需要一种专门为知识超图设计的链接预测方法。
[0005]目前知识超图链接预测的主要挑战在于知识超图中关系是多元的,即一个关系通常涉及到两个及以上的实体,且知识超图是有向的,即关系中实体的排列是有序的。为此,本专利技术提出基于嵌入学习的方法对知识超图中实体间缺失的链接进行预测,从而促进下游任务的发展。

技术实现思路

[0006]因此,针对上述挑战,本专利技术在此提供一种基于嵌入学习的知识超图链接预测方法;以此为下游任务提供技术支持。对于本专利技术来讲,通过知识超图中现有实体间的链接自动学习潜在空间中实体和关系的嵌入,根据学习得到的嵌入进行计算,从而推理出知识超图中缺失的链接。其中,通过引入关系角色矩阵,显式地为不同关系中不同位置上的实体角色信息进行建模,以灵活表示实体在不同元组中的嵌入。并对关系进行细化分解,以增加实体和关系之间的交互。同时,提出组块的概念以增加元组嵌入不同位置元素之间的交互。在真实知识超图数据集上的实验结果表明,本专利技术能够有效地对知识超图中的链接进行预测。
[0007]本专利技术是这样实现的:构造了一种基于嵌入学习的知识超图链接预测方法,显式对实体在不同关系以及不同位置上的角色信息进行建模;通过对关系进行细化分解,增加实体与关系间的交互;采用组块的概念以增加嵌入不同位置元素之间的交互;具体的实现步骤如下:
[0008]步骤1,构建实体角色模块,对实体嵌入以及对应的角色嵌入求和,该模块的主要作用是灵活表示知识超图不同元组中实体的最终嵌入;
[0009]步骤2,构建关系分解模块,将关系分解为一组子关系,从而为每个元组构造出一组子三元组,对子三元组嵌入进行加和,获得元组的最终嵌入,该模块的主要作用是增加实体与关系之间的交互;
[0010]步骤3,构建元素交互模块,将元组的最终嵌入划分为多个组块,将每个组块的得分相加,获得元组成立的最终得分;
[0011]步骤4,实现知识超图链接预测方法的训练过程。
[0012]根据本专利技术所述基于嵌入学习的知识超图链接预测方法,对于实体角色模块的实现如下:
[0013]实体角色模块的主要作用是灵活表示知识超图不同元组中实体的最终嵌入;
[0014]给定一个知识超图H=(X,E),其中X是实体集,E是关于X的非空有序元组集,称为超边集;超边e∈E对应于一个关系类型映射函数ψ(e)∈R,R是关系集,表示每条超边都对应于一类特定关系r∈R,关系r的元数|r|是固定的,即关系r涉及的实体数量是固定的;在知识超图中,事实通常以元组的形式存储,符号表示为(r,x
m
,...,x
n
),其中r∈R代表一种特定关系,x
m
,...,x
n
∈X代表不同实体;采用Xavier初始化方法对实体以及关系进行初始化,实体x
i
嵌入初始化为向量关系r对应的角色嵌入初始化为矩阵其中表示关系r位置p上的角色嵌入;
[0015]给定任意一个元组t=(r,x
m
,...,x
n
),其对应于关系r,对于该元组中第p个实体x
i
,其在元组t中最终嵌入的计算公式如下:
[0016][0017]根据本专利技术所述基于嵌入学习的知识超图链接预测方法,对于关系分解模块的实现如下:
[0018]关系分解模块的主要作用是对关系进行细化分解,以增加实体与关系之间的交
互;
[0019]给定任意一个元组t,其对应于关系r∈本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于嵌入学习的知识超图链接预测方法,其特征在于:显式对实体在不同关系以及不同位置上的角色信息进行建模;通过对关系进行细化分解,增加实体与关系间的交互;采用组块的概念以增加嵌入不同位置元素之间的交互;具体的实现步骤如下:步骤1,构建实体角色模块,对实体嵌入以及对应的角色嵌入求和,该模块的主要作用是灵活表示知识超图不同元组中实体的最终嵌入;步骤2,构建关系分解模块,将关系分解为一组子关系,从而为每个元组构造出一组子三元组,对子三元组嵌入进行加和,获得元组的最终嵌入,该模块的主要作用是增加实体与关系之间的交互;步骤3,构建元素交互模块,将元组的最终嵌入划分为多个组块,将每个组块的得分相加,获得元组成立的最终得分;步骤4,实现知识超图链接预测方法的训练过程。2.根据权利要求1所述一种基于嵌入学习的知识超图链接预测方法,其特征在于:步骤1中对于实体角色模块的实现如下:实体角色模块的主要作用是灵活表示知识超图不同元组中实体的最终嵌入;给定一个知识超图H=(X,E),其中X是实体集,E是关于X的非空有序元组集,称为超边集;超边e∈E对应于一个关系类型映射函数ψ(e)∈R,R是关系集,表示每条超边都对应于一类特定关系r∈R,关系r的元数|r|是固定的,即关系r涉及的实体数量是固定的;在知识超图中,事实通常以元组的形式存储,符号表示为(r,x
m
,...,x
n
),其中r∈R代表一种特定关系,x
m
,...,x
n
∈X代表不同实体;采用Xavier初始化方法对实体以及关系进行初始化,实体x
i
嵌入初始化为向量关系r对应的角色嵌入初始化为矩阵其中表示关系r位置p上的角色嵌入;给定任意一个元组t=(r,x
m
,...,x
n
),其对应于关系r,对于该元组中第p个实体x
i
,其在元组t中最终嵌入的计算公式如下:3.根据权利要求1所述一种基于嵌入学习的知识超图链接预测方法,其特征在于:步骤2中对于关系分解模块的实现如下:关系分解模块的主要作用是对关系进行细化分解,以增加实体与关系之间的交互;给定任意一个元组t,其对应于关系r∈R,关系元数为|r|,根据组合公式可以将其分解为个不同的子关...

【专利技术属性】
技术研发人员:段磊王培妍左劼郭正山
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1