一种基于四元数的三维旋转知识图谱嵌入方法技术

技术编号:29673577 阅读:21 留言:0更新日期:2021-08-13 21:55
一种基于四元数的三维旋转知识图谱嵌入方法,所述方法包括以下步骤:第一步:定义知识图谱三种关系模式和相关形式化表述;第二步、定义四元数的基础和基于四元数乘法的三维旋转表示;第三步、基于四元数进行关系三维旋转建模,同时推导模型针对知识图谱三种关系模式建模的能力,并进行模型训练以获得更好地四元数向量表示。本发明专利技术引入了四元数来对知识图谱中的实体和关系进行建模表示,将实体表示成三维空间中的一组向量,关系表示实体间的三维旋转变换,能够解决当前嵌入模型无法有效地学习和推理知识图谱中各种关系模式,特别是组合关系模式的问题,从而能够有效地降低实体和关系的模糊程度,提升知识图谱链接预测准确率。

【技术实现步骤摘要】
一种基于四元数的三维旋转知识图谱嵌入方法
本专利技术涉及知识图谱领域,特别涉及一种基于四元数的三维旋转知识图谱嵌入方法。
技术介绍
谷歌于2012年提出了知识图谱(KnowledgeGraph)的概念,旨在用知识图谱来增强其搜索引擎的功能。知识图谱是用于存储客观事实信息的载体,以图的方式描述现实世界实体、概念和事件以及它们之间的关系。实体作为有向图的点,关系作为有向图的边,每条知识表示为三元组的形式(h,r,t),其中h表示头实体,t表示尾实体,r表示头、尾实体之间的关系。知识图谱凭借着其强大的语义计算能力与开放互联能力在推荐系统,智能问答和信息检索等领域发挥着重要的作用,现已成为互联网中以知识为驱动的人工智能的应用的基础设施。近年来,人们构建了诸如DBpedia,Freebase等包含了数十亿三元组的大规模知识图谱,并将它们成功应用于诸多领域。但这些知识图谱中仍存在着一个公共问题,即与客观世界相比,这些知识图谱往往是不够完整的。大量事实三元组的缺失,使得以知识图谱为基础的人工智能应用不能发挥其潜在的性能。知识图谱嵌入是将知识图本文档来自技高网...

【技术保护点】
1.一种基于四元数的三维旋转知识图谱嵌入方法,其特征在于,所述方法包括以下步骤:/n第一步:定义知识图谱三种关系模式和相关形式化表述;/n第二步、定义四元数的基础和基于四元数乘法的三维旋转表示;/n第三步、基于四元数进行关系三维旋转建模,同时推导模型针对知识图谱三种关系模式建模的能力,并进行模型训练以获得更好地四元数向量表示,过程如下:/n3.1、给定一个三元组(h,t,r),其中h表示头实体,t表示尾实体,r表示为头实体和尾实体之间的关系,将这个三元组的头尾实体h,t和关系r的嵌入表示为四元数的向量形式h,t和r;/n3.2、与RotatE相比,继承了三维旋转的特征,学习和推理三种基本关系模...

【技术特征摘要】
1.一种基于四元数的三维旋转知识图谱嵌入方法,其特征在于,所述方法包括以下步骤:
第一步:定义知识图谱三种关系模式和相关形式化表述;
第二步、定义四元数的基础和基于四元数乘法的三维旋转表示;
第三步、基于四元数进行关系三维旋转建模,同时推导模型针对知识图谱三种关系模式建模的能力,并进行模型训练以获得更好地四元数向量表示,过程如下:
3.1、给定一个三元组(h,t,r),其中h表示头实体,t表示尾实体,r表示为头实体和尾实体之间的关系,将这个三元组的头尾实体h,t和关系r的嵌入表示为四元数的向量形式h,t和r;
3.2、与RotatE相比,继承了三维旋转的特征,学习和推理三种基本关系模式的能力得到了进一步增强,针对各种关系模式,给出了模型对关系模式的建模能力;
3.3、训练模型以获得更好的四元数向量。


2.如权利要求1所述的一种基于四元数的三维旋转知识图谱嵌入方法,其特征在于,所述3.1的过程如下:
3.1.1、将头实体表示为四元数向量;四元数向量h的表示形式如下所示:
h=xhi+yhj+zhk+0
3.1.2、将尾实体表示为四元数向量;四元数向量t的表示形式如下所示:
t=xti+ytj+ztk+0
3.1.3、将关系表示为四元数向量;四元数向量r的表示形式如下所示:



其中都是代表一个具体数值的实数;α表示头实体通过旋转轴旋转到尾实体的位置时转过的角度,α∈[0,2π);xh,yh,zh表示头实体的四元数向量在三维空间中x,y,z方向的分量;xt,yt,zt表示尾实体的四元数向量在三维空间中x,y,z方向的分量;ux,uy,uz表示旋转轴的四元数向量在三维空间中x,y,z方向的分量;是四元数向量,同时是一个单位四元数;是纯四元数向量,k是模型维数,表示向量之间的哈达玛积;
h和t四元数向量的每个三维空间中x,y,z方向的分量都由k个元素组成,每个元素对应一个三维空间中的向量[x,y,z]T;关系向量的每个三维空间中x,y,z方向的分量也有k个元素,每个元素对应一组由单位向量表示的旋转轴u和绕轴旋转的角度α所表示的三维旋转变换;
hi=xhii+yhij+zhik+0,ti=xtii+ytij+ztik+0分别表示头实体和尾实体中第i个元素表示的四元数向量,关系向量的第i个元素表示的四元数向量可以表示为其中,uxi,uyi,uzi是单位向量旋转轴u=[ux,uy,uz]T三个分量的第i个元素表示的值,并且uxi,uyi,uzi满足
3.1.4、计算由第i个元素组成的头实体hi、关系ri和尾实体ti所表示成的三元组的打分函数,0≤i≤k-1,i是整数。


3.如权利要求2所述的一种基于四元数的三维旋转知识图谱嵌入方法,其特征在于,所述3.1.4的过程如下:
3.1.4.1、计算头实体hi沿着关系ri绕着旋转轴ui旋转αi度后的结果,即计算从头实体和关系到尾实体的映射Rot+(h,r),计算公式如下,其中hroti是hi旋转后的结果,ri-1是ri的逆:
Rot+(hi,ri)=hroti=ri·hi·ri-1
3.1.4.2、计算映射结果到尾实体ti的基于距离的打分函数,计算公式如下:



3.1.4.3、计算从尾实体和关系到头实体的映射Rot-(r,t),即是计算尾实体ti沿着关系ri绕着旋转轴ui旋转αi度后的结果,将头实体到尾实体的旋转记为正向旋转,而将尾实体到头实体的旋转记为反向旋转,依据三维旋转特点,反向旋转只需选择将正向旋转的旋转角度调整为2π-α,并保持旋转轴u不变即可;或保持旋转角度α不变,将表示旋转轴的向量取为相反向量-u,因此计算公式如下,其中troti是ti旋转后的结果,ri-1是ri的逆:
Rot-(ri,ti)=troti=ri-1·ti·ri
3.1.4.4、计算映射结果到头实体hi的基于距离的打分函数,计算公式如下:



3.1.4.5、计算三元组的基于距离的打分函数,计算公式如下:





4.如权利要求1或2所述的一种基于四元数的三维旋转知识图谱嵌入方法,其特征在于,所述3.2的过程如下:
3.2.1、推导模型的建模对称/反对称关系模式,假设和同时成立,对称关系r将会强制在向量空间中添加以下约束:
e2i=ri·e1i·ri-1∧e1i=ri·e2i·ri-1,i∈{0,1,...,k-1}
将e2i=ri·e1i·ri-1代入e1i=ri·e2i·ri-1,则有:e1i=ri·ri·e1i·ri-1·ri-1,根据公式(1)四元数乘积的逆计算公式和公式(2)四元数结合律有e1i=(ri·ri)·e1i·(ri·ri)-1;进一步得出结论:ri·ri=1,i∈{0,1,...,k-1},即若ri对应的绕轴旋转的旋转角度α为0或者π时,ri·ri=1,i∈{0,1,...,k-1},此时关系r是对称关系;
如果和成立,则得出:向量r中存在ri·ri≠1,i∈{0,1,...,k-1},即若向量r中存在ri·ri≠1,i∈{0,1,...,k-1},则关系r是非对称关系,因此,模型能够编码对称/反对称关系模式;
3.2.2、推导模型的逆关系模式,假设和同时成立,即关系r1,r2是一组互为逆的关系,则模型强制要求:
e2i=r1i·e1i·r1i-1∧e1i=r2i·e2i·r2i-1,i∈{0,1,...,k-1}
根据公式(1)和(2),则有r1i=r2i-1,i∈{0,1,...,k-1},这表明模型完全能够编码逆关系模式,即若r1i=r2i-1,i∈{0,1,...,k-1},则关系r1是关系r2的逆关系;
3.2.3、推导模型的组合关系模式,三维旋转的特点是两个旋转的组合等价于一个新的旋转,假设以及同时成立,即关系r1是关系r2和r3的组合,则可得出:



根据公式(1)和(2)可以推理获得,当r1i=r3i·r2i,i∈{0,1,...,k-1}成立时,上述等式成立,即若r1i=r3i·r2i,i∈{0,1,...,k-1},则关系r1等价于关系r2和r3的组合。


5.如权利要求1或2所述的一种基于四元数的三维旋转知识图谱嵌入方法,其特征在于,所述3.3的过程如下:
3.3.1、准备知识图谱的实体集E,关系集R,训练集三元组集合这些训练集三元组集合是由实体集E和关系集R组成的能够成立的三元组,即正例的集合,设置模型实体和关系的维度k,从三元组集合中取随机个批处理数据,数量设为batch_size;设置负例三元组的数目nneg,负例三元组指的是将某一个正例三元组中的头实体或者尾实体替换后生成的不成立的三元组,nneg的大小表示由一个正例三元组生成nneg个负例三元组;设置边界值γ,用于判断打分函数的值是否超过边界值γ,若超过则表示这个三元组不成立,否则,这个三元组成立;设置自对抗采样温度a,当a=0时,自对抗采样退化为均匀采样,当a>0时,得分越小的负例三元组对应的采样权重就越大;设置模型训练的最...

【专利技术属性】
技术研发人员:陆佳炜朱昊天王小定吴俚达程振波徐雪松肖刚
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1