当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于四元数的知识图谱嵌入方法及系统技术方案

技术编号:37579922 阅读:15 留言:0更新日期:2023-05-15 07:55
本发明专利技术公开了一种基于四元数的知识图谱嵌入方法及系统,包括S1:构造投影矩阵对于三元组的层次结构;S2:构建基于四元数的知识图嵌入模型,利用基于四元数的知识图嵌入模型实现实体之间的旋转,利用四元数的模量实现构建层次结构的能力;得到基于四元数的知识图嵌入模型的得分函数,并通过得分函数构建最终损失函数;S3:利用基于四元数知识图嵌入模型对主要关系模式进行建模;S4:通过利用基于四元数知识图嵌入模型的最终损失函数学习知识图谱中实体和关系表示的问题,进行预测连接,从而得到知识图谱中缺失的且真实的三元组事实,实现知识图谱补全;并且,能够解决实体在不同场景中的多重表示,提高实体分类性能。提高实体分类性能。提高实体分类性能。

【技术实现步骤摘要】
一种基于四元数的知识图谱嵌入方法及系统


[0001]本专利技术属于知识图谱领域,特别涉及基于四元数的知识图谱嵌入方法及系统。

技术介绍

[0002]知识图谱(Knowledge graph)是用于存储客观事实信息的载体,以图的方式描述现实世界实体、概念和事件以及它们之间的关系。知识图谱包含大量的三元组,准确地说,它是一个面向图的数据库,每一个三元组(e
h
,e
r
,e
t
)都可以把分散在特定领域的知识连接起来,三元分别表示头部实体、关系实体、尾部实体。很多公司已经建立了DBpedia,Freebase,WordNet,Yago等知识图谱,然而,现有的知识图谱虽然得到了广泛的应用,但仍然存在着缺失问题,因此,在未来的研究中,完善知识补全和自动预测缺失事实是非常必要的,知识图谱嵌入(Knowledge graph embedding,KGE)旨在具备自动预测知识图谱中缺失实体的能力。
[0003]知识图谱嵌入的主要目的是将知识图的实体和关系映射到低维向量空间。虽然现有的知识图谱嵌入模型中,平移模型及其变种如TransE和RotatE取得了良好的性能,但在建模关系模式方面仍然存在很大的困难,即对称/反对称、逆向、组合关系模式和推断边对边复杂关系预测。上述方法明显缺点是,忽略了实体嵌入的模信息的使用,导到实体分类性能下降。另一方面,实体的语义层次是本体设计的主要组成部分,广泛存在于知识图谱中,这些模型不能推断出复杂的关系模式。

技术实现思路

[0004]为解决以上技术问题,本专利技术公开一种基于四元数的知识图谱嵌入方法及系统,通过构造投影矩阵实现不同类型实体的多重表示,将每个关系定义为单位四元数,实体为纯四元数;通过本专利技术中损失函数计算,通过学习知识图谱中实体和关系表示的问题以预测连接。
[0005]一种基于四元数的知识图谱嵌入方法,包括以下步骤:
[0006]S1:构造投影矩阵对于三元组的层次结构;
[0007]S2:构建基于四元数的知识图嵌入模型,利用基于四元数的知识图嵌入模型实现实体之间的旋转,利用四元数的模量实现构建层次结构的能力;得到基于四元数的知识图嵌入模型的得分函数,并通过得分函数构建最终损失函数;
[0008]S3:利用基于四元数知识图嵌入模型对公共数据集的主要关系模式进行建模;
[0009]S4:通过利用基于四元数知识图嵌入模型的最终损失函数学习知识图谱中实体和关系表示的问题,进行预测连接,从而得到知识图谱中缺失的且真实的三元组事实,实现知识图谱补全。
[0010]进一步地,所述S1中投影矩阵包括对于实体e的投影矩阵M
e
、头实体的投影矩阵M
rh
和尾实体的投影矩阵M
rt
,实体e的投影矩阵M
e
如下式所示:
[0011]M
e
=α1M
t(1)
+α2M
t(2)
+


n
M
t(k)

[0012]其中k表示实体e所属的类型数,t
(i)
表示实体e可以位于第i种类型,是t
(i)
的投影矩,α
i
表示t对应的权值;
[0013]头实体的投影矩阵M
rh
在一个三元组(e
h
,e
r
,e
t
)中的表示如下:
[0014][0015]其中,T
rh
代表具体关系r中的头部类型集,三元组(e
h
,e
r
,e
t
)中e
h
表示头实体,e
r
表示尾实体,e
t
表示关系实体;
[0016]尾实体的投影矩阵M
rt
在一个三元组(e
h
,e
r
,e
t
)中的表示如下:
[0017][0018]进一步地,所述S2中基于四元数知识图嵌入模型包括得分函数,得分函数为:
[0019]或
[0020][0021]其中,式中

表示点积,e
h
=[0,h]是一个纯四元数,而e
r
是单位四元数。
[0022]进一步地,所述S2中基于四元数的知识图嵌入模型的头部预测损失函数Loss
h
和尾部预测损失函数Loss
t
;所述头部预测损失函数Loss
h
如下:
[0023][0024]其中γ、σ都是超参数,分别表示固定边距和sigmoid函数,是第i个负的三元组除以正的三元组和概率分布,的定义如下:
[0025][0026]其中T
α
是采样温度;
[0027]所述尾部预测损失函数Loss
t
如下:
[0028][0029]进一步地,所述S4中预测连接的过程如下:
[0030]S4

1:通过设计关系和实体的投影矩阵,建立嵌入模型和关系模式;
[0031]S4

2:通过得分函数构建头部预测损失函数和尾部预测损失函数,并使用公共数据集来训练嵌入模型,使头部预测损失函数和尾部预测损失函数最小,获得一个较好的知
识图谱嵌入模型;
[0032]S4

3:将新的向量放进去,通过知识图谱嵌入模型可以得到另外一个向量,该向量其实就是根据头实体和关系预测出来的尾实体(h,r,?)或根据尾实体和关系来预测头实体(?,r,t)。
[0033]本专利技术还公开一种基于四元数的知识图谱嵌入系统,包括层次模块、知识图嵌入模块、模型建模模块和知识图谱补全模块;
[0034]所述层次模块用于构造投影矩阵对于三元组的层次结构;
[0035]所述知识图嵌入模块用于构建基于四元数的知识图嵌入模型,利用基于四元数的知识图嵌入模型实现实体之间的旋转,利用四元数的模量实现构建层次结构的能力,得到基于四元数的知识图嵌入模型的得分函数,并通过得分函数构建损失函数;
[0036]所述模型建模模块用于利用基于四元数知识图嵌入模型对公共数据集的主要关系模式进行建模;
[0037]所述知识图谱补全模块用于通过利用基于四元数知识图嵌入模型的最终损失函数学习知识图谱中实体和关系表示的问题,进行预测连接,从而得到知识图谱中缺失的且真实的三元组事实,实现知识图谱补全。
[0038]本专利技术有益效果为:
[0039]1、通过构造投影矩阵实现不同类型实体的多重表示,解决实体在不同场景中的多重表示,避免忽略实体嵌入的模信息的使用,提高实体分类性能。
[0040]2、通过本专利技术中损失函数计算,通过学习知识图谱中实体和关系表示的问题以预测连接,从而得本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于四元数的知识图谱嵌入方法,其特征在于,包括以下步骤:S1:构造投影矩阵对于三元组的层次结构;S2:构建基于四元数的知识图嵌入模型,利用基于四元数的知识图嵌入模型实现实体之间的旋转,利用四元数的模量实现构建层次结构的能力;得到基于四元数的知识图嵌入模型的得分函数,得到基于四元数的知识图嵌入模型的得分函数,并通过得分函数构建最终损失函数;S3:利用基于四元数知识图嵌入模型对公共数据集的主要关系模式进行建模;S4:通过利用基于四元数知识图嵌入模型的最终得分函数学习知识图谱中实体和关系表示的问题,进行预测连接,从而得到知识图谱中缺失的且真实的三元组事实,实现知识图谱补全。2.如权利要求1所述的一种基于四元数的知识图谱嵌入方法,其特征在于,所述S1中投影矩阵包括对于实体e的投影矩阵M
e
、头实体的投影矩阵M
rh
和尾实体的投影矩阵M
rt
,实体e的投影矩阵M
e
如下式所示:其中k表示实体e所属的类型数,t
(i)
表示实体e可以位于第i种类型,是t
(i)
的投影矩,α
i
表示t对应的权值;头实体的投影矩阵M
rh
在一个三元组(e
h
,e
r
,e
t
)中的表示如下:其中,T
rh
代表具体关系r中的头部类型集,三元组(e
h
,e
r
,e
t
)中e
h
表示头实体,e
r
表示尾实体,e
t
表示关系实体;尾实体的投影矩阵M
rt
在一个三元组(e
h
,e
r
,e
t
)中的表示如下:3.如权利要求1所述的一种基于四元数的知识图谱嵌入方法,其特征在于,所述S2中基于四元数的知识图嵌入模型的预测头部实体的得分函数f
rh
(e
h
,e
t
)为:f
rh
(e
h
,e
t
)=||e
r

(M
rt

e
r
)

e
r
‑1‑
M
rh

e
h
||
1/2
,||e
...

【专利技术属性】
技术研发人员:谢世文秦雅莉谢永芳胡成
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1