基于多视图解码器的知识图谱高阶关系预测方法及系统技术方案

技术编号:39726209 阅读:10 留言:0更新日期:2023-12-17 23:30
本发明专利技术公开了知识图谱技术领域的基于多视图解码器的知识图谱高阶关系预测方法及系统,具体包括以下步骤:

【技术实现步骤摘要】
基于多视图解码器的知识图谱高阶关系预测方法及系统


[0001]本专利技术涉及知识图谱
,具体为基于多视图解码器的知识图谱高阶关系预测方法及系统


技术介绍

[0002]知识图谱将知识库表示为有向图,其中节点和边分别表示实体和实体间关系

知识图谱有许多应用,例如语义搜索

对话生成和问答系统

然而,即使是最先进的知识图谱也是不完整的

关系预测是一种根据知识图谱中已存在的知识信息去预测实体间缺失的关系的任务,是一种有前途的

广泛研究的

旨在解决知识图谱的不完整的任务

[0003]现有的方法利用知识图谱表示学习方法进行节点和关系的向量化表示,然后进行推理

表示学习的目的是将知识图谱中的实体和关系映射到低维稠密的向量空间,将传统基于逻辑和符号的运算转变为基于数值的向量计算

基于表示学习的模型由于其简单高效性在链接预测

节点分类等任务上取得了较好的结果,被广泛应用于知识图谱补全

实体对齐等领域

[0004]目前知识图谱表示学习常用的基于转移距离的表示学习模型以
TransE
模型为代表,它将三元组中的关系看作头实体和尾实体之间的翻译操作,基本假设是成立的事实三元组
(h,r,t)
应该满足等式
h+r

t。TransE
在对一对一类型的关系上很有效,但是在处理一对多

多对一以及多对多问题时存在一定的问题

有很多模型对
TransE
进行了改进,但是仅考虑知识图谱中的三元组结构信息,尚有大量与实体和关系有关的其它信息没有得到有效应用,造成实体

关系的语义信息不明确

另外,利用图神经网络进行知识图谱的嵌入式表示,并应用到知识图谱的任务中,是当前大为流行的方法

[0005]但目前,在基于表示学习的知识图谱关系预测的已有研究中,一方面,现有方法大都是通过对多种类型节点的特征进行表示学习,然后在相同的语义空间中对不同关系进行预测,无法有效的进行多关系预测;另一方面,现有方法更多关注于一阶链接关系的预测上,忽视高阶链接关系预测的重要性

一阶关系是指知识图谱本体定义的实体之间的直接连接关系,高阶链接关系则是实体间可能存在多跳关系,即由一条隐藏的路径链接两个实体


技术实现思路

[0006]本专利技术的目的在于提供基于多视图解码器的知识图谱高阶关系预测方法及系统,以解决上述
技术介绍
中提出的问题

[0007]为实现上述目的,本专利技术提供如下技术方案:基于多视图解码器的知识图谱高阶关系预测方法,具体包括以下步骤:
[0008]S1
:将待预测的知识图谱导入到知识图谱高阶关系预测模型中,经处理后,重构出多个基于元路径视图的链接概率矩阵;
[0009]其中,所述知识图谱高阶关系预测模型包括数据处理模块

知识图谱编码器

多视
图解码器,所述知识图谱高阶关系预测模型的数据处理方法,具体包括以下步骤:
[0010]S11
:将待预测的知识图谱输入到数据处理模块中进行处理,生成多个基于元路径的视图以及节点的初始化向量表示;
[0011]S12
:知识图谱编码器对所述节点的初始化向量表示进行处理,生成节点嵌入;
[0012]S13
:多视图解码器对所述节点嵌入与所述多个基于元路径的视图进行处理,重构出多个基于元路径视图的链接概率矩阵;
[0013]S2
:利用阈值和掩码矩阵过滤所述重构的多个基于元路径视图的链接概率矩阵,输出预测结果

[0014]作为优选,所述步骤
S11
中数据处理模块的工作方式具体为,
[0015]第一步:将待预测知识图谱的高阶关系和其他链接关系定义为
p
个元路径,并根据定义的
p
个元路径将待预测的知识图谱进行子图重构,生成
p
个基于元路径的视图,并得到视图中节点之间的链接矩阵为
{A
i
|i
=1…
p}

[0016]第二步:利用
TransE
模型对待预测知识图谱中的三元组进行向量初始化,得到知识图谱中节点的初始化向量表示;
[0017]其中,其中
p
为元路径的数量

[0018]作为优选,所述步骤
S12
中知识图谱编码器的工作方式具体为,利用双层的异构图注意力神经网络对输入的节点的初始化向量表示通过基于元路径的邻域特征进行分层聚合,生成节点嵌入;
[0019]其中,所述节点嵌入为新的节点特征表示矩阵
Z。
[0020]作为优选,所述步骤
S13
中多视图解码器的工作方式为:
[0021]第一步:根据知识图谱数据处理模块所定义的元路径和基于元路径视图的链接矩阵
{A
i
|i
=1…
p}
,将所述新的节点特征表示矩阵
Z
划分为基于
p
个视图的节点表示矩阵
{Z
i
|i
=1…
p}

[0022]第二步:通过
p
个可训练的元路径映射矩阵
{W
i
|i
=1…
p}
,将所述节点表示矩阵
{Z
i
|i
=1…
p}
投影到对应的元路径空间中作为节点表示矩阵
{Z

i
|i
=1…
p}

[0023]第三步:通过向量内积和
Sigmoid
激活函数对所述节点表示矩阵
{Z

i
|i
=1…
p}
进行处理,获得节点向量表示在
i
元路径空间中的链接概率矩阵
[0024]作为优选,在所述步骤
S2
之前用所述节点向量表示在
i
元路径空间中的链接概率矩阵与基于元路径视图的链接矩阵
{A
i
|i
=1…
p}
进行损失计算,若损失值不达标,则利用梯度下降算法实现知识图谱高阶关系预测模型参数的更新,并重新获得节点向量表示在
i
元路径空间中的链接概率矩阵进行损失值计算,直至损失值达标,若损失值达标,则进行步骤
S2。
[0025]作为优选,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
基于多视图解码器的知识图谱高阶关系预测方法,其特征在于:具体包括以下步骤:
S1
:将待预测的知识图谱导入到知识图谱高阶关系预测模型中,经处理后,重构出多个基于元路径视图的链接概率矩阵;其中,所述知识图谱高阶关系预测模型包括数据处理模块

知识图谱编码器

多视图解码器,所述知识图谱高阶关系预测模型的数据处理方法,具体包括以下步骤:
S11
:将待预测的知识图谱输入到数据处理模块中进行处理,生成多个基于元路径的视图以及节点的初始化向量表示;
S12
:知识图谱编码器对所述节点的初始化向量表示进行处理,生成节点嵌入;
S13
:多视图解码器对所述节点嵌入与所述多个基于元路径的视图进行处理,重构出多个基于元路径视图的链接概率矩阵;
S2
:利用阈值和掩码矩阵过滤所述重构的多个基于元路径视图的链接概率矩阵,输出预测结果
。2.
根据权利要求1所述的基于多视图解码器的知识图谱高阶关系预测方法,其特征在于:所述步骤
S11
中数据处理模块的工作方式具体为,第一步:将待预测知识图谱的高阶关系和其他链接关系定义为
p
个元路径,并根据定义的
p
个元路径将待预测的知识图谱进行子图重构,生成
p
个基于元路径的视图,并得到视图中节点之间的链接矩阵为
{A
i
|i
=1…
p}
;第二步:利用
TransE
模型对待预测知识图谱中的三元组进行向量初始化,得到知识图谱中节点的初始化向量表示;其中,其中
p
为元路径的数量
。3.
根据权利要求2所述的基于多视图解码器的知识图谱高阶关系预测方法,其特征在于:所述步骤
S12
中知识图谱编码器的工作方式具体为,利用双层的异构图注意力神经网络对输入的节点的初始化向量表示通过基于元路径的邻域特征进行分层聚合,生成节点嵌入;其中,所述节点嵌入为新的节点特征表示矩阵
Z。4.
根据权利要求3所述的基于多视图解码器的知识图谱高阶关系预测方法,其特征在于:所述步骤
S13
中多视图解码器的工作方式为:第一步:根据知识图谱数据处理模块所定义的元路径和基于元路径视图的链接矩阵
{A
i
|i
=1…
p}
,将所述新的节点特征表示矩阵
Z
划分为基于
p
个视图的节点表示矩阵
{Z
i
|i
=1…
p}
;第二步:通过
p
个可训练的元路径映射矩...

【专利技术属性】
技术研发人员:罗刚刘振国许默君黄怡宁
申请(专利权)人:安徽国麒科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1