当前位置: 首页 > 专利查询>吉林大学专利>正文

一种基于元学习的小样本知识图谱补全方法技术

技术编号:35868050 阅读:10 留言:0更新日期:2022-12-07 11:01
本发明专利技术公开了—种基于元学习的小样本知识图谱补全方法,该基于元学习的小样本知识图谱补全方法,包含邻域关系元编码器和匹配处理器两部分组件,邻域关系元编码器将语义相似度从实体级转移到关系级,用实体间的语义相似度和邻域内的信息交互描述邻域关系对长尾关系间的作用,将获取到的关系嵌入转移至查询集中,更新关系元后,计算查询集对应的新三元组的合理性得分,解决了小样本知识图谱的补全任务,对于知识图谱中一个缺失尾实体的不完全三元组,将其中的头实体称为目标头实体,关系称为任务关系,给定任务关系对应的K个头尾实体对构成的称为参考集的集合,可以实现对缺失尾实体的预测任务。实体的预测任务。实体的预测任务。

【技术实现步骤摘要】
一种基于元学习的小样本知识图谱补全方法


[0001]本专利技术涉及知识图谱领域,具体是一种基于元学习的小样本知识图谱补全方法。

技术介绍

[0002]大型知识图谱通常比较稀疏,需要挖掘缺失的信息或补充新实体使其更加完整,对存在长尾关系的三元组中的缺失部分进行预测的任务称为小样本知识图谱补全,分为静态知识图谱补全和动态知识图谱补全,静态知识图谱补全是推断知识图谱中的隐含关系,动态知识图谱补全是补充原知识图谱中未出现过的实体或关系。
[0003]现有的知识图谱补全算法通常需要大量三元组进行训练,不适用于对应实体对数量较少的长尾关系的情况,无法直接应用于小样本问题,而针对小样本问题的相关模型主要关注于实体嵌入而非关系嵌入,忽略了关系表示在最终预测中的重要性,无法充分表示长尾关系的特性。

技术实现思路

[0004]本专利技术的目的在于提供一种基于元学习的小样本知识图谱补全方法,以解决上述
技术介绍
提出的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:
[0006]一种基于元学习的小样本知识图谱补全方法,包括以下步骤:
[0007]1)邻域关系元编码器:利用参考实体的邻域信息可以获取关系的有效表示,对实体和关系的信息交换进行建模;
[0008]2)匹配处理器:由参考集信息实现关系元的更新,对参考实体和关系元信息进行匹配,更新关系元。
[0009]在上述技术方案的基础上,本专利技术还提供以下可选技术方案:
[0010]在一种可选方案中:在步骤1)中,计算尾实体和头实体的一跳邻域实体之间的相似度度量:
[0011]φ(e,e
nbr
)=e
T
W1e
nbr
+b
ꢀꢀ
(1)
[0012]其中e和e
nbr
分别表示参考集中的头实体和尾实体邻域的原始嵌入,W1和b是可训练参数,以参考集中头或尾实体和邻域实体之间的相似度作为邻域关系对任务关系的注意力,邻域内编号为i的邻域关系与任务关系之间的注意力系数α
i
为:
[0013][0014]其中是参考头尾实体对应的邻域中邻域关系和邻域实体的集合。
[0015]在一种可选方案中:将注意力系数α
i
作为邻域关系对任务关系的影响因子,得到参考集中序号m的一个参考实体对对应的关系元表示,称为邻域感知关系嵌入:
[0016][0017]其中的是随机选取的某些邻域关系嵌入,该任务关系的原始嵌入和它的邻域感知关系嵌入相加输入一个全连接层,得到第m个参考实体对对应的任务关系嵌入:
[0018][0019]其中rel
ori
是由翻译距离模型中的得分函数h+r=t,转化为的r=t

h计算得到的,σ是LeakyReLU激活函数,W2是可学习参数,对K个参考实体对的嵌入结果求平均,获得关系元
[0020][0021]在一种可选方案中:将参考实体嵌入和关系元嵌入拼接得到三元组嵌入,再通过ConvE模型中的得分函数计算三元组的合理性得分:
[0022][0023]其中,代表邻域关系元编码器生成的关系元嵌入,和分别表示实体和关系嵌入的二维重构,之后将其输入滤波器为ω的二维卷积层,f(
·
)类似ReLU的激活函数,vec(
·
)是将张量重构为二维向量的函数。
[0024]在一种可选方案中:使用权重矩阵W3将其映射到一个K维空间中,从而和尾实体t
i
通过计算内积得到三元组得分,支持集的损失函数:
[0025][0026]其中,[x]+
=max{0,x}表示标准铰链损失函数,而是由随机替换参考实体对的尾实体得到的负例参考集,γ是用于区分正例和负例之间的间隔。
[0027]在一种可选方案中:保留对支持集损失优化过程中关系元的梯度信息,将其同样作为元信息从参考集转移至查询集中,使用如下公式计算梯度元:
[0028][0029]从而任务或对应的关系元就由相应的梯度元优化得到:
[0030][0031]得到的更新后的关系元即可输入到第二个组件中。
[0032]在一种可选方案中:应用TransE模型中的得分函数计算三元组的匹配度得分
[0033][0034]损失函数:
[0035][0036]其中是由随机替换查询集实体对中的尾实体得到的负例查询集,γ是用于区分正负查询集三元组的间隔。
[0037]相较于现有技术,本专利技术的有益效果如下:
[0038]基于元学习的小样本知识图谱补全方法包含邻域关系元编码器和匹配处理器两部分组件,解决了小样本知识图谱的补全任务,对于知识图谱中一个缺失尾实体的不完全三元组,将其中的头实体称为目标头实体,关系称为任务关系,给定任务关系对应的K个头
尾实体对构成的称为参考集的集合,知识图谱中包含参考实体中的邻域信息,以及一个目标头实体对应的包含真实尾实体候选实体集,可以实现对缺失尾实体的预测任务。
附图说明
[0039]图1为基于元学习的小样本知识图谱补全方法的方法结构图。
具体实施方式
[0040]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0041]以下结合具体实施例对本专利技术的具体实现进行详细描述。
[0042]如图1所示,为本专利技术一个实施例提供的一种基于元学习的小样本知识图谱补全方法,称为FNIF,包含邻域关系元编码器和匹配处理器两部分。
[0043]1)邻域关系元编码器
[0044]由于任务关系对应的头尾实体信息较少,为聚合实体的一跳邻域信息,获取相应的任务关系嵌入,用实体间的语义关联表示关系间的语义相似性。首先计算尾实体和头实体的一跳邻域实体之间的相似度度量:
[0045]φ(e,e
nbr
)=e
T
W1e
nbr
+b
ꢀꢀ
(1)
[0046]其中e和e
nbr
分别表示参考集中的头实体(尾实体)和尾实体邻域(头实体邻域)的原始嵌入,W1和b是可训练参数,使用相同的方法计算尾实体和头实体邻域的相关性,但其中的权重矩阵不同。以参考集中头或尾实体和邻域实体之间的相似度作为邻域关系对任务关系的注意力,邻域内编号为i的邻域关系与任务关系之间的注意力系数α
i
为:
[0047][0048]其中是参考头尾实体对应的邻域中邻域关系和邻域实体的集合。为将实体间的信息交互融合到关系交互中,将上个公式得到的注意力系数α
i
作为邻域关系对任务关系的影响因子,从而聚合邻域关系嵌入,以聚合邻域信息,得到参考集中序号m的一个参考实体对对应的关系元表示,称为邻域感知关系嵌入:
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于元学习的小样本知识图谱补全方法,其特征在于,包括以下步骤:1)邻域关系元编码器:利用参考实体的邻域信息可以获取关系的有效表示,对实体和关系的信息交换进行建模;2)匹配处理器:由参考集信息实现关系元的更新,对参考实体和关系元信息进行匹配,更新关系元。2.根据权利要求1所述的基于元学习的小样本知识图谱补全方法,其特征在于,在步骤1)中,计算尾实体和头实体的一跳邻域实体之间的相似度度量:φ(e,e
nbr
)=e
T
W1e
nbr
+b
ꢀꢀꢀꢀ
(1)其中e和e
nbr
分别表示参考集中的头实体和尾实体邻域的原始嵌入,W1和b是可训练参数,以参考集中头或尾实体和邻域实体之间的相似度作为邻域关系对任务关系的注意力,邻域内编号为i的邻域关系与任务关系之间的注意力系数α
i
为:其中是参考头尾实体对应的邻域中邻域关系和邻域实体的集合。3.根据权利要求2所述的基于元学习的小样本知识图谱补全方法,其特征在于,将注意力系数α
i
作为邻域关系对任务关系的影响因子,得到参考集中序号m的一个参考实体对对应的关系元表示,称为邻域感知关系嵌入:其中的是随机选取的某些邻域关系嵌入,该任务关系的原始嵌入和它的邻域感知关系嵌入相加输入一个全连接层,得到第m个参考实体对对应的任务关系嵌入:其中rel
ori
是由翻译距离模型中的得分函数h+r=t,转化为的r=t

h计算得到的,σ是LeakyReLU激活函数,W2是可学习参数,对K个参考实...

【专利技术属性】
技术研发人员:刘露汪雨竹彭涛包铁王上张雪松
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1