【技术实现步骤摘要】
一种基于双原型网络的少样本知识推理方法
[0001]本专利技术涉及知识图谱
,具体涉及一种基于双原型网络的少样本知识推理方法。
技术介绍
[0002]知识是人类对信息进行处理之后的认识和理解,是对数据和信息的凝练、总结后的成果。图表示一些事物与另一些事物之间相互连接的结构。一张图通常由一些节点和连接这些节点的边组成。图中的节点代表语义实体或概念,边代表节点间的各种语义关系。知识图谱就是用图的形式将知识表示出来,知识图谱对于许多下游应用——例如搜索、知识问答和语义网——至关重要。
[0003]然而,由于大量知识信息来源于文档和网页信息,在从文档提取知识的过程中往往会有偏差,现有知识图谱面临不完整的问题。而知识图谱补全,旨在根据现有事实,推断缺失的事实,如实体之间缺失的关系,让知识图谱变得更加完整。因此,在知识图谱的构建中,知识图谱补全日益重要,是目前人工智能领域的研究热点之一。
[0004]现有的知识图谱补全工作,大多需要大量的实体对来进行关系推断;但是,实际数据集中关系的频率分布通常具有长尾问题,很大一部分关系在知识图谱中只有很少的实体对,因此,处理这些数量有限的实体对的关系是非常重要且具有挑战性的。近年来,基于该问题研究人员做了大量的工作,并由此发展出了少样本知识图谱补全技术,所述少样本知识图谱,也被称为小样本知识图谱,其英文全称为Few
‑
Shot Knowledge Graph。
[0005]目前常见的少样本知识图谱补全方法,可以概括为两类:基于度量的方法和基于优 ...
【技术保护点】
【技术特征摘要】
1.一种基于双原型网络的少样本知识推理方法,其特征在于,包括以下步骤:A、训练少样本知识推理模型:A1、输入待补全的知识图谱,所述待补全的知识图谱的数据为三元组数据(h,r,t),其中,h表示头实体,t表示尾实体,r表示头实体和尾实体的关系;根据关系出现的次数阈值,将所述待补全的知识图谱的数据划分为少样本数据和背景数据;A2、将少样本数据划分为实例集和查询集;从实例集中,随机选择一组实例作为正实例;然后,基于正实例,采用替换其尾实体的方式,构建一组不同于正实例的实例作为负实例,并由正实例和负实例构成支撑集;以查询集及支撑集所包含实例的实体构建实体集,从背景数据中提取分别以实体集的各实体作为头实体的实例,构成实体集的各实体的邻居集;A3、将查询集、支撑集和邻居集所包含实例的数据,采用预训练的知识图谱嵌入模型,转换为实例的初始嵌入;A4、针对查询集中的每一个查询例,分别按如下步骤进行匹配:A41、基于当前输入的查询例所包含实体以及支撑集所包含实例的实体,构建该查询例的实体子集,并将当前输入的查询例中的关系作为任务关系;针对实体子集中的每一个实体,分别计算其邻居集中各实例的关系同所述任务关系的相关性,并以相关性构建其邻居集中各实例的权重,然后,将其邻居集中各实例的尾实体的初始嵌入,采用带权重聚合的方式进行聚合,并基于聚合结果对该实体的初始嵌入进行更新,获得该实体的实体嵌入表征;A42、基于步骤A41获得的实体嵌入表征,针对查询例及支撑集所包含实例,分别融合其头实体和尾实体的实体嵌入表征,构建各实例的实体对嵌入表征;A43、基于各实例的实体对嵌入表征,分别计算支撑集中各正实例同输入查询例的相似性,并基于相似性构建各正实例的权重,然后,将各正实例的实体对嵌入表征,采用带权重聚合的方式进行聚合,获得输入查询例的正原型表征;分别计算支撑集中各负实例同输入查询例的相似性,并基于相似性构建各负实例的权重,然后,将各负实例的实体对嵌入表征,采用带权重聚合的方式进行聚合,获得输入查询例的负原型表征;A44、针对输入的查询例,计算其实体对嵌入表征与其正原型表征的正原型匹配得分,计算其实体对嵌入表征与其负原型表征的负原型匹配得分,完成对该查询集的分类推理;A5、基于步骤A4获得查询集中各查询例的推理结果,计算损失函数并进行反向传播训练;A6、重复步骤A2
‑
A5,直至达到设定的训练结束条件,获得训练好的少样本知识推理模型;B、执行知识推理任务:基于待补全知识所对应的实例构建查询集,基于训练阶段输入的知识图谱构建支撑集,将查询集和支撑集输入至训练获得的少样本知识推理模型,获得查询集的查询例的分类信息,并基于查询例的分类信息对知识进行补全。2.如权利要求1所述的一种基于双原型网络的少样本知识推理方法,其特征在于,在步骤A42和步骤A43之间,还包括步骤S1:以查询例及支撑集所包含实例作为节点,构建全连接图;并以步骤A42获得的实体对嵌
入表征作为全连接图的初始节点嵌入;基于全连接图的初始节点嵌入,采用图卷积神经网络,提取全连接图的各节点间的关联性作为全连接图的各节点间边的初始边嵌入;然后,基于全连接图的初始边嵌入,对全连接图的初始节点嵌入进行更新;最后,将全连接图经更新的初始节点嵌入,作为全连接图各节点对应实例的经更新的实体对嵌入表征,并作为步骤A43的输入。3.如权利要求2所述的一种基于双原型网络的少样本知识推理方法,其特征在于,步骤S1中,基于全连接图的初始节点嵌入,采用图卷积神经网络,提取全连接图的各节点间的关联性作为全连接图的各节点间边的初始边嵌入,具体为:点间的关联性作为全连接图的各节点间边的初始边嵌入,具体为:其中,v
p
,v
q
分别表示全连接图中节点p和节点q的初始节点嵌入,表示经图卷积神经网络提取的两节点间的关联性,S
r
表示支撑集中正实例的集合,表示支撑集中负实例的集合,f
pq
为反映节点p和节点q所对应实例是否来自相同集合的标识函数。4.如权利要求2所述的一种基于双原型网络的少样本知识推理方法,其特征在于,步骤S1中,基于全连接图的初始边嵌入,对全连接图的初始节点嵌入进行更新,包括如下步骤:首先,按如下公式,计算获得经过特征传播更新后的节点嵌入表征首先,按如下公式,计算获得经过特征传播更新后的节点嵌入表征其中,σ(
·
)为sigmoid激活函数,φ(
·
)是线性变换函数,V是全连接图的初始节点嵌入,E表示全连接图的初始边嵌入;然后,使用残差机制,按公式:对初始节点嵌入进行更新。5.如权利要求2、3或4述的一种基于双原型网络的少样本知识推理方法,其特征在于,所述图卷积神经网络为引入残差机制并包含四个卷积层的图卷积神经网络。6.如权利要求1所述的一种基于双原型网络的少样本知识推理方法,其特征在于,步骤A41中,针对实体子集中的每一个实体,分别计算其邻居集中各实例的关系同任务关系的相关性,并以相关性构建其邻居集中各实例的权重,然后,将其邻居集中各实例的尾实体的初始嵌入,采用带权重聚合的方式进行聚合,并基于聚合结果对该实体的初始嵌入进行更新,获得该实体的实体嵌入表征,包括如下步骤:A411、计算该实体邻居集中各实例的关系同任务关系的相关性ψ(r
t
,r
n
);A412、按如下公式,以相关性构建该实体邻居集中各实例的权重α
n
:其中,α
n
表示该实体邻居集中第n个实例的权重,exp(
·
)表示以e为底的指数函数,N
nbr
表示该实体的邻居集,r
n
,r
m
分别表示该实体邻居集中的第n个实例和第m个实例的关系的初始嵌入;
A413、按如下公式,将该实体邻居集中各实例的尾实体的初始嵌入,采用带权重聚合的方式进行聚合:其中,c表示该实体的邻居嵌入聚合表示,e
n
是该实体邻居集中第n个实例的尾实体的初始嵌入;A414、按如下公式,对该实体的初始嵌入进行更新:h
′
=σ(W1h+W2c)其中,h
′
表示更新后获得的该实体的实体嵌入表征,h表示该实体的初始嵌入,σ(
·
)表示Relu激活函数,W1和W2均为可学习参数。7.如权利要求1或6所述的一种基于双原型网络的少样本知识推理方法,其特征...
【专利技术属性】
技术研发人员:龚敬,惠孛,孙明,张栗粽,闫科,刘桂君,
申请(专利权)人:成都开源众智信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。