基于关系有向图的知识推理方法及装置制造方法及图纸

技术编号:38761669 阅读:10 留言:0更新日期:2023-09-10 10:34
本发明专利技术公开了一种基于关系有向图的知识推理方法及装置,属于知识图谱领域。基于关系有向图的知识推理方法,包括:获取三元组数据集合;将所述三元组数据集合中的所有三元组作为正三元组样本,并对所述正三元组样本进行负采样得到负三元组样本;对三元组样本和正三元组样本分别进行关系有向图编码,得到子图编码向量;其中,三元组样本包括正三元组样本和负三元组样本;对子图编码向量表示的序列进行打分,根据打分确定属于尾实体的序列。本发明专利技术提升了三元组补全的精确率。升了三元组补全的精确率。升了三元组补全的精确率。

【技术实现步骤摘要】
基于关系有向图的知识推理方法及装置


[0001]本专利技术属于知识图谱领域,特别是涉及一种基于关系有向图的知识推理方法及装置。

技术介绍

[0002]知识图谱包含了真实世界客体、人物、概念等的交互,使得人工智能和人类知识有更多的连接。这种连接以事实三元组(头实体,关系,尾实体)的形式表示实体间的关系。知识图谱通常包含大量的知识,但是高度不完整,因此,推理新的事实成为一个挑战。知识推理就是根据已有事实模拟推理新的事实的一个过程。知识推理现已广泛应用于语义搜索、智能推荐和对话系统等领域。目前知识推理技术存在以下不足:
[0003](1)在已有的知识库补全模型中,预测实体之间的链接通常依赖少量的实时数据,忽略了有价值的常识知识。并且已有的知识库嵌入技术存在无效的下采样问题和事实链接预测的不确定性,影响了知识库补全的性能。
[0004](2)在知识库补全的技术中,通常以基于逻辑规则推理和基于路径推理为主,不能提供常识语义,有价值的常识需要花费大量的人工标注,所以其高成本导致相对的低知识补全率。
[0005](3)已有的基于子图推理的方法通常是通过对一个给定的查询进行剪枝,将图中不相关的实体去掉,而不是学习特定的局部结构,故无法推理得到更多的知识信息。

技术实现思路

[0006]本专利技术的目的在于克服现有技术的不足,提供一种基于关系有向图的知识推理方法及装置。
[0007]本专利技术的目的是通过以下技术方案来实现的:基于关系有向图的知识推理方法,包括:
[0008]获取三元组数据集合;
[0009]将所述三元组数据集合中的所有三元组作为正三元组样本,并对所述正三元组样本进行负采样得到负三元组样本;
[0010]对三元组样本和正三元组样本分别进行关系有向图编码,得到子图编码向量;其中,三元组样本包括正三元组样本和负三元组样本;
[0011]对子图编码向量表示的序列进行打分,根据打分确定属于尾实体的序列。
[0012]进一步地,获取三元组数据集合,包括:
[0013]获取若干个三元组;
[0014]为三元组中的实体和关系设置唯一的ID数值;
[0015]将三元组中的实体和关系替换为对应的ID数值;
[0016]将实体和关系替换为ID数值后的三元组组成三元组数据集合。
[0017]进一步地,将所述三元组数据集合中的所有三元组作为正三元组样本,并对所述
正三元组样本进行负采样得到负三元组样本,包括:
[0018]分别将所述三元组数据集合中的每个三元组作为一个正三元组样本;
[0019]对所述正三元组样本进行负采样,得到负三元组样本。
[0020]进一步地,对所述正三元组样本进行负采样,得到负三元组样本,包括:
[0021]设置关系对应尾实体所述概念的数据、关系的关系属性数据、实体对应概念的数据、概念对应实体的数据;
[0022]根据关系属性数据确定正三元组样本中关系的关系类型,关系类型包括1

1关系、1

N关系、N

1关系和N

N关系;1

1关系表示一组头实体和关系只会对应1个尾实体,N

1关系表示N个头实体会对应同一组关系和尾实体,1

N关系表示一组头实体与关系会对应N个尾实体,N

N关系表示N组头实体与关系会对应N个尾实体;
[0023]若正三元组样本中关系为1

1关系或N

1关系,则判断实体对应概念的数据中是否存在该正三元组样本中尾实体对应的概念;
[0024]若实体对应概念的数据中存在该正三元组样本中尾实体对应的概念,则将该尾实体所属概念下除该尾实体之外的所有实体添加至预设的负样本集合中;
[0025]若实体对应概念的数据中不存在该正三元组样本中尾实体对应的概念,则将该正三元组样本中关系所属概念下的所有实体添加至预设的负样本集合中;
[0026]若正三元组样本中关系为1

N关系和N

N关系,则将该正三元组样本中关系所属概念下的实体集合与尾实体所属概念下的实体集合求差集,将该差集中所有实体添加至预设的负样本集合中;
[0027]将负样本集合中的每个实体作为正三元组样本中尾实体的一个负样本;
[0028]将正三元组样本中的尾实体替换为对应的负样本,得到负三元组样本。
[0029]进一步地,对所述正三元组样本进行负采样,得到负三元组样本,还包括:
[0030]判断每个正三元组样本对应的负样本的数量是否大于预设值,若是,则随机去除部分负样本,以使每个正三元组样本对应的负样本的数量小于等于预设值;或者,
[0031]判断每个正三元组样本对应的负三元组样本的数量是否大于预设值,若是,则随机去除部分负三元组样本,以使每个正三元组样本对应的负三元组样本的数量小于等于预设值。
[0032]进一步地,对三元组样本和正三元组样本分别进行关系有向图编码,得到子图编码向量,包括:
[0033]提取三元组样本或正三元组样本中头实体和关系的邻居节点;
[0034]采用交互的方式构建子图;
[0035]利用消息传递机制获得图表示向量作为子图编码向量。
[0036]进一步地,对三元组样本和正三元组样本分别进行关系有向图编码,得到子图编码向量,包括:
[0037]初始化三元组样本或正三元组样本中子图向量G0(h,r)=0,头实体集合V0={h};
[0038]根据头实体提取第i跳的节点V
i
=t|(h,r,t)∈E
i
},关系R
i
=(r|(h,r,t)∈E
i
)和边E
i
=(h,r,t)|h∈V
i
‑1},其中,h表示头实体,r表示关系,t表示尾实体,初始化时集合V中只有V0={h}为可见的初始头实体;
[0039]对边进行注意力权重计算,注意力权重的计算公式为:
[0040][0041]式中,α
i
表示注意力权重,表示注意力占比权重,表示第i跳的边中头实体向量,表示第i跳的边中的关系向量,表示第i

1跳中关系向量,ReLU()为ReLU激活函数,σ()为sigmoid激活函数,表示连接符,T表示注意力权重占比矩阵的转置;
[0042]利用消息传递机制得到边信息,从中获取关于t的关系有向子图编码向量消息传递函数的公式为:
[0043][0044]式中,为消息传递权重,α
i
为注意力权重,为第i跳的子图编码向量,R
i
表示第i跳的关系向量,φ()表示传递操作函数,δ()为线性激活函数。
[0045]进一步地,对子图编码向量表示的序列进行打分时,打分函数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于关系有向图的知识推理方法,其特征在于,包括:获取三元组数据集合;将所述三元组数据集合中的所有三元组作为正三元组样本,并对所述正三元组样本进行负采样得到负三元组样本;对三元组样本和正三元组样本分别进行关系有向图编码,得到子图编码向量;其中,三元组样本包括正三元组样本和负三元组样本;对子图编码向量表示的序列进行打分,根据打分确定属于尾实体的序列。2.根据权利要求1所述的基于关系有向图的知识推理方法,其特征在于,获取三元组数据集合,包括:获取若干个三元组;为三元组中的实体和关系设置唯一的ID数值;将三元组中的实体和关系替换为对应的ID数值;将实体和关系替换为ID数值后的三元组组成三元组数据集合。3.根据权利要求1所述的基于关系有向图的知识推理方法,其特征在于,将所述三元组数据集合中的所有三元组作为正三元组样本,并对所述正三元组样本进行负采样得到负三元组样本,包括:分别将所述三元组数据集合中的每个三元组作为一个正三元组样本;对所述正三元组样本进行负采样,得到负三元组样本。4.根据权利要求3所述的基于关系有向图的知识推理方法,其特征在于,对所述正三元组样本进行负采样,得到负三元组样本,包括:设置关系对应尾实体所述概念的数据、关系的关系属性数据、实体对应概念的数据、概念对应实体的数据;根据关系属性数据确定正三元组样本中关系的关系类型,关系类型包括1

1关系、1

N关系、N

1关系和N

N关系;1

1关系表示一组头实体和关系只会对应1个尾实体,N

1关系表示N个头实体会对应同一组关系和尾实体,1

N关系表示一组头实体与关系会对应N个尾实体,N

N关系表示N组头实体与关系会对应N个尾实体;若正三元组样本中关系为1

1关系或N

1关系,则判断实体对应概念的数据中是否存在该正三元组样本中尾实体对应的概念;若实体对应概念的数据中存在该正三元组样本中尾实体对应的概念,则将该尾实体所属概念下除该尾实体之外的所有实体添加至预设的负样本集合中;若实体对应概念的数据中不存在该正三元组样本中尾实体对应的概念,则将该正三元组样本中关系所属概念下的所有实体添加至预设的负样本集合中;若正三元组样本中关系为1

N关系和N

N关系,则将该正三元组样本中关系所属概念下的实体集合与尾实体所属概念下的实体集合求差集,将该差集中所有实体添加至预设的负样本集合中;将负样本集合中的每个实体作为正三元组样本中尾实体的一个负样本;将正三元组样本中的尾实体替换为对应的负样本,得到负三元组样本。5.根据权利要求4所述的基于关系有向图的知识推理方法,其特征在于,对所述正三元组样本进行负采样,得到负三元组样本,还包括:
...

【专利技术属性】
技术研发人员:胡佳余安东张磊曾山松刘树光
申请(专利权)人:电信科学技术第五研究所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1