【技术实现步骤摘要】
基于关系有向图的知识推理方法及装置
[0001]本专利技术属于知识图谱领域,特别是涉及一种基于关系有向图的知识推理方法及装置。
技术介绍
[0002]知识图谱包含了真实世界客体、人物、概念等的交互,使得人工智能和人类知识有更多的连接。这种连接以事实三元组(头实体,关系,尾实体)的形式表示实体间的关系。知识图谱通常包含大量的知识,但是高度不完整,因此,推理新的事实成为一个挑战。知识推理就是根据已有事实模拟推理新的事实的一个过程。知识推理现已广泛应用于语义搜索、智能推荐和对话系统等领域。目前知识推理技术存在以下不足:
[0003](1)在已有的知识库补全模型中,预测实体之间的链接通常依赖少量的实时数据,忽略了有价值的常识知识。并且已有的知识库嵌入技术存在无效的下采样问题和事实链接预测的不确定性,影响了知识库补全的性能。
[0004](2)在知识库补全的技术中,通常以基于逻辑规则推理和基于路径推理为主,不能提供常识语义,有价值的常识需要花费大量的人工标注,所以其高成本导致相对的低知识补全率。
[0005](3)已有的基于子图推理的方法通常是通过对一个给定的查询进行剪枝,将图中不相关的实体去掉,而不是学习特定的局部结构,故无法推理得到更多的知识信息。
技术实现思路
[0006]本专利技术的目的在于克服现有技术的不足,提供一种基于关系有向图的知识推理方法及装置。
[0007]本专利技术的目的是通过以下技术方案来实现的:基于关系有向图的知识推理方法,包括:
[0008]获取 ...
【技术保护点】
【技术特征摘要】
1.基于关系有向图的知识推理方法,其特征在于,包括:获取三元组数据集合;将所述三元组数据集合中的所有三元组作为正三元组样本,并对所述正三元组样本进行负采样得到负三元组样本;对三元组样本和正三元组样本分别进行关系有向图编码,得到子图编码向量;其中,三元组样本包括正三元组样本和负三元组样本;对子图编码向量表示的序列进行打分,根据打分确定属于尾实体的序列。2.根据权利要求1所述的基于关系有向图的知识推理方法,其特征在于,获取三元组数据集合,包括:获取若干个三元组;为三元组中的实体和关系设置唯一的ID数值;将三元组中的实体和关系替换为对应的ID数值;将实体和关系替换为ID数值后的三元组组成三元组数据集合。3.根据权利要求1所述的基于关系有向图的知识推理方法,其特征在于,将所述三元组数据集合中的所有三元组作为正三元组样本,并对所述正三元组样本进行负采样得到负三元组样本,包括:分别将所述三元组数据集合中的每个三元组作为一个正三元组样本;对所述正三元组样本进行负采样,得到负三元组样本。4.根据权利要求3所述的基于关系有向图的知识推理方法,其特征在于,对所述正三元组样本进行负采样,得到负三元组样本,包括:设置关系对应尾实体所述概念的数据、关系的关系属性数据、实体对应概念的数据、概念对应实体的数据;根据关系属性数据确定正三元组样本中关系的关系类型,关系类型包括1
‑
1关系、1
‑
N关系、N
‑
1关系和N
‑
N关系;1
‑
1关系表示一组头实体和关系只会对应1个尾实体,N
‑
1关系表示N个头实体会对应同一组关系和尾实体,1
‑
N关系表示一组头实体与关系会对应N个尾实体,N
‑
N关系表示N组头实体与关系会对应N个尾实体;若正三元组样本中关系为1
‑
1关系或N
‑
1关系,则判断实体对应概念的数据中是否存在该正三元组样本中尾实体对应的概念;若实体对应概念的数据中存在该正三元组样本中尾实体对应的概念,则将该尾实体所属概念下除该尾实体之外的所有实体添加至预设的负样本集合中;若实体对应概念的数据中不存在该正三元组样本中尾实体对应的概念,则将该正三元组样本中关系所属概念下的所有实体添加至预设的负样本集合中;若正三元组样本中关系为1
‑
N关系和N
‑
N关系,则将该正三元组样本中关系所属概念下的实体集合与尾实体所属概念下的实体集合求差集,将该差集中所有实体添加至预设的负样本集合中;将负样本集合中的每个实体作为正三元组样本中尾实体的一个负样本;将正三元组样本中的尾实体替换为对应的负样本,得到负三元组样本。5.根据权利要求4所述的基于关系有向图的知识推理方法,其特征在于,对所述正三元组样本进行负采样,得到负三元组样本,还包括:
...
【专利技术属性】
技术研发人员:胡佳,余安东,张磊,曾山松,刘树光,
申请(专利权)人:电信科学技术第五研究所有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。