一种基于多向语义的知识图谱复杂关系推理方法技术

技术编号:28226991 阅读:16 留言:0更新日期:2021-04-28 10:03
本发明专利技术提供了一种基于多向语义的知识图谱复杂关系推理方法,将知识图谱的训练样本数据集中的实体映射为两组低维空间向量表示;将知识图谱的训练样本数据集中的关系映射为两组低维空间向量和一维参数表示;随机选择知识图谱的训练样本数据集中的实体,替换训练样本正三元组的实体,生成训练负样本数据;根据训练样本正三元组和生成的训练负样本,定义训练过程中的目标函数;将训练样本数据集中的实体映射结果和关系映射结果分别带入目标函数,优化得到知识图谱中每个实体或关系对应的向量表示;利用优化得到的向量表示,计算知识图谱三元组中实体和关系之间的距离值,并根据距离值进行关系推理。本发明专利技术提高了对复杂关系的推理效果。理效果。理效果。

【技术实现步骤摘要】
一种基于多向语义的知识图谱复杂关系推理方法


[0001]本专利技术涉及人工智能中知识图谱
,具体地,涉及一种利用人工智能表示学习方法对知识图谱中复杂关系进行推理的方法。

技术介绍

[0002]随着人工智能技术的发展,知识图谱越来越得到学术界和工业界的关注,知识图谱在未来人工智能发展中起着举足轻重的作用。知识图谱是以头实体、尾实体及其之间存在的关系组成的三元组为基本单元,其中实体可以是现实世界中的实体,比如具体人名、地名、机构等,也可以代表属性的属性值或概念,比如某颜色等,关系可以是两个实体和实体之间的现实关系,比如夫妻关系、从属关系,也可以是实体和属性值之间的关系,比如年龄等。但随着互联网发展,每时每刻都在产生大量的数据,其中就产生大量的三元组知识,以至于每个实体会与其他实体之间存在复杂的关系。随着构建知识图谱规模的不断扩大,知识图谱内复杂的关系无法采取人工的方式进行补全。所以针对知识图谱关系推理补全问题出现了的大量相关研究。其中出现了一些将实体和关系映射为低维向量,再利用向量关系进行推理的研究,常称为表示学习方法,比如TransE、TransH和TransR等关系推理方法。虽然这些模型在某些方面表现出其优势和创新,但是这些模型在利用语义信息进行复杂关系推理时,只考虑关系推实体的语义影响,没有考虑实体对实体的语义影响以及实体对关系的语义影响。比如(人类,吃,蔬菜)学习语义表示向量时,“人类”的语义信息应该受到“蔬菜”和“吃”的语义影响,同理“蔬菜”的语义信息同样应该受到“人类”和“吃”的影响,这样致使学习到的语义向量表示实体或关系语义信息不充分,最终影响对复杂关系的推理效果。

技术实现思路

[0003]本专利技术针对现有技术中存在的上述不足,提供了一种基于多向语义的知识图谱复杂关系推理方法。
[0004]本专利技术是通过以下技术方案实现的。
[0005]一种基于多向语义的知识图谱复杂关系推理方法,包括:将知识图谱的训练样本数据集中的实体映射为两组低维空间向量表示;将知识图谱的训练样本数据集中的关系映射为两组低维空间向量和一维参数表示;随机选择知识图谱的训练样本数据集中的实体,替换训练样本正三元组的实体,生成训练负样本数据;根据训练样本正三元组和生成的训练负样本,定义训练过程中的目标函数为:式中,,其中表示正三元
组的距离函数,表示正三元组的对应负样本的距离函数;其中:或或式中,表示头实体对应于本身固有属性对应的语义信息表示,不因本身的性质影响尾实体或关系的语义信息表示;表示关系本身固有属性对应的语义信息表示,头实体或尾实体的固有属性对应的语义信息不因其而变化;表示尾实体对应于本身固有属性对应的语义信息表示,不因本身的性质影响头实体或关系的语义信息表示,关系或尾实体的固有属性对应的语义信息不因其而变化;表示头实体由于在三元组内对三元组内的关系和尾实体产生的语义影响,当关系和尾实体固定时,对关系和尾实体的影响随着头实体变化而变化;表示关系在三元组内对三元组内的头实体和尾实体产生的语义影响,头实体和尾实体固定时,对头尾实体的影响随着关系变化而变化;表示尾实体由于在三元组内对三元组内的关系和头实体产生的语义影响,当关系和头实体固定时,对关系和头实体的影响随着尾实体变化而变化;表示作为关系的动作本身受到头实体使动和尾实体被动信息的影响,同时应受到自身固有属性的影响,用来区分表示实体和关系;表示非线性变换,对应于注意力机制;表示一个m维的单位向量;为距离公式;将训练样本数据集中的实体映射结果和关系映射结果分别带入目标函数,优化得到知识图谱中每个实体或关系对应的向量表示;利用优化得到的向量表示,计算知识图谱三元组中实体和关系之间的距离值,并根据距离值进行关系推理。
[0006]优选地,所述将知识图谱的训练样本数据集中的实体映射为两组低维空间向量两组向量,包括:设知识图谱的训练样本数据集中的实体集合中共有n个实体,其中每一个实体映射为一个m维的向量和一个m维的向量。
[0007]优选地,对于知识图谱中的训练样本数据集中的实体集合中的每一个实体映射为向量和向量分别随机初始化为一个m维的向量,并限制其模长为1。
[0008]优选地,所述将知识图谱的训练样本数据集中的关系映射为两组低维空间向量和一维参数表示,包括:
设知识图谱的训练样本数据集中的关系集合中共有t个关系,其中每一个关系映射为一个m维度的向量、一个m维的向量和一个一维参数。
[0009]优选地,对于知识图谱中的训练样本数据集中的关系集合中的每一个关系映射为向量和向量分别随机初始化为一个m维的向量,并限制其模长为1,同时随机初始化一个一维参数。
[0010]优选地,所述生成训练负样本数据的方法,包括:对于训练样本中的正三元组S(h,r,t),随机从实体集合中选择一个实体,并随机替换三元组中的头实体h或尾实体t,生成负样本数据集;其中,其中,为设知识图谱的训练样本数据集中的关系集合。
[0011]优选地,将训练样本数据集中的实体映射结果和关系映射结果分别带入目标函数,对知识图谱中的实体与关系进行训练;经过训练后,最终得到每个实体或关系对应的映射向量,利用映射向量获得实体之间是否满足某种关系的可能性。
[0012]优选地,所述利用优化得到的向量表示,计算知识图谱三元组中实体和关系之间的距离值,包括:得到每组向量后,利用距离函数计算头实体h、关系r和尾实体t之间的距离大小;当距离值趋向于0时,判断知识图谱三元组为正三元组,获得其中所示关系;当距离值趋向于无穷大时,推荐候选实体进行知识图谱关系补全,并重新计算头实体h、关系r和尾实体t之间的距离大小。
[0013]根据本专利技术的另一个方面,提供了一种终端,包括存储器、处理器及存储在存储器上并能够在处理器上运行的计算机程序,所述处理器执行所述计算机程序时能够用于执行上述任一项所述的方法。
[0014]根据本专利技术的第三个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可用于执行上述任一项所述的方法。
[0015]由于采用了上述技术方案,与现在技术相比,本专利技术具有如下有益效果:本专利技术提供的基于多向语义的知识图谱复杂关系推理方法,在学习每个实体或关系对应的语义向量时,充分考虑实体在三元组内受到的多向语义影响,同时关系语义向量受到实体的语义影响,从而习得的向量更能表示每个实体或关系对应的语义信息。本专利技术提供的基于多向语义的知识图谱复杂关系推理方法,能够更好的模拟不同实体或关系在不同三元组“环境”下的语义信息,提高对复杂关系的推理效果。
附图说明
[0016]通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1为本专利技术一优选实施例中基于多向语义的知识图谱复杂关系推理方法流程
图。
具体实施方式
[0017]下面对本专利技术的实施例作详细说明:本实施例在以本专利技术技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程。应当指出的是,对本领域的普通本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多向语义的知识图谱复杂关系推理方法,其特征在于,包括:将知识图谱的训练样本数据集中的实体映射为两组低维空间向量表示;将知识图谱的训练样本数据集中的关系映射为两组低维空间向量和一维参数表示;随机选择知识图谱的训练样本数据集中的实体,替换训练样本正三元组的实体,生成训练负样本数据;根据训练样本正三元组和生成的训练负样本,定义训练过程中的目标函数为:式中,,表示正三元组的距离函数,表示正三元组的对应负样本的距离函数;其中:或或式中,表示头实体对应于本身固有属性对应的语义信息表示,不因本身的性质影响尾实体或关系的语义信息表示;表示关系本身固有属性对应的语义信息表示,头实体或尾实体的固有属性对应的语义信息不因其而变化;表示尾实体对应于本身固有属性对应的语义信息表示,不因本身的性质影响头实体或关系的语义信息表示,关系或尾实体的固有属性对应的语义信息不因其而变化;表示头实体由于在三元组内对三元组内的关系和尾实体产生的语义影响,当关系和尾实体固定时,对关系和尾实体的影响随着头实体变化而变化;表示关系在三元组内对三元组内的头实体和尾实体产生的语义影响,头实体和尾实体固定时,对头尾实体的影响随着关系变化而变化;表示尾实体由于在三元组内对三元组内的关系和头实体产生的语义影响,当关系和头实体固定时,对关系和头实体的影响随着尾实体变化而变化;表示作为关系的动作本身受到头实体使动和尾实体被动信息的影响,同时应受到自身固有属性的影响,用来区分表示实体和关系;表示非线性变换,对应于注意力机制;表示一个m维的单位向量;为距离公式;将训练样本数据集中的实体映射结果和关系映射结果分别带入目标函数,优化得到知识图谱中每个实体或关系对应的向量表示;
利用优化得到的向量表示,计算知识图谱三元组中实体和关系之间的距离值,并根据距离值进行关系推理。2.根据权利要求1所述的基于多向语义的知识图谱复杂关系推理方法,其特征在于,所述将知识图谱的训练样本数据集中的实体映射为两组低维空间向量两组向量,包括:设知识图谱的训练样本数据集中的实体集合中共有n个实体,其中每一个实体映射为一个m维的向量和一个m维的向量。3.根据权利要求2所述的基于多向语义的知识图谱复杂关系推理方法,其特征在于,对于知识图谱中的训练样...

【专利技术属性】
技术研发人员:姜华杨世辉田济东郦一天胡博文
申请(专利权)人:上海旻浦科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1