【技术实现步骤摘要】
一种结合逻辑规则和碎片化知识的关系预测方法
本专利技术涉及一种结合逻辑规则和碎片化知识的关系预测方法。
技术介绍
在关系推理领域,以TransE[1]为代表的关系推理模型,因其简单而高效,同时具有良好的预测性能而成为近年来研究热点。TransE模型采用直接对知识库中的事实三元组(h,r,t)进行建模,其基本思路是将知识库中的实体和关系映射到一个低维连续向量空间中,从而简化知识库的相关计算。基本的表示学习模型虽然简单高效,但因仅仅考虑了知识库中的直接事实三元组(h,r,t),而忽略了知识库中隐藏的语义信息,使得推理精度有限。近期的一些工作利用添加外部数据,比如实体类型、文本描述、逻辑规则等来进一步提升推理精度。文献[2]通过引入关系的定义域和值域来过滤掉一些错误样本,减少噪声数据对模型的影响。文献[3]则考虑向表示学习模型添加实体上下文信息,从而提升模型的语义表达能力。文献[4]通过对额外的文本信息和知识库中的直接事实三元组进行统一建模,从而提升其推理性能。文献[5]首先通过规则挖掘系统提取一组可表示知识库语义信息的Horn逻 ...
【技术保护点】
1.一种结合逻辑规则和碎片化知识的关系预测方法,其特征在于,首先对事实三元组和逻辑规则进行统一的建模,将隐藏的语义信息嵌入到基于知识表示的关系推理模型中;其次,结合碎片化知识,不断迭代更新,使得知识库变得越加完备。/n
【技术特征摘要】
1.一种结合逻辑规则和碎片化知识的关系预测方法,其特征在于,首先对事实三元组和逻辑规则进行统一的建模,将隐藏的语义信息嵌入到基于知识表示的关系推理模型中;其次,结合碎片化知识,不断迭代更新,使得知识库变得越加完备。
2.根据权利要求1所述的一种结合逻辑规则和碎片化知识的关系预测方法,其特征在于,该方法具体实现如下:
第一阶段:对知识库中的直接事实三元组进行建模,得到知识库中所有实体和关系的向量表达,用于第三阶段计算规则间的语义关联度;
第二阶段:通过规则挖掘算法挖掘出一组可代表知识库语义信息的逻辑规则;
第三阶段:应用逻辑规则推理阶段,有两种方式:一是通过基于逻辑规则的物化推理,推理出新的事实并添加到知识库中,实现知识库的动态扩充;二是将事实三元组(h,r,t)中的关系r用逻辑规则取代表示,从而将逻辑规则嵌入到基于表示学习的关系推理模型中,h、t均表示实体;由于知识库中存在多条以关系r为规则头的推理规则,因此,提出以关系r为规则头的不同规则体与关系r之间语义关联度的方法;
第四阶段:基于第一阶段至第三阶段三个阶段的输出作为第四阶段的输入,对事实三元组和逻辑规则进行统一建模,通过这一方式,将逻辑规则丰富的语义信息嵌入到基于表示学习的关系推理模型RTransE中,紧接着通过训练好的RTransE模型进行关系推理,实现对知识库的补全;
第五阶段:结合动态知识碎片,不断迭代更新,使得知识库变得越加完备。
3.根据权利要求2所述的一种结合逻辑规则和碎片化知识的关系预测方法,其特征在于,第四阶段中,对事实三元组和逻辑规则进行统一建模的过程如下:
给定一个三元组(h,r,t),当三元组成立时,TransE模型满足以下关系:h+r≈t;在||h+r-t||1的基础上对三元组得分函数进行归一化改进,如下公式(1)所示:
式(1)中D(h,r,t)=||h+r-t||1为距离函数,可以很容易看出f(h,r,t)∈[0,1],如果三元组成立,则f(h,r,t)应尽可能小,反之则尽可能大;
该模型使用知识库中现有的事实三元组作为正例,随机替换头尾实体和关系产生的与知识库现有事实相矛盾的三元组作为负例进行训练,三元组建模损失函数如下公式(2)所示:
式(2)中,S={s1,s2,...si,...sn}为事实三元组的集合,为正例三元组的集合,为负例三元组的集合,γ是表示一个可调整的超参数。
4.根据权利要求3所述的一种结合逻辑规则和碎片化知识的关系预测方法,其特征在于,第四阶段中,将逻辑规则丰富的语义信息嵌入到基于表示学习的关系推理模型RTransE的具体过程如下:
嵌入逻辑规则联合表示的距离函数如下公式(3)所示:
k为以关系r为规则头的第i条逻辑规则的规则体个数;Bi为第i条逻辑规则的规...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。