当前位置: 首页 > 专利查询>福州大学专利>正文

一种联合逻辑规则和置信度的知识表示方法技术

技术编号:24123857 阅读:23 留言:0更新日期:2020-05-13 03:56
本发明专利技术涉及一种联合逻辑规则和置信度的知识表示方法,针对实时流入的动态知识碎片,若其已经存在于现有知识库中,则利用知识库训练好的模型进行知识推理;否则将其存入缓存区;当缓存区内数据满足预设条件时,将缓存区内的知识碎片加入知识库中,并对知识库重新进行模型训练。其训练包括在知识库上使用规则挖掘算法挖掘出知识库的Horn逻辑规则,为每条规则计算规则PCA置信度;根据规则的置信度结合概率软逻辑计算新推出的事实三元组的置信度;将融合逻辑规则语义信息的三元组联合置信度共同嵌入,提高知识表示的性能。本发明专利技术实现了不确定推理在动态知识图谱下的知识推理。

A knowledge representation method combining logical rules and confidence

【技术实现步骤摘要】
一种联合逻辑规则和置信度的知识表示方法
本专利技术涉及知识表示和知识推理领域,特别是一种联合逻辑规则和置信度的知识表示方法。
技术介绍
目前,基于逻辑规则的知识表示方法主要有AMIE、AMIE+和HornConcerto等等。这些方法主要采取应用推理规则到知识库中的手段,通过触发规则的前件来推导出新的事实。但这些基于逻辑规则的知识表示方法只考虑了知识图谱中的直接事实,忽略了知识图谱中逻辑规则隐藏的语义信息对于关系和实体的嵌入的重要影响。此外,针对不确定知识的知识表示方法有AR-TransE,该方法虽然在知识表示时考虑了三元组的置信度信息,但同样忽略了规则蕴含的语义信息。并且该方法选取规则置信度的最大值作为新推理事实的置信度,不能很好地代表推理新事实的置信度。信息量爆炸式增长的同时携带了大量的不确定性,现有的基于逻辑规则的知识表示方法不能很好地解决不确定性知识下的推理问题。并且现有的知识表示方法主要考虑知识图谱中的直接事实,忽略了逻辑规则蕴含的语义信息。同时,随着动态知识碎片的实时流入,现有模型未能很好地适应在动态知识图谱下的知识推理问题。
技术实现思路
有鉴于此,本专利技术的目的是提出一种联合逻辑规则和置信度的知识表示方法,实现了不确定推理在动态知识图谱下的知识推理。本专利技术采用以下方案实现:一种联合逻辑规则和置信度的知识表示方法,针对实时流入的动态知识碎片,若其已经存在于现有知识库中,则利用知识库训练好的模型进行知识推理;否则将其存入缓存区;当缓存区内数据满足预设条件时,将缓存区内的知识碎片加入知识库中,并对知识库重新进行模型训练。进一步地,所述缓存区内数据满足的预设条件为:缓存区内的知识碎片个数与知识库大小的比例大于预设值时。进一步地,所述对知识库重新进行模型训练具体包括以下步骤:步骤S1:在知识库上使用规则挖掘算法挖掘出知识库的Horn逻辑规则,为每条规则计算规则PCA置信度;步骤S2:应用挖掘出的Horn逻辑规则,代入具体实例推理出新的事实三元组,根据规则的置信度结合概率软逻辑计算新推出的事实三元组的置信度;步骤S3:针对由不同的规则推理出的同一事实,将该事实三元组的关系向量由不同规则的关系向量加权平均所取代,最后将融合逻辑规则语义信息的三元组联合置信度共同嵌入,提高知识表示的性能。进一步地,步骤S1还包括:通过设置置信度的阈值过滤掉不可信的规则。进一步地,步骤S2中,所述根据规则的置信度结合概率软逻辑计算新推出的事实三元组的置信度具体为:根据软逻辑公式p(a∧b)=p(a)·p(b)计算出规则的规则置信度p(R)公式为:p(R)=1-p(h1,r1,t1)p(h2,r2,t2)+p(h1,r1,t1)p(h2,r2,t2)p(h3,r3,t3);式中,a和b表示两个逻辑表达式,(hi,ri,ti)表示一个事实三元组,其中,hi表示头实体,ri表示关系,ti表示尾实体,i=1,2,3;由规则R推理出的新事实三元组(h3,r3,t3)的三元组置信度计算公式为:进一步地,步骤S2还包括:通过设置三元组置信度阈值多滤掉不可信三元组。与现有技术相比,本专利技术有以下有益效果:1、本专利技术考虑了知识图谱动态变化的特性,提出动态知识碎片激活策略,在一定程度上减少了模型迭代训练的次数,降低了训练代价,通过暂存知识碎片等待触发激活阈值后重新训练模型实现了不确定推理在动态知识图谱下的知识推理。2、现有的基于逻辑规则的知识表示方法不能很好地解决不确定性知识下的推理问题,并且现有的知识表示方法主要考虑知识图谱中的直接事实,忽略了逻辑规则蕴含的语义信息。本专利技术提出的算法联合逻辑规则和事实的不确定性共同嵌入,为每个关系和实体学习到更好的知识表示,通过规则的物化推理并结合概率软逻辑得到新的不确定事实以完善知识库,通过融合逻辑规则隐含的语义信息和事实三元组的置信度得分,能够充分利用逻辑规则蕴含的丰富语义信息对嵌入的影响,将其与事实置信度得分联合嵌入,完成更好地知识表示,提高知识推理的预测性能。附图说明图1为本专利技术实施例的方法框架示意图。图2为本专利技术实施例的关系的上下文示例图。图3为本专利技术实施例的逻辑规则示意图。图4为本专利技术实施例的6种逻辑规则示意图。其中(1)-(6)分别为六种不同的逻辑规则示意图。图5为本专利技术实施例的部分逻辑规则挖掘结果。图6为本专利技术实施例的部分推理出的新事实四元组实例。图7为本专利技术实施例的三种类型逻辑规则推理出同一事实p(x,y)示意图。图8为本专利技术实施例的知识推理举例图。具体实施方式下面结合附图及实施例对本专利技术做进一步说明。应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。如图1所示,本实施例提供了一种联合逻辑规则和置信度的知识表示方法,针对实时流入的动态知识碎片,若其已经存在于现有知识库中,则利用知识库训练好的模型进行知识推理;否则将其存入缓存区;当缓存区内数据满足预设条件时,将缓存区内的知识碎片加入知识库中,并对知识库重新进行模型训练。在本实施例中,所述缓存区内数据满足的预设条件为:缓存区内的知识碎片个数与知识库大小的比例大于预设值时。在本实施例中,所述对知识库重新进行模型训练具体包括以下步骤:步骤S1:在知识库上使用规则挖掘算法挖掘出知识库的Horn逻辑规则,为每条规则计算规则PCA置信度;步骤S2:应用挖掘出的Horn逻辑规则,代入具体实例推理出新的事实三元组,根据规则的置信度结合概率软逻辑计算新推出的事实三元组的置信度;步骤S3:针对由不同的规则推理出的同一事实,将该事实三元组的关系向量由不同规则的关系向量加权平均所取代,最后将融合逻辑规则语义信息的三元组联合置信度共同嵌入,提高知识表示的性能。在本实施例中,步骤S1还包括:通过设置置信度的阈值过滤掉不可信的规则。为了更好的对本实施例的步骤与原理进行说明,对以下定义进行说明。问题定义:给定一定规模的语义网络知识库KB,通过不确定性嵌入获得每个实体和关系的向量表示。定义1(RDF事实三元组,T):设T=(h,r,t)表示事实三元组,其中h表示头实体(headentity),r表示关系(relation),t表示尾实体(tailentity)。多个事实三元组T构成一个RDF知识库KB。定义2(RDF事实四元组,Q):设Q=(h,r,t,w)本文档来自技高网
...

【技术保护点】
1.一种联合逻辑规则和置信度的知识表示方法,其特征在于,针对实时流入的动态知识碎片,若其已经存在于现有知识库中,则利用知识库训练好的模型进行知识推理;否则将其存入缓存区;当缓存区内数据满足预设条件时,将缓存区内的知识碎片加入知识库中,并对知识库重新进行模型训练。/n

【技术特征摘要】
1.一种联合逻辑规则和置信度的知识表示方法,其特征在于,针对实时流入的动态知识碎片,若其已经存在于现有知识库中,则利用知识库训练好的模型进行知识推理;否则将其存入缓存区;当缓存区内数据满足预设条件时,将缓存区内的知识碎片加入知识库中,并对知识库重新进行模型训练。


2.根据权利要求1所述的一种联合逻辑规则和置信度的知识表示方法,其特征在于,所述缓存区内数据满足的预设条件为:缓存区内的知识碎片个数与知识库大小的比例大于预设值时。


3.根据权利要求1所述的一种联合逻辑规则和置信度的知识表示方法,其特征在于,所述对知识库重新进行模型训练具体包括以下步骤:
步骤S1:在知识库上使用规则挖掘算法挖掘出知识库的Horn逻辑规则,为每条规则计算规则PCA置信度;
步骤S2:应用挖掘出的Horn逻辑规则,代入具体实例推理出新的事实三元组,根据规则的置信度结合概率软逻辑计算新推出的事实三元组的置信度;
步骤S3:针对由不同的规则推理出的同一事实,将该事实三元组的关系向量由不同规则的关系向量加权平均所取代,最后将融合逻辑规则语义信息的三元组联合置信度共同...

【专利技术属性】
技术研发人员:汪璟玢林静
申请(专利权)人:福州大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1