当前位置: 首页 > 专利查询>山东大学专利>正文

基于规则间关联的知识图谱数据扩展方法及系统技术方案

技术编号:34149431 阅读:24 留言:0更新日期:2022-07-14 19:46
本发明专利技术提供了一种基于规则间关联的知识图谱数据扩展方法及系统,其属于知识图谱表示技术领域,所述方案包括:获取待处理的知识图谱,从中抽取逻辑规则,实现规则池的构建;计算每条逻辑规则的置信度,并基于所述置信度计算逻辑规则间关联的置信度;对所述逻辑规则进行实例化,获得候选三元组,基于规则约束的优化方法计算每个候选三元组的软标签;基于所述软标签将获得的候选三元组与原始知识图谱构建为新知识图谱,基于所述新知识图谱,采用基于图神经网络的编码器获得实体表示向量,并基于表示学习的解码器获得所述新知识图谱中的关系向量表示,进行缺失三元组成立可能性预测;迭代执行上述步骤,直至满足收敛条件,获得最终的知识图谱。终的知识图谱。终的知识图谱。

Method and system of knowledge map data expansion based on association between rules

【技术实现步骤摘要】
基于规则间关联的知识图谱数据扩展方法及系统


[0001]本专利技术属于知识图谱表示
,尤其涉及一种基于规则间关联的知识图谱数据扩展方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]传统的知识图谱表示方法主要直推式地预测缺失三元组,要求所有的实体在模型训练阶段出现过。然而,在现实的场景中,知识图谱中的知识范围在不断扩大,原有知识图谱之外的实体(OOKG entities)在不断出现。例如,在著名知识图谱DBpedia中,每天都有200多个新实体出现。如图1所示,展示了原有知识图谱之外的实体出现和相关事实预测的例子,给定观察到的知识图谱,假设“太阳”这个实体是新出现的,并且存在一个辅助三元组连接原有知识图谱中的实体(observed entity)和新出现实体“太阳”,即(太阳,被围绕,行星)。接下来,基于观察到的事实和辅助三元组,目标是表示原有知识图谱之外的实体,并预测这些实体缺失的三元组(例如,(太阳,吸引,质量))。然而,为了表示这些新出现的实体,大多数传统的知识表示框架不可避免地需要重新训练模型,非常耗时。
[0004]现有方案虽然聚合了新出现实体周围的邻居信息,来表示新出现实体,但是这些框架面临严重的数据稀疏性问题;为了解决该问题,GEN和HRFN设计了元学习(meta learning)和图神经网络(graph neural network)的结合框架在元训练阶段模拟新实体出现的情况,这些方法利用了新出现实体之间的三元组,然而这些三元组往往缺失或者非常稀疏。VN网络利用逻辑规则和对称路径规则,预测新出现实体的虚拟邻居,从而缓解数据稀疏性问题;但是,专利技术人发现,上述方法主要建模了新出现实体一到两跳的领居结构信息,或者通过挖掘规则来增强预测效果,而忽略了很多其它的有用特征;同时,现有方法将规则置信分数(rule confidence)设为定值,或者利用启发式的规则挖掘方法,其严重忽略了规则挖掘、规则推理及表示学习三个过程之间的关系。

技术实现思路

[0005]本专利技术为了解决上述问题,提供了一种基于规则间关联的知识图谱数据扩展方法及系统,所述方案将知识图谱中逻辑规则间的关联关系引入知识图谱中新出现实体相关事实的预测中,提高了预测精确度,同时,通过对规则挖掘、规则推理、和表示学习三个过程之间的交互信息进行建模,有效提高了逻辑规则的挖掘效率和知识表示的质量。
[0006]根据本专利技术实施例的第一个方面,提供了一种基于规则间关联的知识图谱数据扩展方法,包括:步骤1:获取原始知识图谱,通过对所述知识图谱进行遍历获取逻辑规则,实现规则池的构建;步骤2:计算每条逻辑规则的置信度分数,并基于所述置信度分数计算逻辑规则间
关联的置信度分数;步骤3:对所述逻辑规则进行实例化,获得候选三元组,基于规则约束的优化方法计算每个候选三元组的软标签;其中,所述规则约束基于逻辑规则的置信度分数以及逻辑规则间关联的置信度分数确定;步骤4:基于所述软标签将获得的候选三元组与原始知识图谱构建为新知识图谱,基于所述新知识图谱,采用基于图神经网络的编码器获得实体表示向量,并基于表示学习的解码器获得所述新知识图谱中的关系向量表示;基于所述实体表示向量及所述关系向量表示预测新知识图谱中缺失三元组成立可能性;步骤5:迭代执行所述步骤2至步骤4,直至满足收敛条件,获得最终的知识图谱。
[0007]进一步的,所述基于规则约束的优化方法计算每个候选三元组的软标签,具体采用如下目标函数:其中,C为常数,t
vn
为包含虚拟邻居的三元组,s(t
vn
)为t
vn
的软标签(求解该优化问题得到),I(t
vn
)为t
vn
的真实值(由计算得到),,为松弛变量,为完整逻辑规则的置信度分数,为逻辑规则间关联的置信度分数,为逻辑规则,为实例化后的规则间关联。
[0008]进一步的,所述逻辑规则包括规则头和规则体;所述规则头对应于知识图谱中的三元组;所述规则体对应于规则头的头实体到尾实体之间的路径。
[0009]进一步的,所述计算每条逻辑规则的置信度分数,基于所述逻辑规则中规则头和规则体所对应路径的相似度进行计算。
[0010]进一步的,所述逻辑规则间关联采用如下方式获得:基于逻辑规则的规则体中是否存在缺失三元组,判断所述逻辑规则为完整逻辑规则或不完整逻辑规则;实例化所述逻辑规则,基于路径搜索算法获取所述完整逻辑规则与不完整规则之间的关联路径。
[0011]进一步的,所述对所述知识图谱进行遍历获取逻辑规则,具体基于路径搜索算法获得。
[0012]根据本专利技术实施例的第二个方面,提供了一种基于规则间关联的知识图谱数据扩展系统,包括:规则池构建单元,其用于获取原始知识图谱,通过对所述知识图谱进行遍历获取逻辑规则,实现规则池的构建;置信度计算单元,其用于计算每条逻辑规则的置信度分数,并基于所述置信度分
数计算逻辑规则间关联的置信度分数;规则推理单元,其用于对所述逻辑规则进行实例化,获得候选三元组,基于规则约束的优化方法计算每个候选三元组的软标签;其中,所述规则约束基于逻辑规则的置信度分数以及逻辑规则间关联的置信度分数确定;表示学习单元,其用于基于所述软标签将获得的候选三元组与原始知识图谱构建为新知识图谱,基于所述新知识图谱,采用基于图神经网络的编码器获得实体表示向量,并基于表示学习的解码器获得所述新知识图谱中的关系向量表示;基于所述实体表示向量及所述关系向量表示预测新知识图谱中缺失三元组成立可能性;迭代优化单元,其用于迭代执行所述置信度计算单元、规则推理单元及表示学习单元的步骤,直至满足收敛条件,获得最终的知识图谱。
[0013]根据本专利技术实施例的第三方面,提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如上所述的一种基于规则间关联的知识图谱数据扩展方法。
[0014]根据本专利技术实施例的第四方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如上所述的一种基于规则间关联的知识图谱数据扩展方法。
[0015]与现有技术相比,本专利技术的有益效果是:(1)本专利技术所述方案提供了一种基于规则间关联的知识图谱数据扩展方法及系统,所述方案将知识图谱中逻辑规则间的关联关系引入知识图谱中新出现实体相关事实的预测中,提高了预测精确度,同时,通过对规则挖掘、规则推理、和表示学习三个过程之间的交互信息进行建模,有效提高了逻辑规则的挖掘效率和知识表示的质量。
[0016](2)所述方案有效识别了知识图谱中逻辑规则及逻辑规则间关联关系,挖掘出更多与新出现实体有关的结构信息,进一步提高了对新出现实体相关事实的预测精确度。
[0017]本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0018]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于规则间关联的知识图谱数据扩展方法,其特征在于,包括:步骤1:获取待处理的知识图谱,通过对所述知识图谱进行遍历获取逻辑规则,实现规则池的构建;步骤2:计算每条逻辑规则的置信度分数,并基于所述置信度分数计算逻辑规则间关联的置信度分数;步骤3:对所述逻辑规则进行实例化,获得候选三元组,基于规则约束的优化方法计算每个候选三元组的软标签;其中,所述规则约束基于逻辑规则的置信度分数以及逻辑规则间关联的置信度分数确定;步骤4:基于所述软标签将获得的候选三元组与原始知识图谱构建为新知识图谱,基于所述新知识图谱,采用基于图神经网络的编码器获得实体表示向量,并基于表示学习的解码器获得所述新知识图谱中的关系向量表示;基于所述实体表示向量及所述关系向量表示预测新知识图谱中缺失三元组成立可能性;步骤5:迭代执行所述步骤2至步骤4,直至满足收敛条件,获得最终的知识图谱。2.如权利要求1所述的一种基于规则间关联的知识图谱数据扩展方法,其特征在于,所述基于规则约束的优化方法计算每个候选三元组的软标签,具体采用如下目标函数:其中,C为常数,t
vn
为包含虚拟邻居的三元组,s(t
vn
)为t
vn
的软标签,通过求解该优化问题得到;I(t
vn
)为t
vn
的真实值,由计算得到;,为松弛变量,为完整逻辑规则的置信度分数,为逻辑规则间关联的置信度分数,为逻辑规则,为实例化后的规则间关联。3.如权利要求1所述的一种基于规则间关联的知识图谱数据扩展方法,其特征在于,所述逻辑规则包括规则头和规则体;所述规则头对应于知识图谱中的三元组;所述规则体对应于规则头的头实体到尾实体之间的路径。4.如权利要求1所述的一种基于规则间关联的知识图谱数据扩展方法,其特征在于,所述计算每条逻辑规则的置信度分数,基于所述逻辑规则中规则头和规则体所对应路径的相似度进行计算。5.如权利要求1所述的一种基于规则间关联的知识图谱数据扩展方法,其特征在于,所述逻辑规则间关联采用如下方式获得:基于逻辑规则的规则体中是否存在缺失三元组,判断所述逻辑规则为完整逻辑规则或不完整逻辑规则;实例化所述逻辑规则,基于路径搜索方法获取所述完整逻辑规则与不完整规则之间的
关联...

【专利技术属性】
技术研发人员:任昭春王梓涵任鹏杰陈竹敏
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1