基于带类型关系路径嵌入的事实溯因推理方法技术

技术编号:23432110 阅读:46 留言:0更新日期:2020-02-25 13:17
本发明专利技术涉及一种基于带类型关系路径嵌入模型的对附带OWL 2 DL本体的知识图谱进行事实溯因推理的方法,属于人工智能领域。本发明专利技术的主要特征在于先根据知识图谱中的事实和附带的OWL 2 DL本体计算知识图谱中所有长度不超过人工设定的邻域阈值ρ的频繁关系路径,再根据知识图谱蕴含的事实和负采样的虚假事实学习预测知识图谱事实的带类型关系路径的嵌入模型,最后根据给定的观察事实,计算最大可能推导观察事实的带类型关系路径,并将该带类型关系路径转换成带变量的三元组集合计算给定事实的溯因解释。发明专利技术内容主要包括频繁关系路径集的计算、虚假事实的负采样、带类型关系路径的嵌入模型学习,以及最大可能推导给定事实的带类型关系路径的计算。本发明专利技术为附带复杂而不完备本体的知识图谱提供一种实用的事实溯因推理方式,适用于知识图谱的事实验证,保证知识图谱的构建质量。

A method of fact abduction based on path embedding with type relation

【技术实现步骤摘要】
基于带类型关系路径嵌入的事实溯因推理方法
本专利技术涉及一种基于带类型关系路径嵌入模型的对附带OWL2DL本体的知识图谱进行事实溯因推理的方法,属于人工智能领域。该方法适用于知识图谱的事实验证,保证知识图谱的构建质量。
技术介绍
知识图谱(KnowledgeGraph)旨在描述客观世界的概念、实体、事件及其之间的关系,可以简单地表示为(实体,关系,实体)三元组的集合。2012年5月,谷歌公司发布谷歌知识图谱(GoogleKnowledgeGraph),并以此为基础构建下一代的语义搜索引擎。这是“知识图谱”名称的由来,也标志着大规模知识图谱将在语义搜索中得到广泛的应用。谷歌知识图谱的发布一石激起千层浪,微软必应、搜狗、百度等搜索引擎公司在短短一年内也纷纷发布了各自的知识图谱产品,如百度“知心”、搜狗“知立方”(现改名为“立知”)等等。随后,以社交为主战场的腾讯开始构建自己的社交知识图谱,以电商为主战场的阿里巴巴也利用自身的商业数据优势构建自己的商品知识图谱。据报道,目前国内除了BAT三大巨头外,不少知识图谱创业公司也逐步发展起来,并在智能客服、金本文档来自技高网...

【技术保护点】
1.一种基于带类型关系路径嵌入的事实溯因推理方法,在附带OWL 2 DL本体的知识图谱中为给定的观察事实计算溯因解释,其中溯因解释定义为最小的三元组集合,将其添加到知识图谱中能推断出观察事实并维持与附带本体的逻辑一致性;该方法的特征在于包含以下三个阶段:/n阶段1根据知识图谱中的事实和附带的OWL 2 DL本体,计算知识图谱中所有长度不超过人工设定的邻域阈值ρ的频繁关系路径,其中事实指的是个体关系三元组(个体,属性,个体)或个体类型三元组(个体,rdf:type,类),关系路径指的是属性序列(属性

【技术特征摘要】
1.一种基于带类型关系路径嵌入的事实溯因推理方法,在附带OWL2DL本体的知识图谱中为给定的观察事实计算溯因解释,其中溯因解释定义为最小的三元组集合,将其添加到知识图谱中能推断出观察事实并维持与附带本体的逻辑一致性;该方法的特征在于包含以下三个阶段:
阶段1根据知识图谱中的事实和附带的OWL2DL本体,计算知识图谱中所有长度不超过人工设定的邻域阈值ρ的频繁关系路径,其中事实指的是个体关系三元组(个体,属性,个体)或个体类型三元组(个体,rdf:type,类),关系路径指的是属性序列(属性1,属性2,…,属性n),关系路径的长度是指路径上属性的个数,我们称属性序列(属性1,属性2,…,属性n)为知识图谱中连接个体a和个体b的关系路径,当且仅当存在个体序列(a,a1,…,an-1,b)使如下n个个体关系三元组(a,属性1,a1)、(a1,属性2,a2)、…、(an-1,属性n,b)能在附带的OWL2DL本体下被知识图谱所蕴含;此外,我们称知识图谱中某个关系路径是频繁的,当且仅当知识图谱中该关系路径连接的个体对(a,b)的数量不小于人工设定的支持数阈值θ;
阶段2根据知识图谱蕴含的事实和负采样的虚假事实来学习用于事实预测的带类型关系路径的嵌入模型,其中任带类型关系路径的嵌入是指该带类型关系路径的实值向量表示,个体关系三元组(a,属性,b)对应的带类型关系路径形式为(a,属性1,类1,属性2,类2,…,属性n-1,类n-1,属性n,b),个体类型三元组(a,rdf:type,类)对应的带类型关系路径形式为(a,属性1,类1,属性2,类2,…,属性n-1,类n-1,属性n,类n),这里涉及的关系路径(属性1,属性2,…,属性n-1,属性n)限定为阶段1计算得到的频繁关系路径;
阶段3对给定的观察事实进行溯因推理,即根据给定的观察事实,计算最大可能推导该事实的带类型关系路径,并将该带类型关系路径转换成带变量的三元组集合,集合的任意真子集进行常量替换变成能被知识图谱所蕴含的事实集合,真子集的补集进行相同的常量替换后充当观察事实的候选溯因解释;若将候选溯因解释添加到知识图谱中能维持与附带本体的逻辑一致性,并且将该候选溯因解释的任意直接真子集添加到知识图谱中都不能在附带本体下蕴含观察事实,则该候选溯因解释是一个所求的溯因解释。


2.根据权利要求1中提出的基于带类型关系路径嵌入的事实溯因推理方法,其特征在于阶段1中采用的计算频繁关系路径的方法是先计算在附带的OWL2DL本体下知识图谱能蕴含的所有事实,然后针对每个个体,通过宽度优先搜索在蕴含事实集对应的有向图中计算从该个体出发的长度不大于邻域阈值ρ的关系路径,再统计各条关系路径的端点处的个体对,最后针对各条访问过的关系路径统计端点处出...

【专利技术属性】
技术研发人员:杜剑峰
申请(专利权)人:广东外语外贸大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1