【技术实现步骤摘要】
一种基于知识图谱的数据推理方法、装置、服务器和介质
本说明书实施例涉及互联网
,尤其涉及一种基于知识图谱的数据推理方法、装置、服务器和介质。
技术介绍
在具有海量数据的平台上,数据量庞大,数据之间存在着复杂的相互关系,可以根据知识图谱对数据之间的关系进行推理。由于知识图谱中存在大量需要推理获得的知识,将这些推理结果补充到知识图谱数据体系中,能够对数据进行更好的扩展。
技术实现思路
本说明书实施例提供了一种基于知识图谱的数据推理方法和装置。第一方面,本说明书实施例提供一种基于知识图谱的数据处理方法,所述方法包括:获得知识图谱的输入实例数据;将预设的多个推理规则根据彼此之间的推理依赖关系划分为两个以上批次规则,不同批次规则具有不同的运行优先级;按照各批次的运行优先级从高到低,采用分布式迭代方式顺次运行各批次规则进行推理,获得所述知识图谱的汇总推理结果;其中,运行第一批次规则进行推理时,针对的输入数据为所述输入实例数据;运行第二批次及第二批次以上的规则进行推理时,针对的输入数据为上一批次规则输出的推理结果与所述输入实例数据。第二方面,本说明书实施例提供一种基于知识图谱的数据推理装置,所述装置包括:第一输入实例数据获得单元,用于获得知识图谱的输入实例数据;推理规则批次划分单元,用于将预设的多个推理规则根据彼此之间的推理依赖关系划分为两个以上批次规则,不同批次规则具有不同的运行优先级;第一汇总推理结果获得单元,用于按照各批次的运行优先级从高到低,采用分布式迭代方式顺次运行各批次规则进行推理,获得所述知识图谱的汇总推理结果;其中,运行第一批次规则进行推理时,针对的输 ...
【技术保护点】
1.一种基于知识图谱的数据处理方法,所述方法包括:获得知识图谱的输入实例数据;将预设的多个推理规则根据彼此之间的推理依赖关系划分为两个以上批次规则,不同批次规则具有不同的运行优先级;按照各批次的运行优先级从高到低,采用分布式迭代方式顺次运行各批次规则进行推理,获得所述知识图谱的汇总推理结果;其中,运行第一批次规则进行推理时,针对的输入数据为所述输入实例数据;运行第二批次及第二批次以上的规则进行推理时,针对的输入数据为上一批次规则输出的推理结果与所述输入实例数据。
【技术特征摘要】
1.一种基于知识图谱的数据处理方法,所述方法包括:获得知识图谱的输入实例数据;将预设的多个推理规则根据彼此之间的推理依赖关系划分为两个以上批次规则,不同批次规则具有不同的运行优先级;按照各批次的运行优先级从高到低,采用分布式迭代方式顺次运行各批次规则进行推理,获得所述知识图谱的汇总推理结果;其中,运行第一批次规则进行推理时,针对的输入数据为所述输入实例数据;运行第二批次及第二批次以上的规则进行推理时,针对的输入数据为上一批次规则输出的推理结果与所述输入实例数据。2.如权利要求1所述的方法,所述不同批次规则具有不同的运行优先级包括:所述运行优先级具体为依赖数,所述依赖数越小对应的所述运行优先级越高,不同批次规则具有不同的依赖数,同一批次规则具有相同的所述依赖数,规则的所述依赖数表明该规则对其他规则的依赖程度,所述依赖数与依赖程度正相关。3.如权利要求1所述的方法,所述获得知识图谱的输入实例数据包括:获得知识图谱的原始输入实例数据;根据预设的多个推理规则进行数据处理,获得知识图谱的输入实例数据。4.如权利要求1所述的方法,采用所述分布式迭代方式运行单个批次规则进行推理的过程具体包括:运用分布式计算对输入数据应用本批次规则进行初始化,获得推理未结束的中间数据或推理已结束的待检查数据;根据数据的特征相关性,采用归纳的方式对所述中间数据和所述输入数据应用本批次规则进行再次推理,通过N轮迭代推理直到输出的数据中不再包含中间数据为止,其中,N为正整数;对各轮迭代推理输出的待检查数据进行检验,如检验成功,输出运行本批次规则的推理结果,用以作为运行下一批次规则推理的输入数据的一部分。5.如权利要求1所述的方法,一所述推理规则包括规则体,其中,所述规则体包括一个或多个子目标,其中,所述子目标具有一赋值语句。6.如权利要求5所述的方法,所述分布式迭代方式为MapReduce。7.一种基于知识图谱的数据推理装置,所述装置包括:第一输入实例数据获得单元,用于获得知识图谱的输入实例数据;推理规则批次划分单元,用于将预设的多个推理规则根据彼此之间的推理依赖关系划分为两个以上批次规则,不同批次规则具有不同的...
【专利技术属性】
技术研发人员:阳云,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。