一种基于知识图谱的数据推理方法、装置、服务器和介质制造方法及图纸

技术编号:20272744 阅读:30 留言:0更新日期:2019-02-02 03:44
本说明书实施例提供了一种基于知识图谱的数据推理方法、装置、服务器和介质,通过依据知识图谱规则推理特点,将数据进行多批次规则迭代推理,得到一种适用于知识图谱的规则推理的方案。

【技术实现步骤摘要】
一种基于知识图谱的数据推理方法、装置、服务器和介质
本说明书实施例涉及互联网
,尤其涉及一种基于知识图谱的数据推理方法、装置、服务器和介质。
技术介绍
在具有海量数据的平台上,数据量庞大,数据之间存在着复杂的相互关系,可以根据知识图谱对数据之间的关系进行推理。由于知识图谱中存在大量需要推理获得的知识,将这些推理结果补充到知识图谱数据体系中,能够对数据进行更好的扩展。
技术实现思路
本说明书实施例提供了一种基于知识图谱的数据推理方法和装置。第一方面,本说明书实施例提供一种基于知识图谱的数据处理方法,所述方法包括:获得知识图谱的输入实例数据;将预设的多个推理规则根据彼此之间的推理依赖关系划分为两个以上批次规则,不同批次规则具有不同的运行优先级;按照各批次的运行优先级从高到低,采用分布式迭代方式顺次运行各批次规则进行推理,获得所述知识图谱的汇总推理结果;其中,运行第一批次规则进行推理时,针对的输入数据为所述输入实例数据;运行第二批次及第二批次以上的规则进行推理时,针对的输入数据为上一批次规则输出的推理结果与所述输入实例数据。第二方面,本说明书实施例提供一种基于知识图谱的数据推理装置,所述装置包括:第一输入实例数据获得单元,用于获得知识图谱的输入实例数据;推理规则批次划分单元,用于将预设的多个推理规则根据彼此之间的推理依赖关系划分为两个以上批次规则,不同批次规则具有不同的运行优先级;第一汇总推理结果获得单元,用于按照各批次的运行优先级从高到低,采用分布式迭代方式顺次运行各批次规则进行推理,获得所述知识图谱的汇总推理结果;其中,运行第一批次规则进行推理时,针对的输入数据为所述输入实例数据;运行第二批次及第二批次以上的规则进行推理时,针对的输入数据为上一批次规则输出的推理结果与所述输入实例数据。第三方面,本说明书实施例提供一种服务器,包括存储器、推理器及存储在存储器上并可在推理器上运行的计算机程序,所述推理器执行所述程序时实现权利要求1-6任一项所述方法的步骤。第四方面,本说明书实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被推理器执行时实现权利要求1-6任一项所述方法的步骤。本说明书实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:本说明书实施例通过依据知识图谱规则推理特点,通过图谱节点划分将数据进行多批次规则迭代推理适应于分布式计算环境,得到一种适用于知识图谱的规则推理的方案,解决了大规模知识推理的时间和空间开销过大而无法实现的问题,达到了能够在分布式环境下做迭代推理,能够应用到大规模推理的技术效果。上述说明仅是本说明书实施例技术方案的概述,为了能够更清楚了解本说明书实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本说明书实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本说明书实施例的具体实施方式。附图说明图1为本说明书实施例中一种基于知识图谱的数据推理应用场景示意图;图2为本说明书实施例中一种基于知识图谱的数据推理方法的流程示意图;图3是本说明书实施例中单个批次规则数据推理方法的流程示意图;图4是本说明书实施例中又一种基于知识图谱的数据推理方法的流程示意图;图5是本说明书实施例中再一种基于知识图谱的数据推理方法的流程示意图;图6为本说明书实施例中一种基于知识图谱的数据推理装置的结构示意图;图7为本说明书实施例中一种基于知识图谱的数据推理服务器结构示意图。具体实施方式为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。本说明书实施例提供了一种基于知识图谱的数据推理方法,用于解决大规模知识推理的时间和空间开销过大而无法实现的问题。在本说明书实施例的技术方案中,通过依据知识图谱规则推理特点,将数据进行多批次规则迭代推理,得到一种适用于知识图谱的规则推理的方案,达到了能够在分布式环境下做迭代推理,能够应用到大规模推理的技术效果。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。实施例一图1为本说明书实施例提供的基于知识图谱的数据推理应用场景示意图,终端100位于用户侧,与网络侧的服务器200通信。终端100中的客户端101可以是基于互联网实现业务的APP或网站,为用户提供知识图谱数据的界面并将数据提供给网络侧进行推理;服务器200将推理后的数据发送至使所述客户端101。本说明书实施例提供的一种基于知识图谱的数据推理方法围绕领域知识图谱数据体系和算法,可以支撑金融、保险、客服,企业等应用场景,构建图谱数据应用生态,图2为本说明书实施例中一种基于知识图谱的数据推理方法的流程示意图。如图2所示,包括:步骤110,获得知识图谱的输入实例数据;具体的,可以根据预设的多个推理规则进行数据处理,获得知识图谱的输入实例数据。因为图谱中的原始输入数据有很多跟后续推理无关,所以可以先根据后续规则要用到的内容过滤掉无关的图谱数据,剩下徐亚的输入实例数据进入后续步骤进行推理。进一步的,一所述推理规则包括规则体,其中,所述规则体包括一个或多个子目标,其中,所述子目标具有一赋值语句。具体而言,知识图谱(KnowledgeGraph/Vault)又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。具体来说,知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。在本说明书实施例中,首选需得到推理所需的初始输入数据,即知识图谱的输入实例数据,在此之前,需要先获得所属知识图谱的原始输入实例数据,并对所述原始输入实例数据进行预处理,根据预设的多个推理规则对原始输入实例数据进行数据过滤,将不符合所述预设的多个推理规则的原始输入实例数据剔除,使得剩余的原始输入实例数据符合所述预设的多个推理规则,这些符合所述预设的多个推理规则的原始输入实例数据即作为知识图谱的输入实例数据。其中,所述预设的多个推理规则可以为符合所述知识图谱的DataLog规则,DataLog规则属于一种受限的Prolog语言,DataLog是一种基于逻辑的编程语言,是Prolog的一种适应于知识库的改进形式语言,它是一阶谓词逻辑中Horn子句逻辑的一种受限形式,只允许变量或常亮作为谓词的自变元。DataLog的语句由事实和规则组成,同Prolog一样,它可以实现对知识库的演绎推理,即可本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的数据处理方法,所述方法包括:获得知识图谱的输入实例数据;将预设的多个推理规则根据彼此之间的推理依赖关系划分为两个以上批次规则,不同批次规则具有不同的运行优先级;按照各批次的运行优先级从高到低,采用分布式迭代方式顺次运行各批次规则进行推理,获得所述知识图谱的汇总推理结果;其中,运行第一批次规则进行推理时,针对的输入数据为所述输入实例数据;运行第二批次及第二批次以上的规则进行推理时,针对的输入数据为上一批次规则输出的推理结果与所述输入实例数据。

【技术特征摘要】
1.一种基于知识图谱的数据处理方法,所述方法包括:获得知识图谱的输入实例数据;将预设的多个推理规则根据彼此之间的推理依赖关系划分为两个以上批次规则,不同批次规则具有不同的运行优先级;按照各批次的运行优先级从高到低,采用分布式迭代方式顺次运行各批次规则进行推理,获得所述知识图谱的汇总推理结果;其中,运行第一批次规则进行推理时,针对的输入数据为所述输入实例数据;运行第二批次及第二批次以上的规则进行推理时,针对的输入数据为上一批次规则输出的推理结果与所述输入实例数据。2.如权利要求1所述的方法,所述不同批次规则具有不同的运行优先级包括:所述运行优先级具体为依赖数,所述依赖数越小对应的所述运行优先级越高,不同批次规则具有不同的依赖数,同一批次规则具有相同的所述依赖数,规则的所述依赖数表明该规则对其他规则的依赖程度,所述依赖数与依赖程度正相关。3.如权利要求1所述的方法,所述获得知识图谱的输入实例数据包括:获得知识图谱的原始输入实例数据;根据预设的多个推理规则进行数据处理,获得知识图谱的输入实例数据。4.如权利要求1所述的方法,采用所述分布式迭代方式运行单个批次规则进行推理的过程具体包括:运用分布式计算对输入数据应用本批次规则进行初始化,获得推理未结束的中间数据或推理已结束的待检查数据;根据数据的特征相关性,采用归纳的方式对所述中间数据和所述输入数据应用本批次规则进行再次推理,通过N轮迭代推理直到输出的数据中不再包含中间数据为止,其中,N为正整数;对各轮迭代推理输出的待检查数据进行检验,如检验成功,输出运行本批次规则的推理结果,用以作为运行下一批次规则推理的输入数据的一部分。5.如权利要求1所述的方法,一所述推理规则包括规则体,其中,所述规则体包括一个或多个子目标,其中,所述子目标具有一赋值语句。6.如权利要求5所述的方法,所述分布式迭代方式为MapReduce。7.一种基于知识图谱的数据推理装置,所述装置包括:第一输入实例数据获得单元,用于获得知识图谱的输入实例数据;推理规则批次划分单元,用于将预设的多个推理规则根据彼此之间的推理依赖关系划分为两个以上批次规则,不同批次规则具有不同的...

【专利技术属性】
技术研发人员:阳云
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1