更新知识图谱的方法、装置、设备及存储介质制造方法及图纸

技术编号:23932963 阅读:48 留言:0更新日期:2020-04-25 02:07
本申请实施例提供的一种更新知识图谱的方法、装置、设备及存储介质,该方法通过获取初始知识图谱中的业务数据;按照预设规则抽取所述业务数据中的实体数据;对所述实体数据进行数据融合处理,以得到与所述实体数据对应的数据源集合,其中,所述数据源集合包括至少一个数据源;将所述数据源集合中的每个所述数据源与对应的所述业务数据进行匹配;根据每个所述数据源与所述业务数据的匹配结果,对所述业务数据进行更新。本申请实施例实现了知识图谱的自动更新及自动融合,无需人工手动去维护知识图谱,提高了知识图谱的更新效率及准确率。

Methods, devices, equipment and storage media for updating knowledge map

【技术实现步骤摘要】
更新知识图谱的方法、装置、设备及存储介质
本申请涉及数据处理
,尤其涉及一种更新知识图谱的方法、装置、设备及存储介质。
技术介绍
目前对知识进行有效表达的方法是知识图谱,知识图谱是将现实世界以图形的方式展现概念和概念间的关系,不仅帮助人们认识客观世界,而且也为计算机定义了实现的数据模型,它将复杂的知识表示成网状结构,可以对数据进行复杂查询,可以通过规则从关联的数据中挖掘出隐含的信息,揭示知识以及领域的动态发展规律,为知识以及技术的研究提供切实、有价值的参考。相关技术在对知识图谱进行构建和数据更新时,通常是人工手动构建知识图谱和更新知识图谱的数据,存在准确率较低以及耗时长的问题。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请实施例提供了一种更新知识图谱的方法、装置、设备及存储介质。有鉴于此,第一方面,本申请实施例提供了一种更新知识图谱的方法,所述方法包括以下步骤:获取初始知识图谱中的业务数据;按照预设规则抽取所述业务数据中的实体数据;对所述实体数据进行数据融合处理,以得到与所述实体数据对应的数据源集合,其中,所述数据源集合包括至少一个数据源;将所述数据源集合中的每个所述数据源与对应的所述业务数据进行匹配;根据每个所述数据源与所述业务数据的匹配结果,对所述业务数据进行更新。结合第一方面,在第一方面第一种可能的实施方式中,所述按照预设规则抽取所述业务数据中的实体数据,包括:抽取所述业务数据中的三元组数据。结合第一方面,在第一方面第二种可能的实施方式中,所述数据融合处理包括数据层融合处理,所述对所述实体数据进行数据融合处理,以得到与所述实体数据对应的数据源集合,包括:利用所述初始知识图谱的链接结构,构建各个所述实体数据之间的实体关联模型;基于所述实体关联模型,对各个所述实体数据进行实体链接;根据实体链接的结果,获取与所述实体数据对应的数据源集合。结合第一方面,在第一方面第三种可能的实施方式中,所述数据融合处理包括语义融合处理,所述对所述实体数据进行数据融合处理,以得到与所述实体数据对应的数据源集合,包括:利用所述初始知识图谱的链接结构,构建每个所述实体数据中的多个语义的语义关联模型;基于语义关联模型,将各个所述语义进行语义链接;根据语义链接的结果,获取与所述实体数据对应的数据源集合。结合第一方面,在第一方面第四种可能的实施方式中,所述将所述数据源集合中的每个所述数据源与对应的所述业务数据进行匹配,包括:基于所述数据源的权威度、冗余度、多样性、一致性以及MLN验证中的一种或多种,将所述数据源集合中的每个所述数据源与对应的所述业务数据进行匹配。第二方面,本申请实施例提供了一种更新知识图谱的装置,结合第二方面,在第二方面第一种可能的实施方式中,所述装置包括:获取单元,用于获取初始知识图谱中的业务数据;抽取单元,用于按照预设规则抽取所述业务数据中的实体数据;数据处理单元,用于对所述实体数据进行数据融合处理,以得到与所述实体数据对应的数据源集合,其中,所述数据源集合包括至少一个数据源;匹配单元,用于将所述数据源集合中的每个所述数据源与对应的所述业务数据进行匹配;以及更新单元,用于根据每个所述数据源与所述业务数据的匹配结果,对所述业务数据进行更新。结合第二方面,在第二方面第二种可能的实施方式中,所述抽取单元包括:抽取子单元,用于抽取所述业务数据中的三元组数据。结合第二方面,在第二方面第三种可能的实施方式中,所述数据处理单元包括:第一构建子单元,用于利用所述初始知识图谱的链接结构,构建各个所述实体数据之间的实体关联模型;实体链接子单元,用于基于所述实体关联模型,对各个所述实体数据进行实体链接;第一获取子单元,用于根据实体链接的结果,获取与所述实体数据对应的数据源集合。结合第二方面,在第二方面第四种可能的实施方式中,所述数据处理单元包括:第二构建子单元,用于利用所述初始知识图谱的链接结构,构建每个所述实体数据中的多个语义的语义关联模型;语义链接子单元,用于基于语义关联模型,将各个所述语义进行语义链接;第二获取子单元,用于根据语义链接的结果,获取与所述实体数据对应的数据源集合。第三方面,本申请实施例提供了一种终端设备,所述终端设备包括:至少一个处理器、存储器、至少一个网络接口和用户接口;所述至少一个处理器、存储器、至少一个网络接口和用户接口通过总线系统耦合在一起;所述处理器通过调用所述存储器存储的程序或指令,用于执行如第一方面所述的更新知识图谱的方法的步骤。第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有更新知识图谱的程序,所述更新知识图谱的程序被处理器执行时实现如第一方面所述的更新知识图谱的方法的步骤。本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例提供的该方法,通过获取初始知识图谱中的业务数据;按照预设规则抽取所述业务数据中的实体数据;对所述实体数据进行数据融合处理,以得到与所述实体数据对应的数据源集合,其中,所述数据源集合包括至少一个数据源;将所述数据源集合中的每个所述数据源与对应的所述业务数据进行匹配;根据每个所述数据源与所述业务数据的匹配结果,对所述业务数据进行更新。本申请实施例实现了知识图谱的自动更新及自动融合,无需人工手动去维护知识图谱,提高了知识图谱的更新效率及准确率。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种更新知识图谱的方法的流程示意图;图2为本申请实施例提供的一种更新知识图谱的方法的流程示意图;图3为本申请实施例提供的一种更新知识图谱的方法的流程示意图;图4为本申请实施例提供的一种更新知识图谱的装置的结构示意图;图5为本申请实施例提供的一种终端设备的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。现在将参考附图描述实现本专利技术各个实施例的服务器。在后续的描述中,使本文档来自技高网...

【技术保护点】
1.一种更新知识图谱的方法,其特征在于,所述方法包括以下步骤:/n获取初始知识图谱中的业务数据;/n按照预设规则抽取所述业务数据中的实体数据;/n对所述实体数据进行数据融合处理,以得到与所述实体数据对应的数据源集合,其中,所述数据源集合包括至少一个数据源;/n将所述数据源集合中的每个所述数据源与对应的所述业务数据进行匹配;/n根据每个所述数据源与所述业务数据的匹配结果,对所述业务数据进行更新。/n

【技术特征摘要】
1.一种更新知识图谱的方法,其特征在于,所述方法包括以下步骤:
获取初始知识图谱中的业务数据;
按照预设规则抽取所述业务数据中的实体数据;
对所述实体数据进行数据融合处理,以得到与所述实体数据对应的数据源集合,其中,所述数据源集合包括至少一个数据源;
将所述数据源集合中的每个所述数据源与对应的所述业务数据进行匹配;
根据每个所述数据源与所述业务数据的匹配结果,对所述业务数据进行更新。


2.根据权利要求1所述的方法,其特征在于,所述按照预设规则抽取所述业务数据中的实体数据,包括:
抽取所述业务数据中的三元组数据。


3.根据权利要求1所述的方法,其特征在于,所述数据融合处理包括数据层融合处理,所述对所述实体数据进行数据融合处理,以得到与所述实体数据对应的数据源集合,包括:
利用所述初始知识图谱的链接结构,构建各个所述实体数据之间的实体关联模型;
基于所述实体关联模型,对各个所述实体数据进行实体链接;
根据实体链接的结果,获取与所述实体数据对应的数据源集合。


4.根据权利要求1或3所述的方法,其特征在于,所述数据融合处理包括语义融合处理,所述对所述实体数据进行数据融合处理,以得到与所述实体数据对应的数据源集合,包括:
利用所述初始知识图谱的链接结构,构建每个所述实体数据中的多个语义的语义关联模型;
基于语义关联模型,将各个所述语义进行语义链接;
根据语义链接的结果,获取与所述实体数据对应的数据源集合。


5.根据权利要求1所述的方法,其特征在于,所述将所述数据源集合中的每个所述数据源与对应的所述业务数据进行匹配,包括:
基于所述数据源的权威度、冗余度、多样性、一致性以及MLN验证中的一种或多种,将所述数据源集合中的每个所述数据源与对应的所述业务数据进行匹配。


6.一种更新知识图谱的装置,其特征在于,所述装置包括:
获取单元,用于获取初始知识图谱中的业务数据;...

【专利技术属性】
技术研发人员:赵鹏辉贾巨涛戴林胡广绪李明杰
申请(专利权)人:珠海格力电器股份有限公司珠海联云科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1