数据匹配方法及装置、存储介质及电子终端制造方法及图纸

技术编号:24331277 阅读:52 留言:0更新日期:2020-05-29 19:41
本公开涉及计算机技术领域,具体涉及一种数据匹配方法、一种数据匹配装置、一种存储介质以及一种电子终端。所述方法包括:获取目标对象的待处理数据,所述待处理数据包括待处理实体信息和各待处理实体关系信息;获取所述目标对象对应的知识图谱子图集合;将所述待处理实体与所述知识图谱子图集合进行匹配,以筛选目标图谱。本方法可以通过利用目标对象的知识图谱对待处理数据进行数据挖掘,准确的获取实体之间关系信息,提升相关性数据的匹配效率,并提高逻辑判断的准确率。

Data matching method and device, storage medium and electronic terminal

【技术实现步骤摘要】
数据匹配方法及装置、存储介质及电子终端
本公开涉及计算机
,具体涉及一种数据匹配方法、一种数据匹配装置、一种存储介质以及一种电子终端。
技术介绍
知识图谱是具有图形结构的知识库,可以以图形格式链接来自各种来源和各种学科的各种类型和结构的知识模块,提供基于多学科中的各种元数据具有可扩展深度和广度的知识系统。实现将真实世界中存在的各种实体、概念以及它们之间的关系用图的形式加以描述,从而为信息处理提供知识基础。知识图谱已经成为人工智能的关键技术之一,被广泛应用于智能搜索、自动问答、个性化推荐、数据挖掘等应用中。现有技术方案在对某种疾病的疾病数据进行相关性探索时,大多需要以人工的方式查找医学指南,确定相关信息。并且需要统计大量临床患者的相关医疗数据。这样的方式存在一定的缺陷,例如,在根据医学指南处理时,容易偏离实际。而临床研究的失效较慢,并且容易受到样本的局限性影响。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种数据匹配方法、一种数据匹配装置、一种存储介质以及一种电子终端,可以利用知识图谱对相关数据进行逻辑匹配,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的第一方面,提供一种数据匹配方法,包括:获取目标对象的待处理数据,所述待处理数据包括待处理实体信息和各待处理实体关系信息;获取所述目标对象对应的知识图谱子图集合;将所述待处理实体与所述知识图谱子图集合进行匹配,以筛选目标图谱。在本公开的一种示例性实施例中,所述目标对象对应的知识图谱子图集合的构建方法包括:获取所述目标对象的基础源数据,并根据所述基础源数据构建所述目标对象的知识图谱;对所述目标对象的知识图谱进行筛选,以获取包含多个第一实体的第一实体集合;根据所述第一实体集合对所述知识图谱进行子图划分获取对应的多个子图,以基于多个子图生成知识图谱子图集合。在本公开的一种示例性实施例中,所述获取所述目标对象的基础源数据,包括:获取多个私有云存储的所述目标对象的原始数据;对所述原始数据进行纳排、脱敏处理以获取合并数据;对所述筛选后的原始数据进行合并以获取合并数据;基于预设的归一化辞典对所述合并数据进行归一化处理以获取所述目标对象的基础源数据。在本公开的一种示例性实施例中,所述基于所述基础源数据构建所述目标对象的知识图谱,包括:对所述基础源数据进行识别,并确定所述基础源数据中的实体信息,以及关系信息;其中,所述实体信息包括实体,以及所述实体的属性信息,所述关系信息包括所述实体之间的关系信息以及所述实体之间关系的触发条件;基于所述实体信息和关系信息构建所述目标对象的知识图谱。在本公开的一种示例性实施例中,所述根据所述第一实体集合对所述知识图谱进行子图划分获取对应的多个子图,包括:由所述第一实体集合抽取一第一实体作为起点,对所述知识图谱执行目标深度的广度优先遍历,以获取该第一实体对应的子图,并将所述第一实体由所述第一实体集合中清除;读取所述第一实体集合,若所述第一实体集合包括若干个所述第一实体,则抽取一所述第一实体作为起点,对所述知识图谱执行目标深度的广度优先遍历,以获取该第一实体对应的子图,并将所述第一实体由所述第一实体集合中清除;或者若所述第一实体集合为空,则停止抽取所述第一实体,以获取所述知识图谱对应的至少一个子图。在本公开的一种示例性实施例中,所述获取该第一实体对应的子图后,所述方法还包括:读取所述子图,若所述子图包含第一实体,将该第一实体添加至第二实体集合中;由所述第二实体集合中选取一所述第一实体作为起点,对所述知识图谱执行目标深度的广度优先遍历,以获取该第一实体对应的第二子图,将所述第二子图添加至所述子图;并将所述第一实体由所述子实体集合中清除;若所述第二实体集合为空,则停止在所述第二实体集合中抽取所述第一实体,以获取所述子图。在本公开的一种示例性实施例中,所述将所述待处理实体与所述知识图谱子图集合进行匹配,以筛选目标图谱,包括:将所述待处理实体与所述知识图谱子图集合进行匹配,以获取各所述待处理实体对应的多组匹配实体和匹配关系信息;根据所述待处理实体及对应的关系信息对所述多组匹配实体和匹配关系信息进行评估,以筛选所述目标图谱。根据本公开的第二方面,提供一种数据匹配装置,包括:待处理数据获取模块,用于获取目标对象的待处理数据,并对所述待处理数据进行标记以获取待处理实体,以及各待处理实体对应的关系信息;子图集合获取模块,用于获取所述目标对象对应的知识图谱子图集合;匹配模块,用于将所述待处理实体与所述知识图谱子图集合进行匹配,以筛选目标图谱根据本公开的第三方面,提供一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的数据匹配方法。根据本公开的第四方面,提供一种电子终端,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行时实现上述的数据匹配方法。本公开的一种实施例所提供的数据匹配方法中,通过对目标对象的待处理数据进行标记来获取待处理数据包含的实体信息和关系信息;再将该些实体信息和关系信息与已获取的知识图谱子图集合进行匹配,进而确定待处理数据对应的目标图谱。通过利用目标对象的既有知识图谱对待处理数据进行数据挖掘,可以准确的获取待处理数据所包含的各实体之间的触发条件和其他关系信息,提升相关性数据的匹配效率,并提高逻辑判断的准确率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示意性示出本公开示例性实施例中一种数据匹配方法示意图;图2示意性示出本公开示例性实施例中一种知识图谱子图集合的构建方法的示意图;图3示意性示出本公开示例性实施例中一种对子图内容进行读取和判断的方法的示意图;图4示意性示出本公开示例性实施例中另一种数据匹配方法示意图;图5示意性示出本公开示例性实施例中一种数据匹配装置组成示意图;图6示意性示出本公开示例性实施例中一种电子终端的组成示意图;图7示意性示出本公开示例性实施例中一种存储介质的示意图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够本文档来自技高网...

【技术保护点】
1.一种数据匹配方法,其特征在于,包括:/n获取目标对象的待处理数据,所述待处理数据包括待处理实体信息和各待处理实体关系信息;/n获取所述目标对象对应的知识图谱子图集合;/n将所述待处理实体与所述知识图谱子图集合进行匹配,以筛选目标图谱。/n

【技术特征摘要】
1.一种数据匹配方法,其特征在于,包括:
获取目标对象的待处理数据,所述待处理数据包括待处理实体信息和各待处理实体关系信息;
获取所述目标对象对应的知识图谱子图集合;
将所述待处理实体与所述知识图谱子图集合进行匹配,以筛选目标图谱。


2.根据权利要求1所述的数据匹配方法,其特征在于,所述目标对象对应的知识图谱子图集合的构建方法包括:
获取所述目标对象的基础源数据,并基于所述基础源数据构建所述目标对象的知识图谱;
对所述目标对象的知识图谱进行筛选,以获取包含多个第一实体的第一实体集合;
根据所述第一实体集合对所述知识图谱进行子图划分获取对应的多个子图,以基于多个子图生成知识图谱子图集合。


3.根据权利要求2所述的数据匹配方法,其特征在于,所述获取所述目标对象的基础源数据,包括:
获取多个私有云存储的所述目标对象的原始数据;
对所述原始数据进行纳排、脱敏处理以获取合并数据;
对所述筛选后的原始数据进行合并以获取合并数据;
基于预设的归一化辞典对所述合并数据进行归一化处理以获取所述目标对象的基础源数据。


4.根据权利要求2所述的数据匹配方法,其特征在于,所述基于所述基础源数据构建所述目标对象的知识图谱,包括:
对所述基础源数据进行识别,并确定所述基础源数据中的实体信息,以及关系信息;其中,所述实体信息包括实体,以及所述实体的属性信息,所述关系信息包括所述实体之间的关系信息以及所述实体之间关系的触发条件;
基于所述实体信息和关系信息构建所述目标对象的知识图谱。


5.根据权利要求2所述的数据匹配方法,其特征在于,所述根据所述第一实体集合对所述知识图谱进行子图划分获取对应的多个子图,包括:
由所述第一实体集合抽取一第一实体作为起点,对所述知识图谱执行目标深度的广度优先遍历,以获取该第一实体对应的子图,并将所述第一实体由所述第一实体集合中清除;
读取所述第一实体集合,若所述第一实体集合包括若干个所述第一实体,则抽取一所述...

【专利技术属性】
技术研发人员:李潇郎超刘水清
申请(专利权)人:南京医康科技有限公司南京懿医云大数据科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1