数据融合的方法及装置、存储介质和电子装置制造方法及图纸

技术编号:23239616 阅读:29 留言:0更新日期:2020-02-04 18:47
本发明专利技术提供了一种数据融合的方法及装置、存储介质和电子装置,其中,该方法包括:确定原始表中的字段与目标表中的字段之间的映射关系;根据所述映射关系和所述原始表中字段的优先级确定映射后的目标表中的字段的优先级;根据映射后的目标表中的优先级选择出优先级靠前的一个或多个字段写入所述目标表中的字段中。通过本发明专利技术,解决了相关技术中不存在如何自动将多个表中关于人的信息融合到一张目标表中的问题。

Data fusion method and device, storage medium and electronic device

【技术实现步骤摘要】
数据融合的方法及装置、存储介质和电子装置
本专利技术涉及计算机领域,具体而言,涉及一种数据融合的方法及装置、存储介质和电子装置。
技术介绍
在数据治理过程中,为了构建知识图谱,目标表一个属性的值很可能来源于多张原始表的多个属性中。例如:有目标表人(person),其中有三个字段分别是姓名(xm)、身份证号码(sfzhm)、曾用名(cym),根据身份证号码字段,在多张原始表中,可以分别关联到相关不同的信息,但是,每个不同来源的表中,很可能都包含姓名和曾用名字段。按照人的属性定义,每个人只能拥有一个姓名和多个曾用名,这就涉及到一个多值和唯一值的概念,姓名是一个唯一值,而曾用名可以是多值。那么,如何自动将多个表中关于人的信息融合到一张目标表(person)中,相关技术中还未存在有效的解决方案。
技术实现思路
本专利技术实施例提供了一种数据融合的方法及装置、存储介质和电子装置,以至少解决相关技术中不存在如何自动将多个表中关于人的信息融合到一张目标表中的问题。根据本专利技术的一个实施例,提供了一种数据融合的方法,包括:确定原始表中的字段与目标表中的字段之间的映射关系;根据所述映射关系和所述原始表中字段的优先级确定映射后的目标表中的字段的优先级;根据映射后的目标表中的优先级选择出优先级靠前的一个或多个字段写入所述目标表中的字段中。根据本专利技术的另一个实施例,提供了一种数据融合的装置,包括:第一确定模块,用于确定原始表中的字段与目标表中的字段之间的映射关系;第二确定模块,用于根据所述映射关系和所述原始表中字段的优先级确定映射后的目标表中的字段的优先级;选择模块,用于根据映射后的目标表中的优先级选择出优先级靠前的一个或多个字段写入所述目标表中的字段中。根据本专利技术的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。根据本专利技术的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。通过本专利技术,确定原始表中的字段与目标表中的字段之间的映射关系,并根据映射关系和原始表中字段的优先级确定映射后的目标表中的字段的优先级,最后根据映射后的目标表中的优先级选择出优先级靠前的一个或多个字段写入目标表中的字段中,解决了相关技术中不存在如何自动将多个表中关于人的信息融合到一张目标表中的问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是本专利技术实施例的一种数据融合的方法的终端的硬件结构框图;图2是根据本专利技术实施例的数据融合的方法的流程图;图3是根据本专利技术实施例的数据融合的示意图一;图4是根据本专利技术实施例的数据融合的示意图二;图5是根据本专利技术实施例的数据融合的示意图三;图6是根据本专利技术实施例的数据融合的装置的结构框图。具体实施方式下文中将参考附图并结合实施例来详细说明本专利技术。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。实施例1本申请实施例一所提供的方法实施例可以在终端、计算机终端或者类似的运算装置中执行。以运行在终端上为例,图1是本专利技术实施例的一种数据融合的方法的终端的硬件结构框图。如图1所示,终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述终端的结构造成限定。例如,终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本专利技术实施例中的数据融合的方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括终端10的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(NetworkInterfaceController,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(RadioFrequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。在本实施例中提供了一种运行于上述终端的数据融合的方法,图2是根据本专利技术实施例的数据融合的方法的流程图,如图2所示,该流程包括如下步骤:步骤S202,确定原始表中的字段与目标表中的字段之间的映射关系;步骤S204,根据映射关系和原始表中字段的优先级确定映射后的目标表中的字段的优先级;步骤S206,根据映射后的目标表中的优先级选择出优先级靠前的一个或多个字段写入目标表中的字段中。通过上述步骤S202至步骤S206,确定原始表中的字段与目标表中的字段之间的映射关系,并根据映射关系和原始表中字段的优先级确定映射后的目标表中的字段的优先级,最后根据映射后的目标表中的优先级选择出优先级靠前的一个或多个字段写入目标表中的字段中,解决了相关技术中不存在如何自动将多个表中关于人的信息融合到一张目标表中的问题。可选地,在本实施例中,对于步骤S204中涉及到的根据映射关系和原始表中字段的优先级确定映射后的目标表中的字段的优先级的方式,可以是:步骤S204-11,根据映射关系确定目标表中字段的初始优先级;步骤S204-12,根据初始优先级进行版本的加权计算得到目标表中字段的优先级排序。在本实施例的可选实施方式中,对于步骤S206中涉及到的根据映射后的目标表中的优先级选择出优先级靠前的一个或多个字段写入目标表中的字段中的方式包括:方式(1),在目标表中的字段为非多值属性的情况下,根据映射后的目标表中的优先级选择出优先级最高的字段写入目标表中的字段中。方式(2),在目标表中的字段为多值属性的情况下,根据映射后的目标表中的优先级选择出优先级最靠前或多个字的字段写本文档来自技高网...

【技术保护点】
1.一种数据融合的方法,其特征在于,包括:/n确定原始表中的字段与目标表中的字段之间的映射关系;/n根据所述映射关系和所述原始表中字段的优先级确定映射后的目标表中的字段的优先级;/n根据映射后的目标表中的优先级选择出优先级靠前的一个或多个字段写入所述目标表中的字段中。/n

【技术特征摘要】
1.一种数据融合的方法,其特征在于,包括:
确定原始表中的字段与目标表中的字段之间的映射关系;
根据所述映射关系和所述原始表中字段的优先级确定映射后的目标表中的字段的优先级;
根据映射后的目标表中的优先级选择出优先级靠前的一个或多个字段写入所述目标表中的字段中。


2.根据权利要求1所述的方法,其特征在于,根据所述映射关系和所述原始表中字段的优先级确定映射后的目标表中的字段的优先级,包括:
根据所述映射关系确定目标表中字段的初始优先级;
根据所述初始优先级进行版本的加权计算得到所述目标表中字段的优先级排序。


3.根据权利要求1所述的方法,其特征在于,根据映射后的目标表中的优先级选择出优先级靠前的一个或多个字段写入所述目标表中的字段中,包括:
在目标表中的字段为非多值属性的情况下,根据映射后的目标表中的优先级选择出优先级最高的字段写入所述目标表中的字段中。


4.根据权利要求1所述的方法,其特征在于,根据映射后的目标表中的优先级选择出优先级靠前的一个或多个字段写入所述目标表中的字段中,包括:
在目标表中的字段为多值属性的情况下,根据映射后的目标表中的优先级选择出优先级最靠前或多个字的字段写入所述目标表中的字段中。


5.一种数据融合的装置,其特征在于,包括:
第一确定模块,用于确定原始表中的字段与目标表中的字段之...

【专利技术属性】
技术研发人员:贾亮叶文涛
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1