数据处理方法、装置、电子设备和存储介质制造方法及图纸

技术编号:27807633 阅读:13 留言:0更新日期:2021-03-30 09:27
本申请揭示了一种数据处理方法、装置、电子设备和存储介质,涉及计算机技术领域。该数据处理方法包括获取进行索引合并的两个用户证件数据、用户证件数据所属的证件类型,两个用户证件数据来自不同的数据系统;根据用户证件数据所属的证件类型,确定用户证件数据中需要进行校验的各个目标字段、各个目标字段对应的权重以及证件类型的用户证件数据对应的第一相似度阈值;比对两个用户证件数据包含的各个目标字段中的字段值。本申请的数据处理方法适用于用户医疗信息查询场景或用户个人信息查询场景。本申请提出的技术方案避免了对用户某个证件类型的用户证件数据进行查询时而进行重复显示,在一定程度上提高了进行数据查询的精准度。的精准度。的精准度。

【技术实现步骤摘要】
数据处理方法、装置、电子设备和存储介质


[0001]本申请涉及计算机
,特别是涉及基于数据处理方法、装置、电子设备和存储介质。

技术介绍

[0002]在数据查询领域中,会涉及到通过查询系统从多个存储用户证件信息的不同数据系统来查询用户证件信息的情况,涉及多种场景下的数据查询,如对用户的医疗档案或病例档案进行查询的用户医疗信息查询场景,又比如对用户的执行证书或学位证书进行查询的用户个人信息查询场景。由于不同数据系统所存储的用户证件信息会存在信息一致或者信息大致相似的情况,而各个数据系统又很难做到互联互通的,因此在通过查询系统进行用户证件信息查询时,针对不同数据系统都存储同一个用户证件信息的情况无法进行重复识别,从而造成重复显示,因此如何避免用户证件信息的重复显示成为亟待解决的技术问题。

技术实现思路

[0003]基于此,本申请提供了一种数据处理方法、装置、电子设备和存储介质,可以在一定程度上避免用户证件信息的重复显示,提高了进行数据查询的精准度。
[0004]第一方面,本申请提供了一种数据处理方法,包括:获取进行索引合并的两个用户证件数据、用户证件数据所属的证件类型,所述两个用户证件数据来自不同的数据系统;根据所述用户证件数据所属的证件类型,确定所述用户证件数据中需要进行校验的各个目标字段、各个所述目标字段对应的权重以及所述证件类型的用户证件数据对应的第一相似度阈值;比对两个所述用户证件数据包含的各个目标字段中的字段值,确定两个所述用户证件数据包含的各个目标字段中的字段值之间的字段值匹配相似度;基于两个所述用户证件数据包含的各个目标字段中的字段值之间的字段值匹配相似度以及各个目标字段对应的权重,确定两个所述用户证件数据之间的数据匹配相似度;若两个所述用户证件数据之间的数据匹配相似度高于第一相似度阈值,则将两个用户证件数据进行索引合并。
[0005]第二方面,本申请提供了一种数据处理装置,包括:第一获取单元,用于获取进行索引合并的两个用户证件数据、用户证件数据所属的证件类型,所述两个用户证件数据来自不同的数据系统;第一执行单元,用于根据所述用户证件数据所属的证件类型,确定所述用户证件数据中需要进行校验的各个目标字段、各个所述目标字段对应的权重以及所述证件类型的用户证件数据对应的第一相似度阈值;比对单元,用于比对两个所述用户证件数据包含的各个目标字段中的字段值,确定两个所述用户证件数据包含的各个目标字段中的字段值之间的字段值匹配相似度;第二执行单元,用于基于两个所述用户证件数据包含的各个目标字段中的字段值之间的字段值匹配相似度以及各个目标字段对应的权重,确定两个所述用户证件数据之间的数据匹配相似度;合并单元,用于若两个所述用户证件数据之间的数据匹配相似度高于第一相似度阈值,则将两个用户证件数据进行索引合并。
[0006]第三方面,本申请提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述数据处理方法的步骤。
[0007]第四方面,本申请提供了一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述数据处理方法的步骤。
[0008]本申请的实施例提供的技术方案可以包括以下有益效果:通过根据用户证件数据对应的证件类型确定用户证件数据包含的需要进行校验的各个目标字段、各个目标字段对应的权重以及证件类型的用户证件数据对应的第一相似度阈值,并通过比对两个用户证件数据包含的各个目标字段中的字段值,确定两个用户证件数据包含的各个目标字段中的字段值之间的字段值匹配相似度,最后基于字段值匹配相似度与第一相似度阈值之间的对比关系确定来自不同系统的两个同一证件类型的用户证件数据是否为同一用户的用户证件数据,实现了对不同数据系统所存储的同一用户的用户证件数据进行索引合并,避免了对用户某个证件类型的用户证件数据进行查询时而进行重复显示,在一定程度上提高了进行数据查询的精准度。
[0009]应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
[0010]图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图。
[0011]图2为本申请一示例性实施例示出的数据处理方法的流程图。
[0012]图3为本申请一示例性实施例示出的数据处理方法的步骤S230的具体流程图。
[0013]图4为本申请一示例性实施例示出的数据处理方法的步骤S250的具体流程图。
[0014]图5为本申请一示例性实施例示出的数据处理方法的流程图。
[0015]图6是本申请一示例性实施例示出的一种数据处理装置的框图。
[0016]图7是本申请一示例性实施例示出的一种用于实现上述数据处理方法的电子设备示例框图。
[0017]图8是本申请一示例性实施例示出的一种用于实现上述数据处理方法的计算机可读存储介质。
具体实施方式
[0018]现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
[0019]此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
[0020]附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
[0021]附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0022]图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图。
[0023]如图1所示,系统架构可以包括客户端101、网络102和服务器103,该服务器103可以为提供数据查询服务的服务器,客户端101为进行数据查询服务的目标电子设备,客户端101可以为智能手机、平板电脑和便携式计算机中的一种或多种,当然也可以是台式计算机等等。网络102用以在客户端101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线通信链路、无线通信链路等等。
[0024]应该理解,图1中的客户端101、网络102和服务器103的数目仅仅是示意性的。根据实现需要,可以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取进行索引合并的两个用户证件数据、用户证件数据所属的证件类型,所述两个用户证件数据来自不同的数据系统;根据所述用户证件数据所属的证件类型,确定所述用户证件数据中需要进行校验的各个目标字段、各个所述目标字段对应的权重以及所述证件类型的用户证件数据对应的第一相似度阈值;比对两个所述用户证件数据包含的各个目标字段中的字段值,确定两个所述用户证件数据包含的各个目标字段中的字段值之间的字段值匹配相似度;基于两个所述用户证件数据包含的各个目标字段中的字段值之间的字段值匹配相似度以及各个所述目标字段对应的权重,确定两个所述用户证件数据之间的数据匹配相似度;若两个所述用户证件数据之间的数据匹配相似度高于第一相似度阈值,则将两个所述用户证件数据进行索引合并。2.根据权利要求1所述的数据处理方法,其特征在于,所述比对两个所述用户证件数据包含的各个目标字段中的字段值,确定两个所述用户证件数据包含的各个目标字段中的字段值之间的字段值匹配相似度包括:对两个所述用户证件数据包含的各个目标字段中的字段值分别进行字符转换处理,得到转换后的字段值;比对两个所述用户证件数据包含的各个目标字段所对应的转换后的字段值,确定第一相似度;比对两个所述用户证件数据包含的各个目标字段中的字段值,确定第二相似度;基于所述第一相似度以及所述第二相似度,确定两个所述用户证件数据包含的各个目标字段中的字段值之间的字段值匹配相似度。3.根据权利要求2所述的数据处理方法,其特征在于,所述基于所述第一相似度以及所述第二相似度,确定两个所述用户证件数据包含的各个目标字段中的字段值之间的字段值匹配相似度包括:基于所述第一相似度以及所述第二相似度的加权和,确定两个所述用户证件数据包含的各个目标字段中的字段值之间的字段值匹配相似度。4.根据权利要求1所述的数据处理方法,其特征在于,所述若两个所述用户证件数据之间的数据匹配相似度高于第一相似度阈值,则将两个所述用户证件数据进行索引合并包括:若两个所述用户证件数据之间的数据匹配相似度高于第一相似度阈值,则从任意一个所述用户证件数据中提取用户标识信息;根据所述用户标识信息、所述用户证件数据所属的证件类型生成索引信息;将生成的索引信息与所述两个用户证件数据进行关联存储。5.根据权利要求1所述的数据处理方法,其特征在于,所述若两个所述用户证件数据之间的数据匹配相似度高于第一相似...

【专利技术属性】
技术研发人员:毛剑
申请(专利权)人:深圳赛安特技术服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1