数据记录处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:19934386 阅读:18 留言:0更新日期:2018-12-29 04:37
本公开涉及一种数据记录处理方法、装置、电子设备及存储介质,以提高数据记录的匹配效率。所述方法包括:获得用于描述相同对象集的第一数据库和第二数据库;按照预设的匹配规则,确定所述第一数据库中的第一数据记录与所述第二数据库中各个待匹配的数据记录的匹配值,所述第一数据记录用于描述所述对象集中的第一对象;根据所述第二数据库中各个待匹配的数据记录对应的匹配值,从所述第二数据库中确定用于描述所述第一对象的第二数据记录。

【技术实现步骤摘要】
数据记录处理方法、装置、电子设备及存储介质
本公开涉及数据处理
,具体地,涉及一种数据记录处理方法、装置、电子设备及存储介质。
技术介绍
在各个企业的经营过程中,一般会产生大量的数据,例如用户数据、业务数据等。随着时间的推移,这些数据逐渐积累成企业的数据资源。不同企业对其拥有的数据资源可能采用不同的方式进行处理,然后将处理后得到的数据记录存储到数据库中,以为企业经营者做商业决策时提供参考。然而,随着企业对数据资源的处理需求日益复杂,可能存在将基于不同于处理方式的数据库中的数据记录进行匹配的需求。相关技术中,通过人工处理的方式对基于不同于处理方式的数据库中的数据记录进行匹配,这种方式匹配效率较低。
技术实现思路
本公开的目的是提供一种数据记录处理方法、装置、电子设备及存储介质,以提高数据记录的匹配效率。为了实现上述目的,本公开实施例第一方面提供一种数据记录处理方法,所述方法包括:获得用于描述相同对象集的第一数据库和第二数据库;按照预设的匹配规则,确定所述第一数据库中的第一数据记录与所述第二数据库中各个待匹配的数据记录的匹配值,所述第一数据记录用于描述所述对象集中的第一对象;根据所述第二数据库中各个待匹配的数据记录对应的匹配值,从所述第二数据库中确定用于描述所述第一对象的第二数据记录。可选地,从所述第二数据库中确定用于描述所述第一对象的第二数据记录,包括:对所述第二数据库中各个待匹配的数据记录对应的匹配值进行排序;确定最高匹配值与次高匹配值之间的差值;在所述差值大于预设阈值的情况下,将对应的匹配值最高的数据记录确定为所述第二数据记录。可选地,所述方法还包括:在所述差值不大于所述预设阈值的情况下,输出提示信息,所述提示信息用于提示用户从对应的匹配值最高的数据记录和对应的匹配值次高的数据记录中选择一个数据记录;从所述第二数据库中确定用于描述所述第一对象的第二数据记录,包括:将所述用户选择的数据记录确定为所述第二数据记录。可选地,所述预设的匹配规则包括多个子匹配规则;按照预设的匹配规则,确定所述第一数据库中的第一数据记录与所述第二数据库中任一待匹配的数据记录的匹配值,包括:按照各子匹配规则,确定所述第一数据记录与所述第二数据库中任一待匹配的数据记录的匹配初值;根据各子匹配规则对应的匹配初值和各子匹配规则的权重值,确定所述第二数据库中该待匹配的数据记录对应的匹配值。可选地,在从所述第二数据库中确定用于描述所述第一对象的第二数据记录之后,所述方法还包括:将所述第一数据记录、所述第二数据记录以及所述第一数据记录与所述第二数据记录之间的匹配关系,存储到用于描述所述对象集的第三数据库。可选地,所述方法还包括:在检测到针对所述第一对象的数据记录获取请求时,从所述第三数据库中获取所述第一数据记录和/或所述第二数据记录。可选地,所述预设的匹配规则包括:通用匹配规则,或,基于所述对象集中对象的特征参数配置的专用匹配规则,或,所述通用匹配规则与所述专用匹配规则的组合,其中,所述通用匹配规则包括:模糊匹配规则、或等值匹配规则、或两者的组合。可选地,所述对象集中对象的特征参数是地理位置;所述专用匹配规则包括经纬度匹配规则;和/或行政区域等级匹配规则。本公开实施例第二方面提供一种数据记录处理装置,所述装置包括:获得模块,用于获得用于描述相同对象集的第一数据库和第二数据库;匹配值确定模块,用于按照预设的匹配规则,确定所述第一数据库中的第一数据记录与所述第二数据库中各个待匹配的数据记录的匹配值,所述第一数据记录用于描述所述对象集中的第一对象;数据记录确定模块,用于根据所述第二数据库中各个待匹配的数据记录对应的匹配值,从所述第二数据库中确定用于描述所述第一对象的第二数据记录。可选地,所述数据记录确定模块包括:排序子模块,用于对所述第二数据库中各个待匹配的数据记录对应的匹配值进行排序;第一确定子模块,用于确定最高匹配值与次高匹配值之间的差值;第二确定子模块,用于在所述差值大于预设阈值的情况下,将对应的匹配值最高的数据记录确定为所述第二数据记录。可选地,所述装置还包括:输出模块,用于在所述差值不大于所述预设阈值的情况下,输出提示信息,所述提示信息用于提示用户从对应的匹配值最高的数据记录和对应的匹配值次高的数据记录中选择一个数据记录;所述数据记录确定模块包括:第三确定子模块,用于将所述用户选择的数据记录确定为所述第二数据记录。可选地,所述匹配规则包括多个子匹配规则;所述匹配值确定模块包括:匹配初值确定子模块,用于按照各子匹配规则,确定所述第一数据记录与所述第二数据库中任一待匹配的数据记录的匹配初值;匹配值确定子模块,用于根据各子匹配规则对应的匹配初值和各子匹配规则的权重值,确定所述第二数据库中该待匹配的数据记录对应的匹配值。可选地,所述装置还包括:存储模块,用于将所述第一数据记录、所述第二数据记录以及所述第一数据记录与所述第二数据记录之间的匹配关系,存储到用于描述所述对象集的第三数据库。可选地,所述装置还包括:获取模块,用于在检测到针对所述第一对象的数据记录获取请求时,从所述第三数据库中获取所述第一数据记录和/或所述第二数据记录。可选地,所述预设的匹配规则包括:通用匹配规则,或,基于所述对象集中对象的特征参数配置的专用匹配规则,或,所述通用匹配规则与所述专用匹配规则的组合,其中,所述通用匹配规则包括:模糊匹配规则、或等值匹配规则、或两者的组合。可选地,所述对象集中对象的特征参数是地理位置;所述专用匹配规则包括:经纬度匹配规则和/或行政区域等级匹配规则。本公开实施例第三方面提供一种电子设备,包括处理器;用于存储处理器可执行指令的存储器;其中,所述处理器用于执行上述数据记录处理方法的步骤。本公开实施例第四方面提供一种计算机可读存储介质,其上存储有计算机程序指令,所述程序指令被处理器执行时实现上述数据记录方法的步骤。通过上述技术方案,在获得用于描述相同对象集的多个数据库之后,按照预设的匹配规则,确定多个数据库中的一个数据库中的数据记录与除该数据库之外的其他数据库中的数据记录的匹配值,最后根据确定出的匹配值,确定多个数据库中用于描述对象集中同一对象的数据记录。如此,实现了自动化匹配多个数据库中的数据记录,无需人工匹配,提高了匹配效率。本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:图1为本公开实施例提供的一种数据记录处理方法的流程图。图2为本公开实施例提供的一种数据记录处理方法的另一流程图。图3为本公开实施例提供的一种数据记录处理装置的示意图。图4为本公开实施例提供的一种数据记录处理装置的另一示意图。图5为本公开实施例提供的一种电子设备的框图。具体实施方式以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。本公开实施例提供一种数据记录处理方法,该方法在获得用于描述相同对象集的多个数据库之后,按照预设的匹配规则,确定多个数据库中的一个数据库中的数据记录与除该数据库之外的其他数据库中的数据记录的匹配值,最后根据确本文档来自技高网...

【技术保护点】
1.一种数据记录处理方法,其特征在于,所述方法包括:获得用于描述相同对象集的第一数据库和第二数据库;按照预设的匹配规则,确定所述第一数据库中的第一数据记录与所述第二数据库中各个待匹配的数据记录的匹配值,所述第一数据记录用于描述所述对象集中的第一对象;根据所述第二数据库中各个待匹配的数据记录对应的匹配值,从所述第二数据库中确定用于描述所述第一对象的第二数据记录。

【技术特征摘要】
1.一种数据记录处理方法,其特征在于,所述方法包括:获得用于描述相同对象集的第一数据库和第二数据库;按照预设的匹配规则,确定所述第一数据库中的第一数据记录与所述第二数据库中各个待匹配的数据记录的匹配值,所述第一数据记录用于描述所述对象集中的第一对象;根据所述第二数据库中各个待匹配的数据记录对应的匹配值,从所述第二数据库中确定用于描述所述第一对象的第二数据记录。2.根据权利要求1所述的方法,其特征在于,从所述第二数据库中确定用于描述所述第一对象的第二数据记录,包括:对所述第二数据库中各个待匹配的数据记录对应的匹配值进行排序;确定最高匹配值与次高匹配值之间的差值;在所述差值大于预设阈值的情况下,将对应的匹配值最高的数据记录确定为所述第二数据记录。3.根据权利要求2所述的方法,其特征在于,还包括:在所述差值不大于所述预设阈值的情况下,输出提示信息,所述提示信息用于提示用户从对应的匹配值最高的数据记录和对应的匹配值次高的数据记录中选择一个数据记录;从所述第二数据库中确定用于描述所述第一对象的第二数据记录,包括:将所述用户选择的数据记录确定为所述第二数据记录。4.根据权利要求1所述的方法,其特征在于,所述预设的匹配规则包括多个子匹配规则;按照预设的匹配规则,确定所述第一数据库中的第一数据记录与所述第二数据库中任一待匹配的数据记录的匹配值,包括:按照各子匹配规则,确定所述第一数据记录与所述第二数据库中任一待匹配的数据记录的匹配初值;根据各子匹配规则对应的匹配初值和各子匹配规则的权重值,确定所述第二数据库中该待匹配的数据记录对应的匹配值。5.根据权利要求1所述的方法,其特征在于,在从所述第二数据库中确定用于描述所述第一...

【专利技术属性】
技术研发人员:孙大禹刘强魏建钟
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1