数据匹配方法和数据匹配装置制造方法及图纸

技术编号:32887639 阅读:14 留言:0更新日期:2022-04-02 12:23
本申请提供一种数据匹配方法和数据匹配装置,应用于数据处理领域,有利于提高数据处理效率。该方法包括:采用第一匹配规则对样本数据进行匹配,获取第一匹配结果;基于第一匹配结果,确定第一评价指标;在第一评价指标不满足预设条件的情况下,调整第一匹配规则的预设字段,得到第二匹配规则,调整包括下列至少一种:增加预设字段、删减预设字段、改变预设字段的匹配范围或者改变预设字段的匹配内容;采用第二匹配规则对样本数据进行匹配,获取第二匹配结果;基于第二匹配结果,确定第二评价指标;在第二评价指标满足预设条件的情况下,采用第二匹配规则对待匹配数据进行匹配。用第二匹配规则对待匹配数据进行匹配。用第二匹配规则对待匹配数据进行匹配。

【技术实现步骤摘要】
数据匹配方法和数据匹配装置


[0001]本申请涉及数据处理领域,更具体地,涉及一种数据匹配方法和数据匹配装置。

技术介绍

[0002]通常,对账员需要对来自两个数据源的同一笔交易数据进行对账,例如,电力公司对账员需要对公司收缴电费的信息与银行资金文件进行对账工作。
[0003]电力机构业务人员在营销业务系统中进行收费和解款操作时,营销业务系统生成对账标识,即资金解款记录表。电力机构业务人员将资金存入公司电费账号时,把对账标识提供给银行业务人员,银行业务人员将对账标识录入银行系统。银行系统将包含对账标识的资金对账文件提供给营销业务系统,营销业务系统将资金解款记录表与资金对账文件的对账标识进行匹配实现对账。
[0004]当前的对账模式需要在银行系统和营销业务系统之间传递对账标识,然而,在不存在对账标识的场景下,如何对交易数据进行对账是一项亟待解决的问题。

技术实现思路

[0005]本申请提供了一种数据匹配方法和数据匹配装置,无论是否存在对账标识,都可以实现交易数据的对账操作,提高了数据处理效率。
[0006]第一方面,提供了一种数据匹配方法,该方法包括:采用第一匹配规则对样本数据进行匹配,获取第一匹配结果,第一匹配规则包括预设字段和匹配谓词之间的对应关系。基于第一匹配结果,确定第一评价指标,第一评价指标包括第一匹配结果的准确率和/或匹配率。在第一评价指标不满足预设条件的情况下,调整第一匹配规则的预设字段,得到第二匹配规则,所述调整包括下列至少一种:增加预设字段、删减预设字段、改变预设字段的匹配范围或者改变预设字段的匹配内容。采用第二匹配规则对样本数据进行匹配,获取第二匹配结果。基于第二匹配结果,确定第二评价指标,第二评价指标包括第二匹配结果的准确率和/或匹配率。在第二评价指标满足预设条件的情况下,采用第二匹配规则对待匹配数据进行匹配。
[0007]在本申请中,数据处理设备在采用第一匹配规则对样本数据进行匹配时,如果得到的第一评价指标无法满足预设条件,那么数据处理设备可以对第一匹配规则的预设字段进行调整,调整的依据可以是在对第一匹配结果进行核对的过程中记录的修正记录,基于该修正记录数据处理设备可以调整第一匹配规则得到第二匹配规则,通过该第二匹配规则对待匹配数据进行匹配,有利于提高数据匹配的准确率,并且在不存在对账标识的情况下可以提高数据处理效率。
[0008]结合第一方面,在第一方面的某些实现方式中,获取来自第一数据源的第一待匹配交易记录。获取来自第二数据源的第二待匹配交易记录。基于预设字段和预设字段的匹配谓词,判断第一待匹配交易记录和第二待匹配交易记录的预设字段之间的关系是否满足匹配谓词。在第一待匹配交易记录和第二待匹配交易记录的预设字段之间的关系满足匹配
谓词的情况下,记录第一待匹配交易记录和第二待匹配交易记录之间的匹配关系。
[0009]在本申请中,第一待匹配交易记录和第二待匹配交易记录来自两个不同的数据源,数据处理设备可以根据第一待匹配交易记录和第二待匹配交易记录的预设字段和预设字段的匹配谓词判断第一待匹配交易记录和第二待匹配交易记录是否匹配。这样的方式不需要依赖于对账标识即可实现,有利于提高数据处理效率。
[0010]结合第一方面,在第一方面的某些实现方式中,在第一待匹配交易记录和第二待匹配交易记录的预设字段之间的关系不满足匹配谓词的情况下,获取来自第二数据源的另一条第二待匹配交易记录。基于预设字段和预设字段的匹配谓词,判断第一待匹配交易记录和另一条第二待匹配交易记录的预设字段之间的关系是否满足匹配谓词。在第一待匹配交易记录和另一条第二待匹配交易记录的预设字段之间的关系满足匹配谓词的情况下,记录第一待匹配交易记录和另一条第二待匹配交易记录之间的匹配关系。
[0011]结合第一方面,在第一方面的某些实现方式中,匹配谓词包括下列至少一个:大于、等于、小于、包含、被包含、包含于、或者正则匹配。
[0012]结合第一方面,在第一方面的某些实现方式中,第一数据源为银行交易流水,所述第二数据源为订单交易流水。第一待匹配交易记录的预设字段包括下列字段中的至少一个:付款账户、收款账户、交易金额、交易时间、或者摘要。所述第二待匹配交易记录的预设字段包括下列字段中的至少一个:付款账户、收款账户、订单金额、付款时间、或者订单摘要。
[0013]结合第一方面,在第一方面的某些实现方式中,第一待匹配交易记录的付款账户与所述第二待匹配交易记录的付款账户之间的匹配谓词为等于。第一待匹配交易记录的收款账户与第二待匹配交易记录的收款账户之间的匹配谓词为等于。第一待匹配交易记录的交易金额与第二待匹配交易记录的订单金额之间的匹配谓词为小于或等于。第一待匹配交易记录的交易时间与第二待匹配交易记录的付款时间之间的匹配谓词为等于。第一待匹配交易记录的摘要与第二待匹配交易记录的订单摘要之间的匹配谓词为正则匹配。
[0014]第二方面,提供了一种数据匹配装置,用于执行上述第一方面中任一种可能的实现方式中的方法。具体地,该装置包括用于执行上述第一方面中任一种可能的实现方式中的方法的模块。
[0015]第三方面,提供了一种数据匹配装置,包括处理器,该处理器与存储器耦合,可用于执行存储器中的指令,以实现上述第一方面中任一种可能实现方式中的方法。可选地,该装置还包括存储器。可选地,该装置还包括通信接口,处理器与通信接口耦合。
[0016]第四方面,提供了一种处理器,包括:输入电路、输出电路和处理电路。处理电路用于通过输入电路接收信号,并通过输出电路发射信号,使得处理器执行上述第一方面中任一种可能实现方式中的方法。
[0017]在具体实现过程中,上述处理器可以为芯片,输入电路可以为输入管脚,输出电路可以为输出管脚,处理电路可以为晶体管、门电路、触发器和各种逻辑电路等。输入电路所接收的输入的信号可以是由例如但不限于接收器接收并输入的,输出电路所输出的信号可以是例如但不限于输出给发射器并由发射器发射的,且输入电路和输出电路可以是同一电路,该电路在不同的时刻分别用作输入电路和输出电路。本申请对处理器及各种电路的具体实现方式不做限定。
[0018]第五方面,提供了一种处理装置,包括处理器和存储器。该处理器用于读取存储器中存储的指令,并可通过接收器接收信号,通过发射器发射信号,以执行上述第一方面中任一种可能实现方式中的方法。
[0019]可选地,处理器为一个或多个,存储器为一个或多个。
[0020]可选地,存储器可以与处理器集成在一起,或者存储器与处理器分离设置。
[0021]在具体实现过程中,存储器可以为非瞬时性(non

transitory)存储器,例如只读存储器(read only memory,ROM),其可以与处理器集成在同一块芯片上,也可以分别设置在不同的芯片上,本申请对存储器的类型以及存储器与处理器的设置方式不做限定。
[0022]应理解,相关的数据交互过程例如发送指示信息可以为从处理器输出指示信息的过程本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据匹配方法,其特征在于,包括:采用第一匹配规则对样本数据进行匹配,获取第一匹配结果,所述第一匹配规则包括预设字段和匹配谓词之间的对应关系;基于所述第一匹配结果,确定第一评价指标,所述第一评价指标包括所述第一匹配结果的准确率和/或匹配率;在所述第一评价指标不满足预设条件的情况下,调整所述第一匹配规则的预设字段,得到第二匹配规则,所述调整包括下列至少一种:增加预设字段、删减预设字段、改变预设字段的匹配范围或者改变预设字段的匹配内容;采用所述第二匹配规则对所述样本数据进行匹配,获取第二匹配结果;基于所述第二匹配结果,确定第二评价指标,所述第二评价指标包括所述第二匹配结果的准确率和/或匹配率;在所述第二评价指标满足所述预设条件的情况下,采用所述第二匹配规则对待匹配数据进行匹配。2.根据权利要求1所述的方法,其特征在于,所述采用所述第二匹配规则对待匹配数据进行匹配,包括:获取来自第一数据源的第一待匹配交易记录;获取来自第二数据源的第二待匹配交易记录;基于预设字段和所述预设字段的匹配谓词,判断所述第一待匹配交易记录和所述第二待匹配交易记录的预设字段之间的关系是否满足所述匹配谓词;在所述第一待匹配交易记录和所述第二待匹配交易记录的预设字段之间的关系满足所述匹配谓词的情况下,记录所述第一待匹配交易记录和所述第二待匹配交易记录之间的匹配关系。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:在所述第一待匹配交易记录和所述第二待匹配交易记录的预设字段之间的关系不满足所述匹配谓词的情况下,获取来自第二数据源的另一条第二待匹配交易记录;基于预设字段和所述预设字段的匹配谓词,判断所述第一待匹配交易记录和所述另一条第二待匹配交易记录的预设字段之间的关系是否满足所述匹配谓词;在所述第一待匹配交易记录和所述另一条第二待匹配交易记录的预设字段之间的关系满足所述匹配谓词的情况下,记录所述第一待匹配交易记录和所述另一条第二待匹配交易记录之间的匹配关系。4.根据权利要求1所述的方法,其特征在于,所述匹配谓词包括下列至少一个:大于、等于、小于、包含、被包含、包含于、或者正则匹配。5.根据权利要求1所述的方法,其特征在于,所述第一数据源为银行交易流水,所述第二数据源为订单交易流水;所述第一待匹配交易记录的预设字段包括下列字段中的至少一个:付款账户、收款账户、交易金额、交易时间、或者摘要;所述第二待匹配交易记录的预设字段包括下列字段中的至少一个:付款账户、收款账户、订单金额、付款时间、或者订单摘要。6.根据权利要求5所述的方法,其特征在于,所述第一待匹配交易记录的付款账户与所
述第二待匹配交易记录的付款账户之间的匹配谓词为等于;所述第一待匹配交易记录的收款账户与所述第二待匹配交易记录的收款账户之间的匹配谓词为等于;所述第一待匹配交易记录的交易金额与所述第二待匹配交易记录的订单金额之间的匹配谓词为小于或等于;所述第一待匹配交易记录的交易时间与所述第二待匹配交易记录的付款时间之间的匹配谓词为等于;所述第一待匹配交易记录的摘要与所述第二待匹配交易记录的订单摘要之间的匹配谓词为正则匹配。7.一种数据匹配装置,其特征在于,包括:获取模块,用于采用第一匹配规则对样本数据进行匹配,获取第一匹配结果,所述第一匹配规则包括预设字段和匹配谓词之间的对应关系;处理模块,用于基于所述第一匹配结果,确定第一评价指标,所述第一评价指标包括所述第一匹配结果的准确率和/或匹配率;所述处理模块还用于:在所述第...

【专利技术属性】
技术研发人员:李新张同虎张涛
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1