交易流水文件解析方法、装置、终端设备及存储介质制造方法及图纸

技术编号:38196923 阅读:12 留言:0更新日期:2023-07-21 16:34
本发明专利技术公开一种交易流水文件解析方法、装置、终端设备及存储介质,该方法包括:通过文本解析工具,将交易流水文件解析为若干行数据,并从若干行数据中提取关键字及对应的行号,与不同银行的交易流水的解析模板依次进行匹配,确定交易流水文件对应的解析模板,并获取交易流水信息;对交易流水文件进行格式化处理;根据交易流水信息和格式化处理后的交易流水文件,解析得到交易流水明细。本申请实现了将交易流水文件与不同银行的交易流水模板进行匹配,从而对交易流水文件进行解析,得到交易流水明细,达到了方便、快捷、准确地解析不同银行的交易流水文件的效果。的交易流水文件的效果。的交易流水文件的效果。

【技术实现步骤摘要】
交易流水文件解析方法、装置、终端设备及存储介质


[0001]本专利技术涉及文件解析领域,尤其涉及交易流水文件解析方法、装置、终端设备及存储介质。

技术介绍

[0002]交易流水是银行账户或支付机构账户的交易流水明细。各家银行账户或支付机构提供客户交易流水证明,生成的电子流水明细文件内容一般包括银行或支付机构、账户名称、账号、交易明细列表等信息,为快速地、便捷地获取到上述信息,需要寻求一种统一的交易流水文件的解析方法。
[0003]现有对交易流水解析的方法之一是基于OCR技术对流水文档进行快速扫描并获得相关信息,但由于OCR技术容易受到图像明暗、字体大小、颜色等影响,导致解析出来的信息准确度不高。另一种方式,则是基于pdf转html技术对流水文档进行转换获取相关信息,但是由于pdf转html技术容易受到表格表现形式、文字排版格式等影响,存在转换后的html与原始表格差异较大的问题,覆盖面受限。
[0004]因此,如何快速、准确地解析不同银行的交易流水文件是当前亟待解决的问题。

技术实现思路

[0005]本申请的主要目的在于提供一种交易流水文件解析方法、装置、终端设备及存储介质,旨在解决如何快速、准确地解析不同银行的交易流水文件的问题。
[0006]为实现上述目的,本申请提供交易流水文件解析方法,应用于文件解析
,所述交易流水文件解析方法包括以下步骤:
[0007]通过文本解析工具,将交易流水文件解析为若干行数据,并从所述若干行数据中提取关键字及对应的行号;
[0008]将所述关键字及对应的行号,与预先配置的不同银行的交易流水的解析模板依次进行匹配,确定所述交易流水文件对应的解析模板,并获取交易流水信息;
[0009]对所述交易流水文件进行格式化处理;
[0010]根据所述交易流水信息和格式化处理后的交易流水文件,解析得到交易流水明细。
[0011]可选的,所述解析模板至少包括流水关键字、账户关键字、卡号关键字,所述将所述关键字及对应的行号,与预先配置的不同银行的交易流水的解析模板依次进行匹配,确定所述交易流水文件对应的解析模板,并获取交易流水信息步骤包括:
[0012]遍历所述解析模板,并将所述解析模板中的流水关键字依次与所述关键字及对应的行号进行匹配,得到第一匹配结果;
[0013]若所述第一匹配结果为成功,则获取匹配成功的解析模板的账户关键字和卡号关键字;
[0014]将所述匹配成功的解析模板的账户关键字,与所述关键字及对应的行号进行匹
配,得到第二匹配结果;
[0015]若所述第二匹配结果为成功,则根据所述匹配成功的解析模板的账户关键字,从所述关键字及对应的行号中截取账户字符串并去除空格;
[0016]将所述匹配成功的解析模板的卡号关键字,与所述关键字及对应的行号进行匹配,得到第三匹配结果;
[0017]若所述第三匹配结果为成功,则根据所述匹配成功的解析模板的卡号关键字,从所述关键字及对应的行号中截取卡号字符串并去除空格。
[0018]可选的,所述对所述交易流水文件进行格式化处理的步骤包括:
[0019]从所述若干行数据中获取表格对应的解析行数据;
[0020]根据所述解析行数据建立二维坐标系;
[0021]根据所述二维坐标系,格式化处理所述解析行数据的行;
[0022]根据所述二维坐标系,格式化处理所述解析行数据的表格单元;
[0023]根据所述二维坐标系,格式化处理所述解析行数据的表头。
[0024]可选的,所述根据所述二维坐标系,格式化处理所述解析行数据的行的步骤包括:
[0025]依次遍历所述解析行数据的行;
[0026]当所述解析行数据的行在所述二维坐标系中的横坐标和纵坐标符合预设换行条件时,将所述行数据进行换行格式处理。
[0027]可选的,所述根据所述二维坐标系,格式化处理所述解析行数据的表格单元的步骤包括:
[0028]依次遍历所述解析行数据中的表格单元;
[0029]当相邻单元格在所述二维坐标系的横坐标和纵坐标符合预设合并条件时,将相邻表格单元及对应元素进行表格单元合并格式处理。
[0030]可选的,所述根据所述二维坐标系,格式化处理所述解析行数据的表头的步骤包括:
[0031]依次遍历所述解析行数据中的元素的坐标;
[0032]若所述元素的坐标与表头的坐标符合预设坐标更改条件时,更改所述元素的坐标与表头的坐标。
[0033]可选的,所述根据所述二维坐标系,格式化处理所述解析行数据的表格单元的步骤之前还包括:
[0034]从所述解析行数据中解析行数据的表头。
[0035]本申请实施案例还提出一种交易流水文件解析装置,所述交易流水文件解析装置包括:
[0036]提取模块,用于通过文本解析工具,将交易流水文件解析为若干行数据,并从所述若干行数据中提取关键字及对应的行号;
[0037]保存模块,用于将所述关键字及对应的行号,与预先配置的不同银行的交易流水的解析模板依次进行匹配,确定所述交易流水文件对应的解析模板,并获取交易流水信息;
[0038]格式模块,用于对所述交易流水文件进行格式化处理;
[0039]展示模块,用于根据所述交易流水信息和格式化处理后的交易流水文件,解析得到交易流水明细并展示。
[0040]本申请实施案例还提出一种终端设备,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的交易流水文件解析程序,所述交易流水文件解析程序被所述处理器执行时实现所述交易流水文件解析方法的步骤。
[0041]本申请实施案例还提出一种存储介质,所述存储介质上存储有交易流水文件解析程序,所述交易流水文件解析程序被处理器执行时实现所述交易流水文件解析方法的步骤。
[0042]本申请提出的交易流水文件解析方法、装置、终端设备及存储介质。通过文本解析工具,将交易流水文件解析为若干行数据,并从所述若干行数据中提取关键字及对应的行号;将所述关键字及对应的行号,与预先配置的不同银行的交易流水的解析模板依次进行匹配,确定所述交易流水文件对应的解析模板,并获取交易流水信息;对所述交易流水文件进行格式化处理;根据所述交易流水信息和格式化处理后的交易流水文件,解析得到交易流水明细并展示。基于本申请,通过将交易流水文件与不同银行的交易流水模板进行匹配,确定存储模板类型,从而获取到对应的交易流水信息,并对交易流水文件进行格式化处理,从而得到交易流水明细,达到了方便、快捷、准确地解析不同银行的交易流水文件的效果。
附图说明
[0043]图1为本申请交易流水文件解析装置所属终端设备的功能模块示意图;
[0044]图2为本申请交易流水文件解析方法第一示例性实施例的流程示意图;
[0045]图3为本申请交易流水文件解析方法第二示例性实施例的流程示意图;
[0046]图4为本申请本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种交易流水文件解析方法,其特征在于,所述交易流水文件解析方法包括以下步骤:通过文本解析工具,将交易流水文件解析为若干行数据,并从所述若干行数据中提取关键字及对应的行号;将所述关键字及对应的行号,与预先配置的不同银行的交易流水的解析模板依次进行匹配,确定所述交易流水文件对应的解析模板,并获取交易流水信息;对所述交易流水文件进行格式化处理;根据所述交易流水信息和格式化处理后的交易流水文件,解析得到交易流水明细。2.根据权利要求1所述的交易流水文件解析方法,其特征在于,所述解析模板至少包括流水关键字、账户关键字、卡号关键字,所述将所述关键字及对应的行号,与预先配置的不同银行的交易流水的解析模板依次进行匹配,确定所述交易流水文件对应的解析模板,并获取交易流水信息的步骤包括:遍历所述解析模板,并将所述解析模板中的流水关键字依次与所述关键字及对应的行号进行匹配,得到第一匹配结果;若所述第一匹配结果为成功,则获取匹配成功的解析模板的账户关键字和卡号关键字;将所述匹配成功的解析模板的账户关键字,与所述关键字及对应的行号进行匹配,得到第二匹配结果;若所述第二匹配结果为成功,则根据所述匹配成功的解析模板的账户关键字,从所述关键字及对应的行号中截取账户字符串并去除空格;将所述匹配成功的解析模板的卡号关键字,与所述关键字及对应的行号进行匹配,得到第三匹配结果;若所述第三匹配结果为成功,则根据所述匹配成功的解析模板的卡号关键字,从所述关键字及对应的行号中截取卡号字符串并去除空格。3.根据权利要求1所述的交易流水文件解析方法,其特征在于,所述对所述交易流水文件进行格式化处理的步骤包括:从所述若干行数据中获取表格对应的解析行数据;根据所述解析行数据建立二维坐标系;根据所述二维坐标系,格式化处理所述解析行数据的行;根据所述二维坐标系,格式化处理所述解析行数据的表格单元;根据所述二维坐标系,格式化处理所述解析行数据的表头。4.根据权利要求3所述的交易流水文件解析方法,其特征在于,所述根据所述二维坐标系,格式化处理所述解析行数据的行的步骤包括:依次遍历所述解...

【专利技术属性】
技术研发人员:王虎
申请(专利权)人:招商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1