一种打款回执单的识别方法和装置制造方法及图纸

技术编号:39567048 阅读:7 留言:0更新日期:2023-12-03 19:17
本发明专利技术公开了一种打款回执单的识别方法和装置,包括:获取文件单页图片;确定单页图片最佳等分数量

【技术实现步骤摘要】
一种打款回执单的识别方法和装置


[0001]本专利技术涉及计算机应用领域,具体而言,涉及一种打款回执单的识别方法和装置


技术介绍

[0002]当前众多互联网业务需要用户向服务商汇款,如果客户选择直接向银行汇款的付款方式,通常需要银行的打款回执单来确认对照客户打款的状态及打款的信息;当客户越来越多,打款业务越来越频繁后,人工或者简单的图像识别,在确认回执状态时,效率低下,容易产生误差

因此需要一种针对打款的回执单进行识别处理的方案,既要保证识别的准确率,又要保证识别的效率


技术实现思路

[0003]为实现上述目的,本专利技术提供了一种打款回执单的识别方法,包括以下步骤:
[0004]获取文件单页图片;
[0005]确定单页图片最佳等分数量
n

[0006]根据最佳等分数量
n
,将单页图片等分为
n
个区域,确定区域的坐标;
[0007]同时在
n
个区域进行重要字符匹配,获取回执单高度,确定回执单范围;
[0008]在回执单范围内进行内容识别,生成与订单对应的回执信息

[0009]其中,确定单页图片最佳等分数量
n
的方法为:
n

k+2
,其中
k
为单页图片回执数量
k
,通过提前预设确定;
[0010]单页图片回执数量为制作
PDF
文件时确定,一个页面中可包含的回执单最大值

[0011]进一步的,将单页图片等分为
n
个区域前,确定坐标原点为文件单页图片左上角的点,确定文件单页图片的长度和宽度分别为
l

w

[0012]将单页图片等分为
n
个区域后,
n
个坐标区域定义为:其中,
i

1、2

n

i<n。
[0013]进一步的,重要字符匹配指:确定区域的坐标范围,在坐标范围查找重要字符组,找到重要字符组的全部内容后,返回重要字符组的标识坐标,停止寻找;
[0014]其中,重要字符组包括一个或多个字符信息;
[0015]其中,标识坐标指,重要字符组中所有字符信息的最小坐标;
[0016]将
n
个区域获得的标识坐标的
y
值相减,获得的最小差值绝对值为回执单高度

[0017]进一步的,生成与订单对应的回执信息包括信息确认,信息确认指:通过图像识别技术获取信息项后,对信息项进行归类,针对信息项类别进行二次确认,如果确认通过,存储该信息项;
[0018]二次确认包括:基本内容确认和业务内容确认

[0019]基本内容确认包括数字验证

长度验证

内容验证

[0020]业务内容确认指:将回执单信息发送至服务器,在业务信息中确认回执单信息是
否有效;确认所述回执单信息是否有效包括:校验收款人名称是否属于客户人群

收款人账户是否为对应的客户白名单收款账户

[0021]进一步的,针对信息项类别进行二次确认还包括:如果确认不通过,采取警报机制;警报主要来源为基本内容确认和业务内容确认不通过的内容,警报机制将确认失败的原因

获取的回执单信息及截取的回执单图片归类

展示,支持通过二次识别或者人工纠正的方式来弥补和完善数据

[0022]另一方面,本专利技术还提供了一种打款回执单的识别装置,包括:
[0023]识别图片确定模块:用于从
PDF
文件获取文件单页图片;
[0024]等分数量确定模块:用于确定单页图片最佳等分数量
n

[0025]识别区域确定模块:用于根据最佳等分数量
n
,将单页图片等分为
n
个区域,确定区域的坐标;
[0026]回执内容确定模块:包括识别范围确定单元

内容识别单元和内容确认单元;识别范围确定单元用于同时在
n
个区域进行重要字符匹配,获取回执单高度,确定回执单范围;内容识别单元用于在回执单范围内进行内容识别,生成与订单对应的回执信息;内容确认单元用于通过图像识别技术获取信息项后,对所述信息项进行归类,针对所述信息项类别进行二次确认,如果确认通过,对所述信息项进行存储

[0027]进一步的,回执内容确定模块还包括警报单元,用于当二次确认未通过时,获取失败原因和回执信息并发送至管理人员

[0028]根据本专利技术,可以节约打款回执单识别时定位时的空间扫描,降低资源压力,也可以对识别误差进一步判断,提高识别处理的效率

附图说明
[0029]图1是根据本专利技术实施例提供的打款回执单的识别方法步骤图;
[0030]图2是根据本专利技术实施例提供的打款回执单文件单页图片处理示意图;
[0031]图3是根据本专利技术实施例提供的打款回执单的识别装置结构示意图

具体实施方式
[0032]目前部分互联网服务业务的付费流程包括客户向银行汇款,银行向服务商批量提供打款回执单,服务商根据回执单确认客户订单;其中银行提供打款回执单的格式,多数为多页的
PDF
文件,每一页包括一份或多份完整的回执单;在本专利技术提供的方案中,将
PDF
的每一页进行等分后,在小区域内识别关键位置以确定回执单的准确位置,在准确位置识别关键信息后,对信息进行校验,检验通过的信息作为订单有效信息,更新订单状态和存档;同时,由于采用等分区域,各区域同步识别的方案,减小了每次识别的资源压力,提高了识别处理的效率

[0033]下面结合说明书附图对本专利技术的具体实现方式做一详细描述

[0034]图1是本专利技术提供的打款回执单的识别方法步骤图,如图所示,包括以下步骤:
[0035]S100
:获取文件单页图片;
[0036]首先,导入银行打款电子回执单的
PDF
文件,该
PDF
文件一般为一页或多页,一页包括一份或多份回执确认单;
[0037]其次,将该
PDF
文件按页进行图片化,即提取文件单页图片,每页单页图片如图2所示;
[0038]图片化的页面可通过
OCR
图像识别,由于一个单页图片可能包括多份回热,则需要分别获取每条回执单信息;并计算每条回执单信息的相关坐标,按照坐标对图片进行截取,获取单条回执单信息

[0039]在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种打款回执单的识别方法,其特征在于,包括以下步骤:获取文件单页图片;确定所述单页图片最佳等分数量
n
;根据所述最佳等分数量
n
,将所述单页图片等分为
n
个区域,确定所述区域的坐标;同时在所述
n
个区域进行重要字符匹配,获取回执单高度,确定回执单范围;在所述回执单范围内进行内容识别,生成与订单对应的回执信息
。2.
根据权利要求1所述的识别方法,其特征在于,所述确定所述单页图片最佳等分数量
n
的方法为:
n

k+2
,其中
k
为所述单页图片回执数量
k
,通过提前预设确定;所述单页图片回执数量为制作
PDF
文件时确定,一个页面中可包含的回执单最大值
。3.
根据权利要求1所述的识别方法,其特征在于,所述将所述单页图片等分为
n
个区域前,确定坐标原点为所述文件单页图片左上角的点,确定所述文件单页图片的长度和宽度分别为
l

w
;所述将所述单页图片等分为
n
个区域后,所述
n
个坐标区域定义为:其中,
i

1、2

n

i<n。4.
根据权利要求1所述的识别方法,其特征在于,所述重要字符匹配指:确定所述区域的坐标范围,在所述坐标范围查找重要字符组,找到所述重要字符组的全部内容后,返回所述重要字符组的标识坐标,停止寻找;其中,所述重要字符组包括一个或多个字符信息;所述标识坐标指,所述重要字符组中所有字符信息的最小坐标;将所述
n
个区域获得的标识坐标的
y
值相减,获得的最小差值绝对值为回执单高度
。5.
根据权利要求1所述的识别方法,其特征在于,所述生成与订单对应的回执信息包括信息确认,所述信息确认指:通过图像识别技术获取信息项后,对所述信息项进行归类,...

【专利技术属性】
技术研发人员:岑汉袁孟全杨健刘海兵
申请(专利权)人:贵阳叁玖互联网医疗有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1