银行票据识别方法、设备及介质技术

技术编号:33700227 阅读:14 留言:0更新日期:2022-06-06 08:07
本发明专利技术实施例提供一种银行票据识别方法、设备及介质,该方法包括:获取待识别的目标银行票据图像;采用训练至收敛的YOLOv3模型,对所述目标银行票据图像中的主键区域及流水号区域进行检测;根据主键区域及流水号区域的检测结果对所述目标银行票据图像进行校正处理;采用训练至收敛的新的卷积循环神经网络NewCRNN模型对校正处理后的目标银行票据图像中的主键及流水号进行文本识别。可利用基于深度学习的模型完成对票据的自动检测和识别,能够适用于复杂多样的银行票据,以满足银行票据识别的需求,提高了对银行票据检测和识别的通用性。用性。用性。

【技术实现步骤摘要】
银行票据识别方法、设备及介质


[0001]本专利技术实施例涉及图像处理
,尤其涉及一种银行票据识别方法、设备及介质。

技术介绍

[0002]随着人工智能(英文简称:AI)技术的迅速发展,AI在人们的日常生活中也扮演着越来越重要的角色,许多简单而又重复的工作都可以由AI来帮助人们完成。在银行系统,每天都会产生大量的票据凭证,这些票据上的某些信息对于事后监督系统又是必不可少的。这其中最重要的两条信息是主键和流水号。
[0003]由于票据本身样式繁多,还有在票据产生过程中人为、机器等因素的影响以及各种非票据凭证的干扰等,大大增加了检测识别的难度。
[0004]现有技术中主要是基于模板匹配和特征提取来实现对银行票据的检测识别,但这种方法只适用于特定样式的银行票据的检测和识别,具有较大的局限性,不能够满足复杂多样的银行票据进行检测和识别的需求。

技术实现思路

[0005]本专利技术实施例提供一种银行票据识别方法、设备及介质,该方法解决了现有技术中所采用的基于模板匹配和特征提取来实现对银行票据的检测识别的方法只适用于特定样式的银行票据的检测和识别,具有较大的局限性,不能够满足复杂多样的银行票据进行检测和识别的需求的技术问题。
[0006]第一方面,本专利技术实施例提供一种银行票据识别方法,包括:
[0007]获取待识别的目标银行票据图像;
[0008]采用训练至收敛的YOLOv3模型,对所述目标银行票据图像中的主键区域及流水号区域进行检测;
[0009]根据主键区域及流水号区域的检测结果对所述目标银行票据图像进行校正处理;
[0010]采用训练至收敛的新的卷积循环神经网络NewCRNN模型对校正处理后的目标银行票据图像中的主键及流水号进行文本识别。
[0011]可选地,如上所述的方法,所述采用训练至收敛的YOLOv3模型,对所述目标银行票据图像中的主键区域及流水号区域进行检测,包括:
[0012]将所述目标银行票据图像输入到训练至收敛的YOLOv3模型中,通过所述训练至收敛的YOLOv3模型对目标银行票据图像中的主键区域及流水号区域进行检测;
[0013]通过所述训练至收敛的YOLOv3模型输出主键区域信息及流水号区域信息。
[0014]可选地,如上所述的方法,所述根据主键区域及流水号区域的检测结果对所述目标银行票据图像进行校正处理,包括:
[0015]根据主键区域及流水号区域的检测结果确定主键及流水号在所述目标银行票据图像中的布局信息;
[0016]根据所述布局信息确定目标银行票据图像的旋转角度;
[0017]根据所述旋转角度对所述目标银行票据图像进行校正处理,以使校正处理后的目标银行票据图像中主键区域及流水号区域中的文本按照水平且从左到右顺序排列。
[0018]可选地,如上所述的方法,所述采用训练至收敛的NewCRNN模型对校正处理后的目标银行票据图像中的主键及流水号进行文本识别,包括:
[0019]将校正处理后的目标银行票据图像输入到训练至收敛的NewCRNN模型的特征提取层,通过所述特征提取层对所述校正处理后的目标银行票据图像进行特征提取,以获得二维时间序列特征;
[0020]将所述二维时间序列特征输入到训练至收敛的NewCRNN模型的解码层,在所述解码层中采用贪心搜索算法确定所述二维时间序列特征中每一时刻的主键或流水号的初始文本识别结果。
[0021]可选地,如上所述的方法,所述在所述解码层中采用贪心搜索算法确定所述二维时间序列特征中每一时刻的主键或流水号的初始文本识别结果,包括:
[0022]在所述解码层中采用贪心搜索算法确定每一时刻的主键或流水号的预测结果中最大概率的文本;
[0023]将所述最大概率的文本确定为该时刻主键或流水号的初始文本识别结果。
[0024]可选地,如上所述的方法,所述通过所述解码层采用贪心搜索算法确定所述二维时间序列特征中每一时刻的主键或流水号的初始字文本别结果之后,还包括:
[0025]根据预先构建的标准主键特征对主键的初始文本识别结果进行校正,并且根据预先构建的标准流水号特征对流水号的初始文本识别结果进行校正;
[0026]输出主键及流水号的最终识别结果。
[0027]可选地,如上所述的方法,所述采用训练至收敛的YOLOv3模型,对所述目标银行票据图像中的主键区域及流水号区域进行检测之前,还包括:
[0028]获取对初始YOLOv3模型进行训练的第一训练样本,所述第一训练样本为标注有主键区域及流水号区域的第一样本银行票据图像;
[0029]采用所述第一训练样本对所述初始YOLOv3模型进行训练;
[0030]若确定训练后的YOLOv3模型满足收敛条件,则将满足收敛条件的YOLOv3模型确定为训练至收敛的YOLOv3模型。
[0031]可选地,如上所述的方法,所述采用训练至收敛的NewCRNN模型对校正处理后的目标银行票据图像中的主键及流水号进行文本识别之前,还包括:
[0032]获取对初始NewCRNN模型进行训练的第二训练样本,所述第二训练样本为标注有主键及流水号语义信息的第二样本银行票据图像;
[0033]采用所述第二训练样本对所述初始NewCRNN模型中的特征提取层及转录层进行训练;
[0034]若确定训练后的NewCRNN模型满足收敛条件,则将满足收敛条件的NewCRNN模型确定为训练至收敛的NewCRNN模型。
[0035]第二方面,本专利技术实施例提供一种银行票据识别设备,包括:
[0036]存储器,处理器以及计算机程序;
[0037]其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实
现如第一方面中任一项所述的银行票据识别方法。
[0038]第三方面,本专利技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现如第一方面中任一项所述的银行票据识别方法。
[0039]本专利技术实施例提供一种银行票据识别方法、设备及介质,通过获取待识别的目标银行票据图像;采用训练至收敛的YOLOv3模型,对所述目标银行票据图像中的主键区域及流水号区域进行检测;根据主键区域及流水号区域的检测结果对所述目标银行票据图像进行校正处理;采用训练至收敛的新的卷积循环神经网络NewCRNN模型对校正处理后的目标银行票据图像中的主键及流水号进行文本识别。可利用基于深度学习的模型完成对票据的自动检测和识别,能够适用于复杂多样的银行票据,以满足银行票据识别的需求,提高了对银行票据检测和识别的通用性。
[0040]应当理解,上述
技术实现思路
部分中所描述的内容并非旨在限定本专利技术的实施例的关键或重要特征,亦非用于限制本专利技术的范围。本专利技术的其它特征将通过以下的描述变得容易理解。
附图说明
[0041]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种银行票据识别方法,其特征在于,包括:获取待识别的目标银行票据图像;采用训练至收敛的YOLOv3模型,对所述目标银行票据图像中的主键区域及流水号区域进行检测;根据主键区域及流水号区域的检测结果对所述目标银行票据图像进行校正处理;采用训练至收敛的新的卷积循环神经网络NewCRNN模型对校正处理后的目标银行票据图像中的主键及流水号进行文本识别。2.根据权利要求1所述的方法,其特征在于,所述采用训练至收敛的YOLOv3模型,对所述目标银行票据图像中的主键区域及流水号区域进行检测,包括:将所述目标银行票据图像输入到训练至收敛的YOLOv3模型中,通过所述训练至收敛的YOLOv3模型对目标银行票据图像中的主键区域及流水号区域进行检测;通过所述训练至收敛的YOLOv3模型输出主键区域信息及流水号区域信息。3.根据权利要求1所述的方法,其特征在于,所述根据主键区域及流水号区域的检测结果对所述目标银行票据图像进行校正处理,包括:根据主键区域及流水号区域的检测结果确定主键及流水号在所述目标银行票据图像中的布局信息;根据所述布局信息确定目标银行票据图像的旋转角度;根据所述旋转角度对所述目标银行票据图像进行校正处理,以使校正处理后的目标银行票据图像中主键区域及流水号区域中的文本按照水平且从左到右顺序排列。4.根据权利要求1所述的方法,其特征在于,所述采用训练至收敛的NewCRNN模型对校正处理后的目标银行票据图像中的主键及流水号进行文本识别,包括:将校正处理后的目标银行票据图像输入到训练至收敛的NewCRNN模型的特征提取层,通过所述特征提取层对所述校正处理后的目标银行票据图像进行特征提取,以获得二维时间序列特征;将所述二维时间序列特征输入到训练至收敛的NewCRNN模型的解码层,在所述解码层中采用贪心搜索算法确定所述二维时间序列特征中每一时刻的主键或流水号的初始文本识别结果。5.根据权利要求4所述的方法,其特征在于,所述在所述解码层中采用贪心搜索算法确定所述二维时间序列特征中每一时刻的主键或流水号的初始文本...

【专利技术属性】
技术研发人员:汪雄颜钦钦李黄薇
申请(专利权)人:北大方正信息产业集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1