一种基于构建深度学习网络的票据识别方法及终端技术

技术编号:21200883 阅读:30 留言:0更新日期:2019-05-25 01:32
本发明专利技术涉及一种基于构建深度学习网络的票据识别方法及终端,属于数据处理领域。通过获取多个隐层节点组;每一隐层节点组与不同的票据训练样本集对应;获取所述多个隐层节点组中的第一隐层节点组;所述第一隐层节点组对应的票据训练样本集为所有隐层节点组的票据训练样本集的总和;第一隐层节点组中的最后一个隐层节点分别与所述多个隐层节点组中其余隐层节点组的第一个隐层节点连接;所述第一隐层节点组中的第一个隐层节点与预设的输入层连接;所述多个隐层节点组中除所述第一隐层节点组外的其余隐层节点组的最后一个隐层节点分别与预设的输出层连接,得到OCR深度学习网络。实现在提高OCR深度学习网络文字识别准确度的同时提高计算资源的利用率。

A Bill Recognition Method and Terminal Based on Deep Learning Network

The invention relates to a bill recognition method and a terminal based on constructing a deep learning network, belonging to the field of data processing. The first hidden layer node group corresponds to the first hidden layer node group; the first hidden layer node group corresponds to the sum of the bill training sample set of all hidden layer node groups; and the last hidden layer node group in the first hidden layer node group corresponds to the last hidden layer node group. The first hidden layer node group of the remaining hidden layer node groups is connected with the first hidden layer node group; the first hidden layer node group of the first hidden layer node group is connected with the preset input layer; the last hidden layer node group of the other hidden layer node groups except the first hidden layer node group is connected with the preset output layer separately, and the OCR deep learning network is obtained. It can improve the accuracy of OCR in-depth learning network and the utilization of computing resources.

【技术实现步骤摘要】
一种基于构建深度学习网络的票据识别方法及终端
本专利技术涉及一种基于构建深度学习网络的票据识别方法及终端,属于数据处理领域。
技术介绍
基于深度学习的OCR文字识别方法近几年来发展迅猛,尤其是在英文和数字识别方面,文字识别的准确率接近人工识别的水平,帮助实现多种场景应用的落地。但是对于中文识别以及中英文混合等复杂的应用场景,目前深度学习OCR识别的准确率还有待提高。尤其是票据文字识别应用系统,对准确率有极高的要求,但是票据种类繁多(比如增值税发票,飞机票,的士票等),每种票据里面有不同字段(姓名,地址,金额等),可能包含不同的文字类型(中文、英文、数字和符号等),使得识别票据的任务更加困难,需要进一步提高深度学习OCR文字识别方法的准确度。对于多种类型业务和多种文字混合的文字识别应用,目前常用的方法是采用一个通用深度学习文字识别模型,用所有的训练样本(属于不同字段类型的文字字串)训练出一个单个网络通用输出的深度学习网络,再用单一的训练好的通用深度学习文字识别网络对所有票据业务的票据进行识别。单一通用深度学习OCR网络的训练方法参见图1,单一通用深度学习OCR网络的使用方法参见图2。图1和图2中以卷积神经网络加长短时记忆网络以及CTC的网络结构作为深度学习文字识别的模型,但是本专利技术不局限于这种文字识别模型。使用单一通用深度学习OCR网络的方法简单直接,但是通用深度学习文字识别网络的文字识别准确率不够好。而且这种单一网络通用输出的深度学习方法不利于网络增强学习和支持新的业务。如果增加已有业务的新的训练样本或者新的业务的训练样本,需要新的训练样本和大量的旧的训练样本一起用来重新训练深度网络学习网络,无谓地耗费大量时间。为了解决上述问题,提出一种改进方法具体为,根据票据类型或者字段所包含的文字的类型,使用多个深度学习文字识别网络,对不同的票据或者字段类型分别训练和识别专门的深度学习文字识别网络。业务专用深度学习OCR网络的训练方法参见图3,业务专用深度学习OCR网络的使用方法参见图4。分别训练的深度学习文字识别网络能有效提高文字识别准确度,但是对于实时文字识别系统,每个训练好的深度学习文字识别网络都需要同时运行。这种采用多个深度学习网络的识别系统会过多地占据机器内存和增加计算量,大幅降低可以并发支持的OCR系统用户数。
技术实现思路
本专利技术所要解决的技术问题是:如何在提高OCR深度学习网络文字识别准确度的同时,提高计算资源的利用率。为了解决上述技术问题,本专利技术采用的技术方案为:本专利技术提供一种基于构建深度学习网络的票据识别方法,包括:获取多个隐层节点组;每一隐层节点组与不同的票据训练样本集对应;每一隐层节点组中的各隐层节点依次连接;获取所述多个隐层节点组中的第一隐层节点组;所述第一隐层节点组对应的票据训练样本集为所述多个隐层节点组中除去第一隐层节点组外的其余隐层节点组的票据训练样本集的总和;第一隐层节点组中的最后一个隐层节点分别与所述多个隐层节点组中其余隐层节点组的第一个隐层节点连接;所述第一隐层节点组中的第一个隐层节点与预设的输入层连接;所述多个隐层节点组中除所述第一隐层节点组外的其余隐层节点组的最后一个隐层节点分别与预设的输出层连接,得到OCR深度学习网络;所述OCR深度学习网络用于识别票据图像中的字符。优选地,还包括:获取与预设的第一票据图像对应的类别信息,得到第一类别信息;查询所述多个隐层节点组中,与所述第一类别信息对应的一隐层节点组,得到目标隐层节点组;所述OCR深度学习网络识别所述第一票据图像,获取与所述目标隐层节点组对应的输出层输出的第一识别结果。优选地,还包括:统计所述多个隐层节点组的组数数量;所述OCR深度学习网络识别预设的第二票据图像,第二识别结果集合;所述第二识别结果集合的元素总个数与所述组数减一的数量相同;计算所述第二识别结果集合中与每一第二识别结果对应的置信度;标记所述第二识别结果集合中置信度最高的第二识别结果为最优识别结果。优选地,还包括:所述多个隐层节点组包括第二隐层节点组;所述第二隐层节点组与所述第一隐层节点组的票据训练样本集相同。优选地,获取多个隐层节点组,具体为:S1、预设与第一数量对应的第一票据训练样本集;一所述第一票据训练样本集与一类别信息对应;S2、集合所有的所述第一票据训练样本集,得到第二票据训练样本集;S3、所述第一数量加一,得到第二数量;S4、预设与所述第二数量对应的第一深度学习网络;S5、使用所述第二票据训练样本集训练一所述第一深度学习网络,得到第二深度学习网络;S6、使用一所述第一票据训练样本集训练一所述第一深度学习网络,得到一第三深度学习网络;所述第一深度学习网络中前N个隐层节点的参数分别与所述第二深度学习网络中对应的隐层节点的参数相同,且在训练过程中保持不变;N为正整数,取值范围为1至所述第一深度学习网络的隐层节点总数;S7、重复执行S6,直至所有的所述第一票据训练样本集均被遍历,得到与所述第一数量对应的第三深度学习网络;S8、从所述第二深度学习网络中,获取前N个隐层节点,得到第一隐层节点组;S9、从一所述第三深度学习网络中获取第N+1至最后一个隐层节点,得到一第三隐层节点组;S10、重复执行S9,直至所有的所述第三深度学习网络均被遍历;S11、集合所述第一隐层节点组和所有的所述第三隐层节点组,得到所述多个隐层节点组。本专利技术还提供一种基于构建深度学习网络的票据识别终端,包括一个或多个处理器及存储器,所述存储器存储有程序,并且被配置成由所述一个或多个处理器执行以下步骤:获取多个隐层节点组;每一隐层节点组与不同的票据训练样本集对应;每一隐层节点组中的各隐层节点依次连接;获取所述多个隐层节点组中的第一隐层节点组;所述第一隐层节点组对应的票据训练样本集为所述多个隐层节点组中除去第一隐层节点组外的其余隐层节点组的票据训练样本集的总和;第一隐层节点组中的最后一个隐层节点分别与所述多个隐层节点组中其余隐层节点组的第一个隐层节点连接;所述第一隐层节点组中的第一个隐层节点与预设的输入层连接;所述多个隐层节点组中除所述第一隐层节点组外的其余隐层节点组的最后一个隐层节点分别与预设的输出层连接,得到OCR深度学习网络;所述OCR深度学习网络用于识别票据图像中的字符。优选地,还包括:获取与预设的第一票据图像对应的类别信息,得到第一类别信息;查询所述多个隐层节点组中,与所述第一类别信息对应的一隐层节点组,得到目标隐层节点组;所述OCR深度学习网络识别所述第一票据图像,获取与所述目标隐层节点组对应的输出层输出的第一识别结果。优选地,还包括:统计所述多个隐层节点组的组数数量;所述OCR深度学习网络识别预设的第二票据图像,第二识别结果集合;所述第二识别结果集合的元素总个数与所述组数减一的数量相同;计算所述第二识别结果集合中与每一第二识别结果对应的置信度;标记所述第二识别结果集合中置信度最高的第二识别结果为最优识别结果。优选地,还包括:所述多个隐层节点组包括第二隐层节点组;所述第二隐层节点组与所述第一隐层节点组的票据训练样本集相同。优选地,获取多个隐层节点组,具体为:S1、预设与第一数量对应的第一票据训练样本集;一所述第一票据训练样本集与一类别信息对应;S2、集合所有的所述第一票据训练本文档来自技高网
...

【技术保护点】
1.一种基于构建深度学习网络的票据识别方法,其特征在于,包括:获取多个隐层节点组;每一隐层节点组与不同的票据训练样本集对应;每一隐层节点组中的各隐层节点依次连接;获取所述多个隐层节点组中的第一隐层节点组;所述第一隐层节点组对应的票据训练样本集为所述多个隐层节点组中除去第一隐层节点组外的其余隐层节点组的票据训练样本集的总和;第一隐层节点组中的最后一个隐层节点分别与所述多个隐层节点组中其余隐层节点组的第一个隐层节点连接;所述第一隐层节点组中的第一个隐层节点与预设的输入层连接;所述多个隐层节点组中除所述第一隐层节点组外的其余隐层节点组的最后一个隐层节点分别与预设的输出层连接,得到OCR深度学习网络;所述OCR深度学习网络用于识别票据图像中的字符。

【技术特征摘要】
1.一种基于构建深度学习网络的票据识别方法,其特征在于,包括:获取多个隐层节点组;每一隐层节点组与不同的票据训练样本集对应;每一隐层节点组中的各隐层节点依次连接;获取所述多个隐层节点组中的第一隐层节点组;所述第一隐层节点组对应的票据训练样本集为所述多个隐层节点组中除去第一隐层节点组外的其余隐层节点组的票据训练样本集的总和;第一隐层节点组中的最后一个隐层节点分别与所述多个隐层节点组中其余隐层节点组的第一个隐层节点连接;所述第一隐层节点组中的第一个隐层节点与预设的输入层连接;所述多个隐层节点组中除所述第一隐层节点组外的其余隐层节点组的最后一个隐层节点分别与预设的输出层连接,得到OCR深度学习网络;所述OCR深度学习网络用于识别票据图像中的字符。2.根据权利要求1所述的基于构建深度学习网络的票据识别方法,其特征在于,还包括:获取与预设的第一票据图像对应的类别信息,得到第一类别信息;查询所述多个隐层节点组中,与所述第一类别信息对应的一隐层节点组,得到目标隐层节点组;所述OCR深度学习网络识别所述第一票据图像,获取与所述目标隐层节点组对应的输出层输出的第一识别结果。3.根据权利要求1所述的基于构建深度学习网络的票据识别方法,其特征在于,还包括:统计所述多个隐层节点组的组数数量;所述OCR深度学习网络识别预设的第二票据图像,第二识别结果集合;所述第二识别结果集合的元素总个数与所述组数减一的数量相同;计算所述第二识别结果集合中与每一第二识别结果对应的置信度;标记所述第二识别结果集合中置信度最高的第二识别结果为最优识别结果。4.根据权利要求1所述的基于构建深度学习网络的票据识别方法,其特征在于,还包括:所述多个隐层节点组包括第二隐层节点组;所述第二隐层节点组与所述第一隐层节点组的票据训练样本集相同。5.根据权利要求1所述的基于构建深度学习网络的票据识别方法,其特征在于,获取多个隐层节点组,具体为:S1、预设与第一数量对应的第一票据训练样本集;一所述第一票据训练样本集与一类别信息对应;S2、集合所有的所述第一票据训练样本集,得到第二票据训练样本集;S3、所述第一数量加一,得到第二数量;S4、预设与所述第二数量对应的第一深度学习网络;S5、使用所述第二票据训练样本集训练一所述第一深度学习网络,得到第二深度学习网络;S6、使用一所述第一票据训练样本集训练一所述第一深度学习网络,得到一第三深度学习网络;所述第一深度学习网络中前N个隐层节点的参数分别与所述第二深度学习网络中对应的隐层节点的参数相同,且在训练过程中保持不变;N为正整数,取值范围为1至所述第一深度学习网络的隐层节点总数;S7、重复执行S6,直至所有的所述第一票据训练样本集均被遍历,得到与所述第一数量对应的第三深度学习网络;S8、从所述第二深度学习网络中,获取前N个隐层节点,得到第一隐层节点组;S9、从一所述第三深度学习网络中获取第N+1至最后一个隐层节点,得到一第三隐层节点组;S10、重复执行S9,直至所有的所述第三深度学习网络均被遍历;S11、集合所述第一隐层节点组和所有的所述第三隐层节点组,得到所述多个隐层节点组。6.一种基于构建深度学习网络的票据识别终端,其特...

【专利技术属性】
技术研发人员:周异陈凯何建华韦建杜保发周曲
申请(专利权)人:上海深杳智能科技有限公司厦门商集网络科技有限责任公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1