The invention relates to a bill recognition method and a terminal based on constructing a deep learning network, belonging to the field of data processing. The first hidden layer node group corresponds to the first hidden layer node group; the first hidden layer node group corresponds to the sum of the bill training sample set of all hidden layer node groups; and the last hidden layer node group in the first hidden layer node group corresponds to the last hidden layer node group. The first hidden layer node group of the remaining hidden layer node groups is connected with the first hidden layer node group; the first hidden layer node group of the first hidden layer node group is connected with the preset input layer; the last hidden layer node group of the other hidden layer node groups except the first hidden layer node group is connected with the preset output layer separately, and the OCR deep learning network is obtained. It can improve the accuracy of OCR in-depth learning network and the utilization of computing resources.
【技术实现步骤摘要】
一种基于构建深度学习网络的票据识别方法及终端
本专利技术涉及一种基于构建深度学习网络的票据识别方法及终端,属于数据处理领域。
技术介绍
基于深度学习的OCR文字识别方法近几年来发展迅猛,尤其是在英文和数字识别方面,文字识别的准确率接近人工识别的水平,帮助实现多种场景应用的落地。但是对于中文识别以及中英文混合等复杂的应用场景,目前深度学习OCR识别的准确率还有待提高。尤其是票据文字识别应用系统,对准确率有极高的要求,但是票据种类繁多(比如增值税发票,飞机票,的士票等),每种票据里面有不同字段(姓名,地址,金额等),可能包含不同的文字类型(中文、英文、数字和符号等),使得识别票据的任务更加困难,需要进一步提高深度学习OCR文字识别方法的准确度。对于多种类型业务和多种文字混合的文字识别应用,目前常用的方法是采用一个通用深度学习文字识别模型,用所有的训练样本(属于不同字段类型的文字字串)训练出一个单个网络通用输出的深度学习网络,再用单一的训练好的通用深度学习文字识别网络对所有票据业务的票据进行识别。单一通用深度学习OCR网络的训练方法参见图1,单一通用深度学习OCR网络的使用方法参见图2。图1和图2中以卷积神经网络加长短时记忆网络以及CTC的网络结构作为深度学习文字识别的模型,但是本专利技术不局限于这种文字识别模型。使用单一通用深度学习OCR网络的方法简单直接,但是通用深度学习文字识别网络的文字识别准确率不够好。而且这种单一网络通用输出的深度学习方法不利于网络增强学习和支持新的业务。如果增加已有业务的新的训练样本或者新的业务的训练样本,需要新的训练样本和大量的旧的 ...
【技术保护点】
1.一种基于构建深度学习网络的票据识别方法,其特征在于,包括:获取多个隐层节点组;每一隐层节点组与不同的票据训练样本集对应;每一隐层节点组中的各隐层节点依次连接;获取所述多个隐层节点组中的第一隐层节点组;所述第一隐层节点组对应的票据训练样本集为所述多个隐层节点组中除去第一隐层节点组外的其余隐层节点组的票据训练样本集的总和;第一隐层节点组中的最后一个隐层节点分别与所述多个隐层节点组中其余隐层节点组的第一个隐层节点连接;所述第一隐层节点组中的第一个隐层节点与预设的输入层连接;所述多个隐层节点组中除所述第一隐层节点组外的其余隐层节点组的最后一个隐层节点分别与预设的输出层连接,得到OCR深度学习网络;所述OCR深度学习网络用于识别票据图像中的字符。
【技术特征摘要】
1.一种基于构建深度学习网络的票据识别方法,其特征在于,包括:获取多个隐层节点组;每一隐层节点组与不同的票据训练样本集对应;每一隐层节点组中的各隐层节点依次连接;获取所述多个隐层节点组中的第一隐层节点组;所述第一隐层节点组对应的票据训练样本集为所述多个隐层节点组中除去第一隐层节点组外的其余隐层节点组的票据训练样本集的总和;第一隐层节点组中的最后一个隐层节点分别与所述多个隐层节点组中其余隐层节点组的第一个隐层节点连接;所述第一隐层节点组中的第一个隐层节点与预设的输入层连接;所述多个隐层节点组中除所述第一隐层节点组外的其余隐层节点组的最后一个隐层节点分别与预设的输出层连接,得到OCR深度学习网络;所述OCR深度学习网络用于识别票据图像中的字符。2.根据权利要求1所述的基于构建深度学习网络的票据识别方法,其特征在于,还包括:获取与预设的第一票据图像对应的类别信息,得到第一类别信息;查询所述多个隐层节点组中,与所述第一类别信息对应的一隐层节点组,得到目标隐层节点组;所述OCR深度学习网络识别所述第一票据图像,获取与所述目标隐层节点组对应的输出层输出的第一识别结果。3.根据权利要求1所述的基于构建深度学习网络的票据识别方法,其特征在于,还包括:统计所述多个隐层节点组的组数数量;所述OCR深度学习网络识别预设的第二票据图像,第二识别结果集合;所述第二识别结果集合的元素总个数与所述组数减一的数量相同;计算所述第二识别结果集合中与每一第二识别结果对应的置信度;标记所述第二识别结果集合中置信度最高的第二识别结果为最优识别结果。4.根据权利要求1所述的基于构建深度学习网络的票据识别方法,其特征在于,还包括:所述多个隐层节点组包括第二隐层节点组;所述第二隐层节点组与所述第一隐层节点组的票据训练样本集相同。5.根据权利要求1所述的基于构建深度学习网络的票据识别方法,其特征在于,获取多个隐层节点组,具体为:S1、预设与第一数量对应的第一票据训练样本集;一所述第一票据训练样本集与一类别信息对应;S2、集合所有的所述第一票据训练样本集,得到第二票据训练样本集;S3、所述第一数量加一,得到第二数量;S4、预设与所述第二数量对应的第一深度学习网络;S5、使用所述第二票据训练样本集训练一所述第一深度学习网络,得到第二深度学习网络;S6、使用一所述第一票据训练样本集训练一所述第一深度学习网络,得到一第三深度学习网络;所述第一深度学习网络中前N个隐层节点的参数分别与所述第二深度学习网络中对应的隐层节点的参数相同,且在训练过程中保持不变;N为正整数,取值范围为1至所述第一深度学习网络的隐层节点总数;S7、重复执行S6,直至所有的所述第一票据训练样本集均被遍历,得到与所述第一数量对应的第三深度学习网络;S8、从所述第二深度学习网络中,获取前N个隐层节点,得到第一隐层节点组;S9、从一所述第三深度学习网络中获取第N+1至最后一个隐层节点,得到一第三隐层节点组;S10、重复执行S9,直至所有的所述第三深度学习网络均被遍历;S11、集合所述第一隐层节点组和所有的所述第三隐层节点组,得到所述多个隐层节点组。6.一种基于构建深度学习网络的票据识别终端,其特...
【专利技术属性】
技术研发人员:周异,陈凯,何建华,韦建,杜保发,周曲,
申请(专利权)人:上海深杳智能科技有限公司,厦门商集网络科技有限责任公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。