一种多票据的识别方法及装置制造方法及图纸

技术编号：24757949 阅读：63 留言：0更新日期：2020-07-04 09:33

本发明专利技术公开了一种多票据的识别方法，包括：对包含多张待识别的票据图像进行预处理；将预处理后的所述票据图像，使用YOLOv3模型同时区分包含多张待识别票据图像中的每张票据，以及定位每张票据图像中的文字；将定位的每张票据图像中的文字使用CRNN+CTC模型进行识别，获取多张待识别的票据信息，解决现有技术基于光学字符的识别系统，识别率相对较低，后期维护成本较高，且一次只能识别单张票据的问题。

A method and device for multi bill recognition

全部详细技术资料下载

【技术实现步骤摘要】
一种多票据的识别方法及装置
本申请涉及人工智能领域，具体涉及一种多票据的识别方法，同时涉及一种多票据的识别装置。
技术介绍
现有的票据识别技术，包括普通的OCR光学字符定位、还有一部分使用主流的深度学习技术。但都是只能识别单张票据信息，无法应对普通的多张票据报销场景，还是不能从根本上解决票据识别的问题。此外基于光学字符的识别系统，识别率相对较低，后期维护成本较高，无法满足现有的报销市场。
技术实现思路
本申请提供一种多票据的识别方法及装置，解决现有技术基于光学字符的识别系统，识别率相对较低，后期维护成本较高，且一次只能识别单张票据的问题。本申请提供一种多票据的识别方法，包括：对包含多张待识别的票据图像进行预处理；将预处理后的所述票据图像，使用YOLOv3模型同时区分包含多张待识别票据图像中的每张票据，以及定位每张票据图像中的文字；将定位的每张票据图像中的文字使用CRNN+CTC模型进行识别，获取多张待识别的票据信息。优选的，对包含多张待识别的票据图像进行预处理，包括：对包含...

【技术保护点】
1.一种多票据的识别方法，其特征在于，包括：/n对包含多张待识别的票据图像进行预处理；/n将预处理后的所述票据图像，使用YOLOv3模型同时区分包含多张待识别票据图像中的每张票据，以及定位每张票据图像中的文字；/n将定位的每张票据图像中的文字使用CRNN+CTC模型进行识别，获取多张待识别的票据信息。/n

【技术特征摘要】
1.一种多票据的识别方法，其特征在于，包括：
对包含多张待识别的票据图像进行预处理；
将预处理后的所述票据图像，使用YOLOv3模型同时区分包含多张待识别票据图像中的每张票据，以及定位每张票据图像中的文字；
将定位的每张票据图像中的文字使用CRNN+CTC模型进行识别，获取多张待识别的票据信息。

2.根据权利要求1所述的方法，其特征在于，对包含多张待识别的票据图像进行预处理，包括：
对包含多张待识别的票据图像进行归一化处理；
获得标准化的票据图像。

3.根据权利要求2所述的方法，其特征在于，所述标准化的票据图像，包括：
大小相等且灰度相同的票据图像。

4.根据权利要求1所述的方法，其特征在于，使用YOLOv3模型同时区分包含多张待识别票据图像中的每张票据，包括：
使用YOLOv3模型区分所述包含多张待识别的票据图像中，每张票据的轮廓，进而获取每张票据的图像；以及
获取包含的待识别票据的数量。

5.根据权利要求1所述的方法，其特征在于，在定位每张票据图像中的文字的步骤之后，还包括：
对每张票据图像中的文字部分进行切割，获取每张票据图像中包含文字部分的图像；
将所述包含文字部分的图像传入CRNN+CTC模型。

6.根据权利要求1所述的方法，其特征在于，将定位的每张票据图像中的文字使用CRNN+CTC模型进行识别，获取多张待识别的票据信息，包括：
CRNN+CTC...

【专利技术属性】
技术研发人员：李兴蒙，刘平君，张玲，陈道龙，叶京翔，李晏光，乔川，
申请(专利权)人：大象慧云信息技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人