【技术实现步骤摘要】
一种多票据的识别方法及装置
本申请涉及人工智能领域,具体涉及一种多票据的识别方法,同时涉及一种多票据的识别装置。
技术介绍
现有的票据识别技术,包括普通的OCR光学字符定位、还有一部分使用主流的深度学习技术。但都是只能识别单张票据信息,无法应对普通的多张票据报销场景,还是不能从根本上解决票据识别的问题。此外基于光学字符的识别系统,识别率相对较低,后期维护成本较高,无法满足现有的报销市场。
技术实现思路
本申请提供一种多票据的识别方法及装置,解决现有技术基于光学字符的识别系统,识别率相对较低,后期维护成本较高,且一次只能识别单张票据的问题。本申请提供一种多票据的识别方法,包括:对包含多张待识别的票据图像进行预处理;将预处理后的所述票据图像,使用YOLOv3模型同时区分包含多张待识别票据图像中的每张票据,以及定位每张票据图像中的文字;将定位的每张票据图像中的文字使用CRNN+CTC模型进行识别,获取多张待识别的票据信息。优选的,对包含多张待识别的票据图像进行预处理,包括:对包含 ...
【技术保护点】
1.一种多票据的识别方法,其特征在于,包括:/n对包含多张待识别的票据图像进行预处理;/n将预处理后的所述票据图像,使用YOLOv3模型同时区分包含多张待识别票据图像中的每张票据,以及定位每张票据图像中的文字;/n将定位的每张票据图像中的文字使用CRNN+CTC模型进行识别,获取多张待识别的票据信息。/n
【技术特征摘要】
1.一种多票据的识别方法,其特征在于,包括:
对包含多张待识别的票据图像进行预处理;
将预处理后的所述票据图像,使用YOLOv3模型同时区分包含多张待识别票据图像中的每张票据,以及定位每张票据图像中的文字;
将定位的每张票据图像中的文字使用CRNN+CTC模型进行识别,获取多张待识别的票据信息。
2.根据权利要求1所述的方法,其特征在于,对包含多张待识别的票据图像进行预处理,包括:
对包含多张待识别的票据图像进行归一化处理;
获得标准化的票据图像。
3.根据权利要求2所述的方法,其特征在于,所述标准化的票据图像,包括:
大小相等且灰度相同的票据图像。
4.根据权利要求1所述的方法,其特征在于,使用YOLOv3模型同时区分包含多张待识别票据图像中的每张票据,包括:
使用YOLOv3模型区分所述包含多张待识别的票据图像中,每张票据的轮廓,进而获取每张票据的图像;以及
获取包含的待识别票据的数量。
5.根据权利要求1所述的方法,其特征在于,在定位每张票据图像中的文字的步骤之后,还包括:
对每张票据图像中的文字部分进行切割,获取每张票据图像中包含文字部分的图像;
将所述包含文字部分的图像传入CRNN+CTC模型。
6.根据权利要求1所述的方法,其特征在于,将定位的每张票据图像中的文字使用CRNN+CTC模型进行识别,获取多张待识别的票据信息,包括:
CRNN+CTC...
【专利技术属性】
技术研发人员:李兴蒙,刘平君,张玲,陈道龙,叶京翔,李晏光,乔川,
申请(专利权)人:大象慧云信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。