票据识别方法、装置、设备、计算机存储介质和程序产品制造方法及图纸

技术编号：33628958 阅读：12 留言：0更新日期：2022-06-02 01:29

本申请涉及一种票据识别方法、装置、设备、存储介质和程序产品。所述方法包括：获取待识别票据图像；对所述待识别票据图像进行文本区域检测得到若干文本区域；对所述文本区域进行分类；将不同分类的所述文本区域输入至对应的文字识别模型中以得到票据文字识别结果。采用本方法能够提高文字识别的精度。本方法能够提高文字识别的精度。本方法能够提高文字识别的精度。

全部详细技术资料下载

【技术实现步骤摘要】
票据识别方法、装置、设备、计算机存储介质和程序产品

[0001]本申请涉及图像识别
，特别是涉及一种多文字识别方法、装置、设备、存储介质和程序产品。

技术介绍

[0002]随着图像识别技术的发展，出现了OCR技术，OCR能够快速识别图像中的文字，因此有大量研究人员将OCR技术应用到支票识别中，例如MitekSystems公司的CheckQuest产品已应用于Bank of Thayer，Mount Prospect National Bank等多家银行；法国A2iA公司的A2iA
‑
CheckReader产品也应用于美国、法国等多家商业银行；南京理工大学与中创软件联合研制了金融专用OCR系统；北京惠融金通影像信息技术有限公司和清华大学自动化系联合提出了一个支票自动识别系统，成功应用在中国工商银行的银行系统中。
[0003]但支票存在多种版式以及手写支票中底色和印章干扰、不同类型的字体混杂、手写不规范、三排章盖章错位以及部分字段变淡等因素，使用传统的图像识别技术难以进行精确识别。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种能够精确识别的票据识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面，本申请提供了一种票据识别方法，该方法包括：
[0006]获取待识别票据图像；
[0007]对待识别票据图像进行文本区域检测得到若干文本区域；
[0008]对文本区域进行分类；
[0009...

【技术保护点】

【技术特征摘要】
1.一种票据识别方法，其特征在于，所述方法包括：获取待识别票据图像；对所述待识别票据图像进行文本区域检测得到若干文本区域；对所述文本区域进行分类；将不同分类的所述文本区域输入至对应的文字识别模型中以得到票据文字识别结果。2.根据权利要求1所述的方法，其特征在于，所述对所述文本区域进行分类，包括：对所述文本区域进行分类，得到印刷体文本区域和手写体文本区域；所述将不同分类的所述文本区域输入至对应的文字识别模型中以得到票据文字识别结果，包括：分别识别所述印刷体文本区域和所述手写体文本区域中的文本内容，得到印刷体文本和手写体文本。3.根据权利要求1所述的方法，其特征在于，所述对所述待识别票据图像进行文本区域检测得到若干文本区域之前，还包括：对所述待识别票据图像进行角度矫正。4.根据权利要求3所述的方法，其特征在于，所述对所述待识别票据图像进行角度矫正，包括：对所述待识别票据图像的旋转角度进行分类；根据所述待识别票据图像的旋转角度的类型，对所述待识别票据图像进行角度矫正。5.根据权利要求1
‑
4任意一项所述的方法，所述对所述待识别票据图像进行文本区域检测得到若干文本区域是通过预先训练得到的文本区域检测模型处理得到的；所述对所述文本区域进行分类是通过预先训练得到的文本区域分类模型处理得到的；所述分别识别所述印刷体文本区域和所述手写体文本区域中的文本内容，得到所述印刷体文本和所述手写体文本是通过预先训练得到的印刷体识别模型和手写体识别模型处理得到的；其中，所述文本区域检测模型的训练、所述文本区域分类模型、所述印刷体识别模型和所述手写体识别模型的训练过程包括：读取第一图像，标注所述第一图像中文本区域的位置、文本区域的类型、印刷体内容、手写体内容和旋转角度；根据所述第一图像与对应的所述文本区域的位置进行训练得到所述文本区域检测模型；根据所述第一图像与对应的所述文本区域的类型进行训练得到所述文本区域分类模型；根据所述第一图像与对应的所述印刷体内容训练得到所述印刷体识别模型；根据所述第一图像与对应的所述手写体内容进行训练得到所述手写体识别模型；根据所...

【专利技术属性】
技术研发人员：周丹雅，李捷，王巍，陈鹏宇，厉超，张瑞雪，
申请(专利权)人：上海浦东发展银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人