票据图像识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号：28129154 阅读：24 留言：0更新日期：2021-04-19 11:48

本申请实施例中提供了一种票据图像识别方法、装置、电子设备和存储介质，首先通过模板匹配模型对待识别票据图像进行模板匹配处理，为待识别票据图像匹配相应的票据模板，通过参考字段识别模型获取待识别票据图像中的参考字段的位置信息，再根据匹配到的票据模板中预存的目标字段的位置信息与参考字段的位置信息之间的距离信息获取目标字段子图片，再通过文字识别模型对目标字段子图片中的文本进行识别。即使不同的票据图像的大小或者尺寸不同，本方法通过目标字段与参考字段之间的相对位置关系也能较为准确的识别出目标字段子图片，提升了票据图像的识别结果精度。提升了票据图像的识别结果精度。提升了票据图像的识别结果精度。

全部详细技术资料下载

【技术实现步骤摘要】
票据图像识别方法、装置、电子设备和存储介质

[0001]本申请涉及图像处理技术，具体地，涉及一种票据图像识别方法、装置、电子设备和存储介质。

技术介绍

[0002]在生产生活中，票据的形式多种多样，例如，票据可以包括汇票、本票、支票、提单、存单等。每一张票据中包含有大量的票据信息，以票据中的发票为例，发票可以包括发票代码、发票号码、开票日期、购买方名称等票据信息。
[0003]同时，随着社会信息化的不断发展，在人们的日常生活和工作中常常需要对票据进行识别，以将票据上的信息输入至计算机中。
[0004]现有的票据识别技术主要是对扫描文件进行识别，扫描文件的大小和位置固定，较为容易识别。但是随着智能移动设备的普及，目前票据信息通常是以照片的形式进行传递，由于拍摄的方法存在差异，不同的票据照片的大小和尺寸可能存在不同，现有基于扫描文件进行识别的技术在对图片形式的票据进行识别时，识别效果较差。

技术实现思路

[0005]本申请实施例中提供了一种票据图像识别方法、装置、电子设备和存储介质，以解决现有技术对图片形式的票据识别效果较差的问题。
[0006]根据本申请实施例的第一个方面，提供了一种票据图像识别方法，所述方法包括：
[0007]通过模板匹配模型对待识别票据图像进行模板匹配处理，获得与所述待识别票据图像匹配的票据模板，其中，所述票据模板的属性信息包括距离信息，所述距离信息为目标字段与参考字段在所述票据模板上的距离；
[0008]通过参考字段识别模型对所述待识别票据图...

【技术保护点】

【技术特征摘要】
1.一种票据图像识别方法，其特征在于，所述方法包括：通过模板匹配模型对待识别票据图像进行模板匹配处理，获得与所述待识别票据图像匹配的票据模板，其中，所述票据模板的属性信息包括距离信息，所述距离信息为目标字段与参考字段在所述票据模板上的距离；通过参考字段识别模型对所述待识别票据图像进行处理，获得所述待识别票据图像中的参考字段的位置信息；根据所述距离信息及所述待识别票据图像中的参考字段的位置信息获取目标字段子图片；通过文字识别模型识别所述目标字段子图片中的文本。2.根据权利要求1所述的方法，其特征在于，在通过模板匹配模型对待识别票据图像进行模板匹配处理之前，所述方法还包括：获取多个票据模板，并建立票据模板库；针对每个票据模板，对所述票据模板的多个参考字段的位置信息及所述票据模板的多个目标字段的位置信息进行标记；计算每个所述目标字段与每个所述参考字段在所述票据模板上的距离。3.根据权利要求2所述的方法，其特征在于，所述通过参考字段识别模型对所述待识别票据图像进行处理，获得所述待识别票据图像中的参考字段的位置信息，包括：对所述待识别票据图像进行边缘检测处理，获得所述待识别票据图像的边缘特征图像，其中，所述边缘特征图像包括文本内容和表格线段；对所述边缘特征图像进行处理，去除所述边缘特征图像中的表格线段；截取所述边缘特征图像中的文本内容对应的图像信息，获得多个子图像；将多个所述子图像输入至所述参考字段识别模型进行分类识别，获得多个参考字段的位置信息。4.根据权利要求3所述的方法，其特征在于，所述截取所述边缘特征图像中的文本内容对应的图像信息，获得多个子图像，包括：对所述边缘特征图像进行膨胀处理，使相邻的文本内容形成连通域；从所述边缘特征图像中截取与所述连通域的位置信息对应的子图像，获得多个所述子图像。5.根据权利要求1所述的方法，其特征在于，根据所述距离信息及所述待识别票据图像中的参考字段的位置信息获取目标字段子图片，包括：根据所述目标字段与所述参考字段在所述票据模板上的距离及所述待识别票据图像中的参考字段的位置信息计算所述目标字段的位置信息；获取与目标字段的位置信息对应的目标字段子图片。6.根据权利要求1所述的方法，其特征在于，所述方法还包括对所述参考字段识别模型进行训练的步骤，所述步骤包括：获取多个参考字段训练样本，对所述参考字段训练样本进行标记；将多个所...

【专利技术属性】
技术研发人员：张世伟，龚伟松，蔡悦，郭得庆，
申请(专利权)人：上海斑马来拉物流科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人