票据图像识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号:28129154 阅读:24 留言:0更新日期:2021-04-19 11:48
本申请实施例中提供了一种票据图像识别方法、装置、电子设备和存储介质,首先通过模板匹配模型对待识别票据图像进行模板匹配处理,为待识别票据图像匹配相应的票据模板,通过参考字段识别模型获取待识别票据图像中的参考字段的位置信息,再根据匹配到的票据模板中预存的目标字段的位置信息与参考字段的位置信息之间的距离信息获取目标字段子图片,再通过文字识别模型对目标字段子图片中的文本进行识别。即使不同的票据图像的大小或者尺寸不同,本方法通过目标字段与参考字段之间的相对位置关系也能较为准确的识别出目标字段子图片,提升了票据图像的识别结果精度。提升了票据图像的识别结果精度。提升了票据图像的识别结果精度。

【技术实现步骤摘要】
票据图像识别方法、装置、电子设备和存储介质


[0001]本申请涉及图像处理技术,具体地,涉及一种票据图像识别方法、装置、电子设备和存储介质。

技术介绍

[0002]在生产生活中,票据的形式多种多样,例如,票据可以包括汇票、本票、支票、提单、存单等。每一张票据中包含有大量的票据信息,以票据中的发票为例,发票可以包括发票代码、发票号码、开票日期、购买方名称等票据信息。
[0003]同时,随着社会信息化的不断发展,在人们的日常生活和工作中常常需要对票据进行识别,以将票据上的信息输入至计算机中。
[0004]现有的票据识别技术主要是对扫描文件进行识别,扫描文件的大小和位置固定,较为容易识别。但是随着智能移动设备的普及,目前票据信息通常是以照片的形式进行传递,由于拍摄的方法存在差异,不同的票据照片的大小和尺寸可能存在不同,现有基于扫描文件进行识别的技术在对图片形式的票据进行识别时,识别效果较差。

技术实现思路

[0005]本申请实施例中提供了一种票据图像识别方法、装置、电子设备和存储介质,以解决现有技术对图片形式的票据识别效果较差的问题。
[0006]根据本申请实施例的第一个方面,提供了一种票据图像识别方法,所述方法包括:
[0007]通过模板匹配模型对待识别票据图像进行模板匹配处理,获得与所述待识别票据图像匹配的票据模板,其中,所述票据模板的属性信息包括距离信息,所述距离信息为目标字段与参考字段在所述票据模板上的距离;
[0008]通过参考字段识别模型对所述待识别票据图像进行处理,获得所述待识别票据图像中的参考字段的位置信息;
[0009]根据所述距离信息及所述待识别票据图像中的参考字段的位置信息获取目标字段子图片;
[0010]通过文字识别模型识别所述目标字段子图片中的文本。
[0011]在一种可选的实施方式中,在通过模板匹配模型对待识别票据图像进行模板匹配处理之前,所述方法还包括:
[0012]获取多个票据模板,并建立票据模板库;
[0013]针对每个票据模板,对所述票据模板的多个参考字段的位置信息及所述票据模板的多个目标字段的位置信息进行标记;
[0014]计算每个所述目标字段与每个所述参考字段在所述票据模板上的距离。
[0015]在一种可选的实施方式中,所述通过参考字段识别模型对所述待识别票据图像进行处理,获得所述待识别票据图像中的参考字段的位置信息,包括:
[0016]对所述待识别票据图像进行边缘检测处理,获得所述待识别票据图像的边缘特征
图像,其中,所述边缘特征图像包括文本内容和表格线段;
[0017]对所述边缘特征图像进行处理,去除所述边缘特征图像中的表格线段;
[0018]截取所述边缘特征图像中的文本内容对应的图像信息,获得多个子图像;
[0019]将多个所述子图像输入至所述参考字段识别模型进行分类识别,获得多个参考字段的位置信息。
[0020]在一种可选的实施方式中,所述截取所述边缘特征图像中的文本内容对应的图像信息,获得多个子图像,包括:
[0021]对所述边缘特征图像进行膨胀处理,使相邻的文本内容形成连通域;
[0022]从所述边缘特征图像中截取与所述连通域的位置信息对应的子图像,获得多个所述子图像。
[0023]在一种可选的实施方式中,根据所述距离信息及所述待识别票据图像中的参考字段的位置信息获取目标字段子图片,包括:
[0024]根据所述目标字段与所述参考字段在所述票据模板上的距离及所述待识别票据图像中的参考字段的位置信息计算所述目标字段的位置信息;
[0025]获取与目标字段的位置信息对应的目标字段子图片。
[0026]在一种可选的实施方式中,所述方法还包括对所述参考字段识别模型进行训练的步骤,所述步骤包括:
[0027]获取多个参考字段训练样本,对所述参考字段训练样本进行标记;
[0028]将多个所述参考字段训练样本输入至深度学习图片分类模型中进行训练,获得参考字段分类结果;
[0029]根据各个所述参考字段分类结果与各个所述参考字段训练样本的标记结果计算所述深度学习图片分类模型的分类准确度;
[0030]当所述分类准确度不大于预设阈值时,调整所述深度学习图片分类模型的网络参数;
[0031]重复将多个所述参考字段训练样本输入至深度学习图片分类模型中进行训练的步骤,直至所述分类准确度大于预设阈值,完成训练,获得训练好的参考字段识别模型。
[0032]在一种可选的实施方式中,所述方法还包括对所述模板匹配模型进行训练的步骤,所述步骤包括:
[0033]获取多个模板训练样本,并对每个所述模板训练样本进行标记;
[0034]构建深度学习图片分类模型对多个所述模板训练样本进行分类识别,获得各个所述模板训练样本的模板分类结果;
[0035]根据各个所述模板分类结果与各个所述模板训练样本的标记结果计算所述深度学习图片分类模型的分类准确度;
[0036]当所述分类准确度不大于预设阈值时,调整所述深度学习图片分类模型的网络参数;
[0037]重复将多个所述模板训练样本输入至深度学习图片分类模型中进行训练的步骤,直至所述分类准确度大于预设阈值,完成训练,获得训练好的模板匹配模型。
[0038]根据本申请实施例的第二个方面,提供了一种票据图像识别装置,所述装置包括:
[0039]模板匹配模块,用于通过模板匹配模型对待识别票据图像进行模板匹配处理,获
得与所述待识别票据图像匹配的票据模板,其中,所述票据模板的属性信息包括距离信息,所述距离信息为目标字段与参考字段在所述票据模板上的距离;
[0040]参考字段获取模块,用于通过参考字段识别模型对所述待识别票据图像进行处理,获得所述待识别票据图像中的参考字段的位置信息;
[0041]目标字段子图片获取模块,用于根据所述距离信息及所述待识别票据图像中的参考字段的位置信息获取目标字段子图片;
[0042]文本识别模块,用于通过文字识别模型识别所述目标字段子图片中的文本值。
[0043]根据本申请实施例的第三个方面,提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述处理器与所述存储器之间通过所述总线通信,所述机器可读指令被所述处理器执行时执行上述的票据图像识别方法。
[0044]根据本申请实施例的第四个方面,提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述的票据图像识别方法。
[0045]本申请实施例中提供了一种票据图像识别方法、装置、电子设备和存储介质,首先通过模板匹配模型对待识别票据图像进行模板匹配处理,为待识别票据图像匹配相应的票据模板,通过参考字段识别模型获取待识别票据图像中的参考字段的位置信息,再根据匹配到的票据模板中预存的目标字本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种票据图像识别方法,其特征在于,所述方法包括:通过模板匹配模型对待识别票据图像进行模板匹配处理,获得与所述待识别票据图像匹配的票据模板,其中,所述票据模板的属性信息包括距离信息,所述距离信息为目标字段与参考字段在所述票据模板上的距离;通过参考字段识别模型对所述待识别票据图像进行处理,获得所述待识别票据图像中的参考字段的位置信息;根据所述距离信息及所述待识别票据图像中的参考字段的位置信息获取目标字段子图片;通过文字识别模型识别所述目标字段子图片中的文本。2.根据权利要求1所述的方法,其特征在于,在通过模板匹配模型对待识别票据图像进行模板匹配处理之前,所述方法还包括:获取多个票据模板,并建立票据模板库;针对每个票据模板,对所述票据模板的多个参考字段的位置信息及所述票据模板的多个目标字段的位置信息进行标记;计算每个所述目标字段与每个所述参考字段在所述票据模板上的距离。3.根据权利要求2所述的方法,其特征在于,所述通过参考字段识别模型对所述待识别票据图像进行处理,获得所述待识别票据图像中的参考字段的位置信息,包括:对所述待识别票据图像进行边缘检测处理,获得所述待识别票据图像的边缘特征图像,其中,所述边缘特征图像包括文本内容和表格线段;对所述边缘特征图像进行处理,去除所述边缘特征图像中的表格线段;截取所述边缘特征图像中的文本内容对应的图像信息,获得多个子图像;将多个所述子图像输入至所述参考字段识别模型进行分类识别,获得多个参考字段的位置信息。4.根据权利要求3所述的方法,其特征在于,所述截取所述边缘特征图像中的文本内容对应的图像信息,获得多个子图像,包括:对所述边缘特征图像进行膨胀处理,使相邻的文本内容形成连通域;从所述边缘特征图像中截取与所述连通域的位置信息对应的子图像,获得多个所述子图像。5.根据权利要求1所述的方法,其特征在于,根据所述距离信息及所述待识别票据图像中的参考字段的位置信息获取目标字段子图片,包括:根据所述目标字段与所述参考字段在所述票据模板上的距离及所述待识别票据图像中的参考字段的位置信息计算所述目标字段的位置信息;获取与目标字段的位置信息对应的目标字段子图片。6.根据权利要求1所述的方法,其特征在于,所述方法还包括对所述参考字段识别模型进行训练的步骤,所述步骤包括:获取多个参考字段训练样本,对所述参考字段训练样本进行标记;将多个所...

【专利技术属性】
技术研发人员:张世伟龚伟松蔡悦郭得庆
申请(专利权)人:上海斑马来拉物流科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1