一种多票识别方法、系统及可读存储介质技术方案

技术编号：27110811 阅读：30 留言：0更新日期：2021-01-25 19:06

本发明专利技术提出一种多票识别方法，包括：步骤S10，基于单据图片和预先训练的单票识别模型，识别图片上的每个单据区域；步骤S11，基于每个单据的图片和预先训练的信息区域识别模型，识别单据上的每个区域；步骤S12，切割并获取所述每个区域的图片；以及步骤S13，基于每个区域的图片、以及预先训练的OCR识别模型，识别所述每个区域中的字符，从而确定单据上记载的信息，其中，单票识别模型、信息区域识别模型以及OCR识别模型是基于神经网络的模型。本发明专利技术还提供了相应的系统以及可读存储介质。实施本发明专利技术，本发明专利技术能够高效、准确地识别多种单据上记载的信息。信息。信息。

全部详细技术资料下载

【技术实现步骤摘要】
一种多票识别方法、系统及可读存储介质

[0001]本专利技术涉及票据的自动识别
，涉及一种多票识别方法、系统及可读存储介质。

技术介绍

[0002]随着经济的不断发展，人们的消费水平不断的提高，为了维护人们的消费权益，票据成为了消费者的有力保障以及有效的报销凭证，因此财务人员每天需要处理大量的票据。同时也有越来越多的人通过记账分类统计以掌握自身的消费情况。目前虽然可以通过人工智能自动识别票据中的相关信息，但是现有技术中一次只能识别一张票据的信息，当票据较多时，仍然需要花费较多时间和精力逐个进行票据识别。

技术实现思路

[0003]本专利技术所要解决的技术问题在于，提供一种多票识别方法、系统及可读存储介质，可以实施自动、高效且准确地对多张票据进行识别，并提取信息。
[0004]根据本专利技术的第一方面，提供了一种多票识别方法，包括：
[0005]基于单据图片和预先训练的单票识别模型，识别单据图片上的一个或多个单据区域中的每个单据区域，其中，所述单票识别模型是基于神经网络的模型；
[0006]基于所述每个单据的图片和预先训练的信息区域识别模型，识别所述单据上的一个或多个区域中的每个区域，所述一个或多个区域中的每个区域与所述单据上记载的全部或部分信息相关联，其中，所述信息区域识别模型是基于神经网络的模型；
[0007]切割并获取所述一个或多个区域中的每个区域的图片；以及
[0008]基于所述一个或多个区域中的每个区域的图片、以及预先训练的OCR识别模型，识别所述...

【技术保护点】

【技术特征摘要】
1.一种多票识别方法，其特征在于，包括：步骤S10，基于单据图片和预先训练的单票识别模型，识别单据图片上的一个或多个单据区域中的每个单据区域，其中，所述单票识别模型是基于神经网络的模型；步骤S11，基于所述每个单据的图片和预先训练的信息区域识别模型，识别所述单据上的一个或多个区域中的每个区域，所述一个或多个区域中的每个区域与所述单据上记载的全部或部分信息相关联，其中，所述信息区域识别模型是基于神经网络的模型；步骤S12，切割并获取所述一个或多个区域中的每个区域的图片；以及步骤S13，基于所述一个或多个区域中的每个区域的图片、以及预先训练的OCR识别模型，识别所述一个或多个区域中的每个区域中的字符，从而确定所述单据上记载的信息，其中，所述OCR识别模型是基于神经网络的模型。2.根据权利要求1所述的识别方法，其特征在于，所述识别图片上的一个或多个单据区域中的每个单据区域步骤后，对每个单据区域进行切割并获取每个单据的图片，并将每个单据的图片分别输入所述信息区域识别模型进行处理。3.根据权利要求2所述的识别方法，其特征在于，所述步骤S12中进一步包括：响应于相对于水平线有倾斜的矩形，对所述每个区域的图片进行倾斜校正处理，并将处理后的每个区域的图片输入所述OCR识别模型，来识别所述一个或多个区域中的每个区域中的字符。4.根据权利要求3所述的识别方法，其特征在于，在所述步骤S13中进一步包括：通过所述OCR识别模型，基于所述一个或多个区域中的每个区域的图片以及其在整张单据中的位置，来识别所述一个或多个区域中的每个区域中的字符。5.根据权利要求4所述的识别方法，其特征在于，所述方法还包括：基于所述单据的图片和所述信息区域识别模型，还识别与所述一个或多个区域中的每个区域相关联的信息的信息类型；以及基于识别出的与所述一个或多个区域中的每个区域相关联的信息的所述信息类型、以及识别出的所述一个或多个区域中的每个区域中的所述字符，来确定所述单据上记载的信息。6.根据权利要求1至5任一项所述的识别方法，其特征在于，所述单票识别模型通过如下过程得到：对第一单据图片样本训练集中的每个包含有多张单据的图片样本进行标注处理，以标注出每个单据图片样本中的一个或多个单据区域中的每个单据区域；以及通过经过所述标注处理的所述第一单据图片样本训练集，对第一神经网络进行训练，以得到所述单票识别模型。7.根据权利要求6所述的识别方法，其特征在于，所述信息区域识别模型通过如下过程得到：对第二单据图片样本训练集中的每个单据图片样本进...

【专利技术属性】
技术研发人员：郑福康，陈妍，卢占宽，刘玲玲，陈晓阳，
申请(专利权)人：深圳供电局有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人