一种多票识别方法、系统及可读存储介质技术方案

技术编号:27110811 阅读:30 留言:0更新日期:2021-01-25 19:06
本发明专利技术提出一种多票识别方法,包括:步骤S10,基于单据图片和预先训练的单票识别模型,识别图片上的每个单据区域;步骤S11,基于每个单据的图片和预先训练的信息区域识别模型,识别单据上的每个区域;步骤S12,切割并获取所述每个区域的图片;以及步骤S13,基于每个区域的图片、以及预先训练的OCR识别模型,识别所述每个区域中的字符,从而确定单据上记载的信息,其中,单票识别模型、信息区域识别模型以及OCR识别模型是基于神经网络的模型。本发明专利技术还提供了相应的系统以及可读存储介质。实施本发明专利技术,本发明专利技术能够高效、准确地识别多种单据上记载的信息。信息。信息。

【技术实现步骤摘要】
一种多票识别方法、系统及可读存储介质


[0001]本专利技术涉及票据的自动识别
,涉及一种多票识别方法、系统及可读存储介质。

技术介绍

[0002]随着经济的不断发展,人们的消费水平不断的提高,为了维护人们的消费权益,票据成为了消费者的有力保障以及有效的报销凭证,因此财务人员每天需要处理大量的票据。同时也有越来越多的人通过记账分类统计以掌握自身的消费情况。目前虽然可以通过人工智能自动识别票据中的相关信息,但是现有技术中一次只能识别一张票据的信息,当票据较多时,仍然需要花费较多时间和精力逐个进行票据识别。

技术实现思路

[0003]本专利技术所要解决的技术问题在于,提供一种多票识别方法、系统及可读存储介质,可以实施自动、高效且准确地对多张票据进行识别,并提取信息。
[0004]根据本专利技术的第一方面,提供了一种多票识别方法,包括:
[0005]基于单据图片和预先训练的单票识别模型,识别单据图片上的一个或多个单据区域中的每个单据区域,其中,所述单票识别模型是基于神经网络的模型;
[0006]基于所述每个单据的图片和预先训练的信息区域识别模型,识别所述单据上的一个或多个区域中的每个区域,所述一个或多个区域中的每个区域与所述单据上记载的全部或部分信息相关联,其中,所述信息区域识别模型是基于神经网络的模型;
[0007]切割并获取所述一个或多个区域中的每个区域的图片;以及
[0008]基于所述一个或多个区域中的每个区域的图片、以及预先训练的OCR识别模型,识别所述一个或多个区域中的每个区域中的字符,从而确定所述单据上记载的信息,其中,所述OCR识别模型是基于神经网络的模型。
[0009]根据本专利技术的第二方面,提供了一种多票识别系统,其包含:
[0010]第一识别单元,用于基于单据图片和预先训练的单票识别模型,识别单据图片上的一个或多个单据区域中的每个单据区域;
[0011]第二识别单元,用于基于所述每个单据的图片和所述信息区域识别模型,识别所述单据上的一个或多个区域中的每个区域,所述一个或多个区域中的每个区域与所述单据上记载的全部或部分信息相关联;
[0012]切割处理单元,用于切割并获取所述一个或多个区域中的每个区域的图片;以及
[0013]第三识别单元,用于基于所述一个或多个区域中的每个区域的图片、以及预先训练的OCR识别模型,识别所述一个或多个区域中的每个区域中的字符,从而确定所述单据上记载的信息;
[0014]其中,所述单票识别模型、信息区域识别模型以及OCR识别模型均是基于神经网络的模型。
[0015]根据本专利技术的第三方面,提供了一种非临时性计算机可读存储介质,所述非临时性计算机可读存储介质上存储有一系列计算机可执行的指令,当所述一系列计算机可执行的指令被一个或多个计算装置执行时,使得所述一个或多个计算装置实现如下的步骤:
[0016]基于单据图片和预先训练的单票识别模型,识别单据图片上的一个或多个单据区域中的每个单据区域,其中,所述单票识别模型是基于神经网络的模型;
[0017]基于所述单据的图片和预先训练的信息区域识别模型,识别所述单据上的一个或多个区域中的每个区域,所述一个或多个区域中的每个区域与所述单据上记载的全部或部分信息相关联,其中,所述信息区域识别模型是基于神经网络的模型;
[0018]切割并获取所述一个或多个区域中的每个区域的图片;以及
[0019]基于所述一个或多个区域中的每个区域的图片、以及预先训练的OCR识别模型,识别所述一个或多个区域中的每个区域中的字符,从而确定所述单据上记载的信息,其中,所述OCR识别模型是基于神经网络的模型。
[0020]实施本专利技术,具有如下的有益效果:
[0021]本专利技术实施例提供一种多票识别方法、系统及可读存储介质,通过设置基于神经网络的模型所述单票识别模型、信息区域识别模型以及OCR识别模型,并进行预先训练,可以实现自动且准确地对多张票据进行识别,并提取信息。提高了对多张票据识别的速度以及准确率,提高了工作效率。
附图说明
[0022]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本专利技术的范畴。
[0023]图1为本专利技术提供的一种多票识别方法的一个实施例的主流程示意图;
[0024]图2为本专利技术提供的一种多票识别系统的一个实施例的结构示意图。
具体实施方式
[0025]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。
[0026]以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。
[0027]对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0028]为使本领域的普通技术人员更加清楚地理解专利技术的目的、技术方案和优点,以下结合附图和实施例对专利技术做进一步的阐述。
[0029]本专利技术提供了一种多票识别方法,包括:基于单据图片和预先训练的单票识别模型,识别单据图片上的一个或多个单据区域中的每个单据区域,其中,所述单票识别模型是基于神经网络的模型;基于所述每个单据的图片和预先训练的信息区域识别模型,识别所
述单据上的一个或多个区域中的每个区域,所述一个或多个区域中的每个区域与所述单据上记载的全部或部分信息相关联,其中,所述信息区域识别模型是基于神经网络的模型;切割并获取所述一个或多个区域中的每个区域的图片;以及基于所述一个或多个区域中的每个区域的图片、以及预先训练的OCR识别模型,识别所述一个或多个区域中的每个区域中的字符,从而确定所述单据上记载的信息,其中,所述OCR识别模型是基于神经网络的模型。
[0030]在一些实施例中,通过所述OCR识别模型,基于所述一个或多个区域中的每个区域的图片以及其在整张单据中的位置,来识别所述一个或多个区域中的每个区域中的字符。
[0031]应当理解,本专利技术所称的“单据”是指在其上记载有信息的实体,这些信息以一些模式被布置在单据上,并由中文字、外文字、数字、符号、图形等中的一种或多种形式来承载。本专利技术所称的“单据”的一些具体示例可以是,发票、账单、税单、收据、购物清单、餐饮小票、保险单、报销单、存款流水单、信用卡对账单、快递单、行程单、车票、登机牌、专利公开文本的信息页、选票、调查问卷、评价表、签到表、申请表等各种由人工和/或机器填写的单据。其中,报销单可以视为包含有多张发票并粘帖在一张纸张上的单据形式。本领域技本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多票识别方法,其特征在于,包括:步骤S10,基于单据图片和预先训练的单票识别模型,识别单据图片上的一个或多个单据区域中的每个单据区域,其中,所述单票识别模型是基于神经网络的模型;步骤S11,基于所述每个单据的图片和预先训练的信息区域识别模型,识别所述单据上的一个或多个区域中的每个区域,所述一个或多个区域中的每个区域与所述单据上记载的全部或部分信息相关联,其中,所述信息区域识别模型是基于神经网络的模型;步骤S12,切割并获取所述一个或多个区域中的每个区域的图片;以及步骤S13,基于所述一个或多个区域中的每个区域的图片、以及预先训练的OCR识别模型,识别所述一个或多个区域中的每个区域中的字符,从而确定所述单据上记载的信息,其中,所述OCR识别模型是基于神经网络的模型。2.根据权利要求1所述的识别方法,其特征在于,所述识别图片上的一个或多个单据区域中的每个单据区域步骤后,对每个单据区域进行切割并获取每个单据的图片,并将每个单据的图片分别输入所述信息区域识别模型进行处理。3.根据权利要求2所述的识别方法,其特征在于,所述步骤S12中进一步包括:响应于相对于水平线有倾斜的矩形,对所述每个区域的图片进行倾斜校正处理,并将处理后的每个区域的图片输入所述OCR识别模型,来识别所述一个或多个区域中的每个区域中的字符。4.根据权利要求3所述的识别方法,其特征在于,在所述步骤S13中进一步包括:通过所述OCR识别模型,基于所述一个或多个区域中的每个区域的图片以及其在整张单据中的位置,来识别所述一个或多个区域中的每个区域中的字符。5.根据权利要求4所述的识别方法,其特征在于,所述方法还包括:基于所述单据的图片和所述信息区域识别模型,还识别与所述一个或多个区域中的每个区域相关联的信息的信息类型;以及基于识别出的与所述一个或多个区域中的每个区域相关联的信息的所述信息类型、以及识别出的所述一个或多个区域中的每个区域中的所述字符,来确定所述单据上记载的信息。6.根据权利要求1至5任一项所述的识别方法,其特征在于,所述单票识别模型通过如下过程得到:对第一单据图片样本训练集中的每个包含有多张单据的图片样本进行标注处理,以标注出每个单据图片样本中的一个或多个单据区域中的每个单据区域;以及通过经过所述标注处理的所述第一单据图片样本训练集,对第一神经网络进行训练,以得到所述单票识别模型。7.根据权利要求6所述的识别方法,其特征在于,所述信息区域识别模型通过如下过程得到:对第二单据图片样本训练集中的每个单据图片样本进...

【专利技术属性】
技术研发人员:郑福康陈妍卢占宽刘玲玲陈晓阳
申请(专利权)人:深圳供电局有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1