一种票据信息的提取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:28422019 阅读:18 留言:0更新日期:2021-05-11 18:29
本公开公开了一种票据信息的提取方法、装置、电子设备及存储介质,涉及人工智能领域,具体涉及计算机视觉和深度学习技术。具体实现方案为:将待识别票据输入至预先训练好的深度学习网络中,通过深度学习网络得到待识别票据对应的视觉图;将待识别票据对应的视觉图与预先构建的基础模板库中的各个票据模板对应的视觉图进行匹配;若待识别票据对应的视觉图与基础模板库中的任意一个票据模板对应的视觉图匹配成功,则使用任意一个票据模板提取待识别票据中的结构化信息。本申请实施例可以实现多版式的票据信息提取,扩大票据识别所覆盖的业务范围,从而可以适用于大规模票据自动处理,处理效果更好,识别速度更快。

【技术实现步骤摘要】
一种票据信息的提取方法、装置、电子设备及存储介质
本公开涉及人工智能领域,具体涉及计算机视觉和深度学习技术,尤其涉及一种票据信息的提取方法、装置、电子设备及存储介质。
技术介绍
票据是一种重要的结构化信息的文本载体,被广泛用于各种商业场景。尽管电子发票日益发展,传统纸质发票仍然被大量使用。例如,在财务金融部门,每天存在大量票据被审核报销,一张票据需要被多次人工审核,耗时费力,也降低报账效率。票据信息提取技术是将非结构化的票据图像转化为结构化数据,实现票据信息的提取。即借助光学字符识别(OpticalCharacterRecognition,简称OCR)技术,将非结构化图像影像转化为结构化文本信息,实现自动化地票据信息提取,可以极大的提高从业人员处理票据的效率,并支持企业办公智能化进程。针对票据信息的提取,目前普遍采用如下三种方案来解决:(1)基于人工录入的方案:该方案基于工作人员手动录入。(2)基于模板匹配的方案:该方案通常适用于结构简单的票据证照;其待识别票据一般具有固定的几何版式。通过制作标准模板文件,在指定位置处提取票据信息,并利用OCR技术实现文字的识别。(3)基于关键符号位置的策略搜索方案:该方案通过定位关键符号,在周边进行区域搜索信息。例如,在关键符号“日期”的周边,通过策略搜索文本“周边,通年1月1日”,并作为“日期”字段的属性值。目前的票据信息提取方案至少存在以下问题:方案(1)不适用大规模票据证照的自动处理;录入容易出现错误,费时费力,人力成本较高。方案(2)需要针对每种版式维护一个标准模板文件,且不能处理非固定版式的票据;模板无法处理具有扭曲形变或者存在打印偏移的票据,应用范围比较有限。方案(3)基于关键符号位置进行策略搜索。由于搜索策略需要人工配置,字段数越多,结构越复杂,策略规则就庞大,维护成本急剧上升。
技术实现思路
本申请提供了一种票据信息的提取方法、装置、电子设备及存储介质,可以实现多版式的票据信息提取,扩大票据识别所覆盖的业务范围,从而可以适用于大规模票据自动处理,处理效果更好,识别速度更快。根据本申请的第一方面,提供了一种票据信息的提取方法,所述方法包括:将待识别票据输入至预先训练好的深度学习网络中,通过所述深度学习网络得到所述待识别票据对应的视觉图;将所述待识别票据对应的视觉图与预先构建的基础模板库中的各个票据模板对应的视觉图进行匹配;若所述待识别票据对应的视觉图与所述基础模板库中的任意一个票据模板对应的视觉图匹配成功,则使用所述任意一个票据模板提取所述待识别票据中的结构化信息。根据本申请的第二方面,提供了一种票据信息的提取装置,所述装置包括:视觉图生成模块、视觉图匹配模块和信息提取模块;其中,所述视觉图生成模块,用于将待识别票据输入至预先训练好的深度学习网络中,通过所述深度学习网络得到所述待识别票据对应的视觉图;所述视觉图匹配模块,用于将所述待识别票据对应的视觉图与预先构建的基础模板库中的各个票据模板对应的视觉图进行匹配;所述信息提取模块,用于若所述待识别票据对应的视觉图与所述基础模板库中的任意一个票据模板对应的视觉图匹配成功,则使用所述任意一个票据模板提取所述待识别票据中的结构化信息。根据本申请的第三方面,提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本申请任意实施例所述的票据信息的提取方法。根据本申请的第四方面,提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请任意实施例所述的票据信息的提取方法。根据本申请的第五方面,提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时实现本申请任意实施例所述的票据信息的提取方法。根据本申请的技术解决了现有技术无法实现多版式的票据信息提取,票据识别所覆盖的业务范围有限,以及无法适用于大规模票据自动处理,处理效果不佳,人力成本高的技术问题,本申请提供的技术方案,可以实现多版式的票据信息提取,扩大票据识别所覆盖的业务范围,从而可以适用于大规模票据自动处理,处理效果更好,识别速度更快。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是本申请实施例提供的票据信息的提取方法的第一流程示意图;图2是本申请实施例提供的票据信息的提取方法的第二流程示意图;图3是本申请实施例提供的票据信息的提取方法的第三流程示意图;图4是本申请实施例提供的票据信息的提取方法的系统框架图;图5是本申请实施例提供的票据信息的提取装置的结构示意图;图6是用来实现本申请实施例的票据信息的提取方法的电子设备的框图。具体实施方式以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。实施例一图1是本申请实施例提供的票据信息的提取方法的第一流程示意图,该方法可以由票据信息的提取装置或者电子设备来执行,该装置或者电子设备可以由软件和/或硬件的方式实现,该装置或者电子设备可以集成在任何具有网络通信功能的智能设备中。如图1所示,票据信息的提取方法可以包括以下步骤:S101、将待识别票据输入至预先训练好的深度学习网络中,通过深度学习网络得到待识别票据对应的视觉图。在本步骤中,电子设备可以将待识别票据输入至预先训练好的深度学习网络中,通过深度学习网络得到待识别票据对应的视觉图。深度学习网络可以包括多个参数,例如:W1、W2和W3,在深度学习网络的训练过程中,这些参数可以更新和调整,在深度学习网络训练好之后,这些就参数可以被固定下来,那么将待识别票据输入至预先训练好的深度学习网络中,就可以通过深度学习网络得到待识别票据对应的视觉图。较佳地,在本申请的具体实施例中,在将待识别票据输入至预先训练好的深度学习网络中之前,还可以预先对深度学习网络进行训练。具体地,若深度学习网络不满足预先设置的收敛条件,则电子设备可以在预先构建的训练样本库中提取出一张票据照片作为当前训练样本;然后基于当前训练样本的票据类型对预先构建的票据类型对应的初始视觉图进行更新,得到票据类型对应的更新后的视觉图;重复执行上述操作,直到深度学习网络满足预先设置的收敛条件。进一步地,电子设备在基于当前训练样本的票据类型对预先构建的票据类型对应的初始视觉图进行更新之前,还可以针对该票据类型预先构建一个初始视觉图。具体地,电子设备可以先将当前训练样本输入至本文档来自技高网
...

【技术保护点】
1.一种票据信息的提取方法,所述方法包括:/n将待识别票据输入至预先训练好的深度学习网络中,通过所述深度学习网络得到所述待识别票据对应的视觉图;/n将所述待识别票据对应的视觉图与预先构建的基础模板库中的各个票据模板对应的视觉图进行匹配;/n若所述待识别票据对应的视觉图与所述基础模板库中的任意一个票据模板对应的视觉图匹配成功,则使用所述任意一个票据模板提取所述待识别票据中的结构化信息。/n

【技术特征摘要】
1.一种票据信息的提取方法,所述方法包括:
将待识别票据输入至预先训练好的深度学习网络中,通过所述深度学习网络得到所述待识别票据对应的视觉图;
将所述待识别票据对应的视觉图与预先构建的基础模板库中的各个票据模板对应的视觉图进行匹配;
若所述待识别票据对应的视觉图与所述基础模板库中的任意一个票据模板对应的视觉图匹配成功,则使用所述任意一个票据模板提取所述待识别票据中的结构化信息。


2.根据权利要求1所述的方法,所述方法还包括:
若所述待识别票据对应的视觉图与所述基础模板库中的各个票据模板对应的视觉图均未匹配成功,则基于所述待识别票据对应的视觉图构建所述待识别票据对应的票据模板,并将所述待识别票据对应的票据模板注册到所述基础模板库中。


3.根据权利要求1所述的方法,其中,所述将所述待识别票据对应的视觉图与预先构建的基础模板库中的各个票据模板对应的视觉图进行匹配,包括:
在所述基础模板库中提取出一个票据模板作为当前票据模板;
通过预先确定的图匹配算法得到所述待识别票据对应的视觉图与所述当前票据模板对应的视觉图的匹配结果;重复执行上述操作,直到所述待识别票据对应的视觉图与所述基础模板库中的任意一个票据模板对应的视觉图匹配成功;或者所述待识别票据对应的视觉图与所述基础模板库中的各个票据模板对应的视觉图均未匹配成功。


4.根据权利要求3所述的方法,其中,所述通过预先确定的图匹配算法得到所述待识别票据对应的视觉图与所述当前票据模板对应的视觉图的匹配结果,包括:
通过所述图匹配算法计算所述待识别票据对应的视觉图与所述当前票据模板对应的视觉图的节点匹配矩阵和边匹配矩阵;
基于所述待识别票据对应的视觉图与所述当前票据模板对应的视觉图的节点匹配矩阵和边匹配矩阵,得到所述待识别票据对应的视觉图与所述当前票据模板对应的视觉图的匹配结果。


5.根据权利要求1所述的方法,在所述将待识别票据输入至预先训练好的深度学习网络中之前,所述方法还包括:
若所述深度学习网络不满足预先设置的收敛条件,则在预先构建的训练样本库中提取出一张票据照片作为当前训练样本;
基于所述当前训练样本的票据类型对预先构建的所述票据类型对应的初始视觉图进行更新,得到所述票据类型对应的更新后的视觉图;重复执行上述操作,直到所述深度学习网络满足所述预先设置的收敛条件。


6.根据权利要求5所述的方法,在所述基于所述当前训练样本的票据类型对预先构建的所述票据类型对应的初始视觉图进行更新之前,所述方法还包括:
将所述当前训练样本输入至预先训练好的文本识别模型中,通过所述文本识别模型得到所述当前训练样本中的各个检测框的四个顶点坐标;
基于各个检测框的四个顶点坐标提取各个检测框的表观特征和空间特征;
根据各个检测框的表观特征和空间特征构建出所述票据类型对应的初始视觉图。


7.一种票据信息的提取装置,所述装置包括:视觉图生成模块、视觉图匹配模块和信息提取模块;其中,
所述视觉图生成模块,用于将待识别票据输入至预先训练好的深度学习网络中,...

【专利技术属性】
技术研发人员:钦夏孟李煜林黄聚谢群义章成全姚锟刘经拓韩钧宇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1