一种票据信息的提取方法、装置、电子设备及存储介质制造方法及图纸

技术编号：28422019 阅读：18 留言：0更新日期：2021-05-11 18:29

本公开公开了一种票据信息的提取方法、装置、电子设备及存储介质，涉及人工智能领域，具体涉及计算机视觉和深度学习技术。具体实现方案为：将待识别票据输入至预先训练好的深度学习网络中，通过深度学习网络得到待识别票据对应的视觉图；将待识别票据对应的视觉图与预先构建的基础模板库中的各个票据模板对应的视觉图进行匹配；若待识别票据对应的视觉图与基础模板库中的任意一个票据模板对应的视觉图匹配成功，则使用任意一个票据模板提取待识别票据中的结构化信息。本申请实施例可以实现多版式的票据信息提取，扩大票据识别所覆盖的业务范围，从而可以适用于大规模票据自动处理，处理效果更好，识别速度更快。

全部详细技术资料下载

【技术实现步骤摘要】
一种票据信息的提取方法、装置、电子设备及存储介质
本公开涉及人工智能领域，具体涉及计算机视觉和深度学习技术，尤其涉及一种票据信息的提取方法、装置、电子设备及存储介质。
技术介绍
票据是一种重要的结构化信息的文本载体，被广泛用于各种商业场景。尽管电子发票日益发展，传统纸质发票仍然被大量使用。例如，在财务金融部门，每天存在大量票据被审核报销，一张票据需要被多次人工审核，耗时费力，也降低报账效率。票据信息提取技术是将非结构化的票据图像转化为结构化数据，实现票据信息的提取。即借助光学字符识别(OpticalCharacterRecognition，简称OCR)技术，将非结构化图像影像转化为结构化文本信息，实现自动化地票据信息提取，可以极大的提高从业人员处理票据的效率，并支持企业办公智能化进程。针对票据信息的提取，目前普遍采用如下三种方案来解决：(1)基于人工录入的方案：该方案基于工作人员手动录入。(2)基于模板匹配的方案：该方案通常适用于结构简单的票据证照；其待识别票据一般具有固定的几何版式。通过制作标准模板文件，在指定位置处提取票据信息，并利用OCR技术实现文字的识别。(3)基于关键符号位置的策略搜索方案：该方案通过定位关键符号，在周边进行区域搜索信息。例如，在关键符号“日期”的周边，通过策略搜索文本“周边，通年1月1日”，并作为“日期”字段的属性值。目前的票据信息提取方案至少存在以下问题：方案(1)不适用大规模票据证照的自动处理；录入容易出现错误，费时费力，人力成本较高。方案(2)需要针对每种版式维护一个...

【技术保护点】
1.一种票据信息的提取方法，所述方法包括：/n将待识别票据输入至预先训练好的深度学习网络中，通过所述深度学习网络得到所述待识别票据对应的视觉图；/n将所述待识别票据对应的视觉图与预先构建的基础模板库中的各个票据模板对应的视觉图进行匹配；/n若所述待识别票据对应的视觉图与所述基础模板库中的任意一个票据模板对应的视觉图匹配成功，则使用所述任意一个票据模板提取所述待识别票据中的结构化信息。/n

【技术特征摘要】
1.一种票据信息的提取方法，所述方法包括：
将待识别票据输入至预先训练好的深度学习网络中，通过所述深度学习网络得到所述待识别票据对应的视觉图；
将所述待识别票据对应的视觉图与预先构建的基础模板库中的各个票据模板对应的视觉图进行匹配；
若所述待识别票据对应的视觉图与所述基础模板库中的任意一个票据模板对应的视觉图匹配成功，则使用所述任意一个票据模板提取所述待识别票据中的结构化信息。

2.根据权利要求1所述的方法，所述方法还包括：
若所述待识别票据对应的视觉图与所述基础模板库中的各个票据模板对应的视觉图均未匹配成功，则基于所述待识别票据对应的视觉图构建所述待识别票据对应的票据模板，并将所述待识别票据对应的票据模板注册到所述基础模板库中。

3.根据权利要求1所述的方法，其中，所述将所述待识别票据对应的视觉图与预先构建的基础模板库中的各个票据模板对应的视觉图进行匹配，包括：
在所述基础模板库中提取出一个票据模板作为当前票据模板；
通过预先确定的图匹配算法得到所述待识别票据对应的视觉图与所述当前票据模板对应的视觉图的匹配结果；重复执行上述操作，直到所述待识别票据对应的视觉图与所述基础模板库中的任意一个票据模板对应的视觉图匹配成功；或者所述待识别票据对应的视觉图与所述基础模板库中的各个票据模板对应的视觉图均未匹配成功。

4.根据权利要求3所述的方法，其中，所述通过预先确定的图匹配算法得到所述待识别票据对应的视觉图与所述当前票据模板对应的视觉图的匹配结果，包括：
通过所述图匹配算法计算所述待识别票据对应的视觉图与所述当前票据模板对应的视觉图的节点匹配矩阵和边匹配矩阵；
基于所述待识别票据对应的视觉图与所述当前票据模板对应的视觉图的节点匹配矩阵和边匹配矩阵，得到所述待识别票据对应的视觉图与所述当前票据模板对应的视觉图的匹配结果。

5.根据权利要求1所述的方法，在所述将待识别票据输入至预先训练好的深度学习网络中之前，所述方法还包括：
若所述深度学习网络不满足预先设置的收敛条件，则在预先构建的训练样本库中提取出一张票据照片作为当前训练样本；
基于所述当前训练样本的票据类型对预先构建的所述票据类型对应的初始视觉图进行更新，得到所述票据类型对应的更新后的视觉图；重复执行上述操作，直到所述深度学习网络满足所述预先设置的收敛条件。

6.根据权利要求5所述的方法，在所述基于所述当前训练样本的票据类型对预先构建的所述票据类型对应的初始视觉图进行更新之前，所述方法还包括：
将所述当前训练样本输入至预先训练好的文本识别模型中，通过所述文本识别模型得到所述当前训练样本中的各个检测框的四个顶点坐标；
基于各个检测框的四个顶点坐标提取各个检测框的表观特征和空间特征；
根据各个检测框的表观特征和空间特征构建出所述票据类型对应的初始视觉图。

7.一种票据信息的提取装置，所述装置包括：视觉图生成模块、视觉图匹配模块和信息提取模块；其中，
所述视觉图生成模块，用于将待识别票据输入至预先训练好的深度学习网络中，...

【专利技术属性】
技术研发人员：钦夏孟，李煜林，黄聚，谢群义，章成全，姚锟，刘经拓，韩钧宇，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人