一种票据文本检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32334621 阅读:12 留言:0更新日期:2022-02-16 18:42
本发明专利技术实施例公开了一种票据文本检测方法、装置、电子设备及存储介质。该方法包括:获取原始票据,并通过根据所述原始票据确定的票据背景图像生成扩充票据;根据所述原始票据和所述扩充票据训练预设模型,得到票据文本检测模型;获取待识别票据,通过调用所述票据文本检测模型,检测所述待识别票据中的文本。通过运行本发明专利技术实施例所提供的技术方案,可以解决由于金融票据的版式多且复杂,需要对每种类型的票据定制化训练文本检测模型,降低了检测的准确性和通用性的问题,实现提高票据文本检测的效率和准确性的效果。的效率和准确性的效果。的效率和准确性的效果。

【技术实现步骤摘要】
一种票据文本检测方法、装置、电子设备及存储介质


[0001]本专利技术实施例涉及计算机技术,尤其涉及一种票据文本检测方法、装置、电子设备及存储介质。

技术介绍

[0002]银行内部每天会产生大量金融票据,并且需要从中获取文本信息,由于需要提取的信息字段较为繁多,传统的手工录入方法平均录入一张数据耗时较长,导致人力成本大、效率低,无法满足业务快速发展和强监管的要求。
[0003]现有技术中通过光学字符识别的方式,可以自动提取相关的结构化信息,辅助单据的录入和核对,然而由于金融票据的版式多且复杂,需要对每种类型的票据定制化训练文本检测模型,降低了检测的准确性和通用性。

技术实现思路

[0004]本专利技术实施例提供一种票据文本检测方法、装置、电子设备及存储介质,以实现提高票据文本检测的效率和准确性。
[0005]第一方面,本专利技术实施例提供了一种票据文本检测方法,该方法包括:
[0006]获取原始票据,并通过根据所述原始票据确定的票据背景图像生成扩充票据;
[0007]根据所述原始票据和所述扩充票据训练预设模型,得到票据文本检测模型;
[0008]获取待识别票据,通过调用所述票据文本检测模型,检测所述待识别票据中的文本。
[0009]第二方面,本专利技术实施例还提供了一种票据文本检测装置,该装置包括:
[0010]扩充票据生成模块,用于获取原始票据,并通过根据所述原始票据确定的票据背景图像生成扩充票据;
[0011]票据文本检测模型获得模块,用于根据所述原始票据和所述扩充票据训练预设模型,得到票据文本检测模型;
[0012]文本检测模块,用于获取待识别票据,通过调用所述票据文本检测模型,检测所述待识别票据中的文本。
[0013]第三方面,本专利技术实施例还提供了一种电子设备,该电子设备包括:
[0014]一个或多个处理器;
[0015]存储装置,用于存储一个或多个程序,
[0016]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的票据文本检测方法。
[0017]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的票据文本检测方法。
[0018]本专利技术实施例通过获取原始票据,并通过根据所述原始票据确定的票据背景图像生成扩充票据;根据所述原始票据和所述扩充票据训练预设模型,得到票据文本检测模型;
获取待识别票据,通过调用所述票据文本检测模型,检测所述待识别票据中的文本。解决由于金融票据的版式多且复杂,需要对每种类型的票据定制化训练文本检测模型,降低了检测的准确性和通用性的问题,实现提高票据文本检测的效率和准确性的效果。
附图说明
[0019]图1为本专利技术实施例一提供的一种票据文本检测方法的流程图;
[0020]图2为本专利技术实施例二提供的一种票据文本检测方法的流程图;
[0021]图3为本专利技术实施例三提供的一种票据文本检测装置的结构示意图;
[0022]图4为本专利技术实施例四提供的一种电子设备的结构示意图。
具体实施方式
[0023]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0024]实施例一
[0025]图1为本专利技术实施例一提供的一种票据文本检测方法的流程图,本实施例可适用于检测票据中文本位置的情况,该方法可以由本专利技术实施例所提供的票据文本检测装置来执行,该装置可以由软件和/或硬件的方式实现。参见图1,本实施例提供的票据文本检测方法,包括:
[0026]步骤110、获取原始票据,并通过根据所述原始票据确定的票据背景图像生成扩充票据。
[0027]其中,原始票据为实际业务中产生的历史票据,可以按照业务场景进行分类,本实施例对此不进行限制。
[0028]可以按照不同的业务场景,确定各业务场景中具有代表性的,例如使用次数较多、通用性较强的票据,并获取票据的背景作为票据背景图像。其中,票据背景图像为票据中无填写文本的图像。
[0029]根据票据背景图像生成扩充票据,可以为在票据背景图像的可填写文本处填写不同内容、不同字体的文本,从而可以通过一张票据背景图像,生成多张扩充票据,增加后续模型训练的训练集数据数量,从而提高模型训练的准确性。
[0030]本实施例中,可选的,通过根据所述原始票据确定的票据背景图像生成扩充票据,包括:
[0031]根据所述票据背景图像和预设配置文件生成初始票据模板;
[0032]响应于对所述初始票据模板的标注操作,以及对根据所述标注操作生成的过程票据图像的图像处理操作,生成所述扩充票据。
[0033]其中,预设配置文件用于配置票据背景图像中可填写内容的格式要求,例如可填写的位置、可填写的文字类型,如只可以填写数字或只可以填写文字等。可以针对每张票据背景图像对应一个预设配置文件。根据预设配置文件和票据背景图像,生成初始票据模板,其中初始票据模板可以为Json模板,然后对初始票据模板进行标注操作,其中标注操作可以为人工操作,也可以为系统自动操作,本实施例对此不进行限制。
[0034]标注操作用于在初始票据模板的背景图像中填入具体的文本内容,其中,文本内容在字体选取上可以使用多种中英文字体;在语料库的选择上,除了通用语料库,还可以包括金融行业领域语料库;使得扩充票据中的文本长度、文本高度、文本字体类型、文本字体效果(衬线和非衬线等)、文字出现布局(上下左右偏移等)等生成的数据分布接近真实分布的概率,便于后续训练得到的票据文本检测模型具备强大的泛化能力。
[0035]可以通过解析器读取经过标注操作后的初始票据模板,以得到标注数据,并使用调度器,将标注数据传入生成器完成过程票据图像的生成,最后再通过调度器将生成过程票据图像传入存储器,以将生成过程票据图像保存下来,便于后续处理。
[0036]获得过程票据图像后,对过程票据图像进行图像处理操作,其中图像处理操作可以由上述生成器完成,图像处理操作可以包括像素增删、前景背景合并、形态学处理、弹性扭曲、仿射透视变换和噪声添加等,本实施例对此不进行限制。解决若合成的票据版式结构或者字体效果和真实相差甚远,导致后续预设模型很难学习到真实的数据情况,使得训练出来的票据文本检测模型总是在原始票据和扩充票据构成的测试集上测试效果很好,而在真实票据的检测中效果差的问题。提高对存在较多背景干扰,如手写体、噪声点、文字重叠、盖章压线和像素信息丢失严重等问题的金融票据文本检测的准确性。
[0037]步骤120、根据所述原始票据和所述扩充票据训练预设模型,得到票据文本检测模型。
[0038]将原始票据和扩充票据作为训练集输入至预设的模型进行训练,当预设模型的参数达到预设标准时得本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种票据文本检测方法,其特征在于,包括:获取原始票据,并通过根据所述原始票据确定的票据背景图像生成扩充票据;根据所述原始票据和所述扩充票据训练预设模型,得到票据文本检测模型;获取待识别票据,通过调用所述票据文本检测模型,检测所述待识别票据中的文本。2.根据权利要求1所述的方法,其特征在于,通过根据所述原始票据确定的票据背景图像生成扩充票据,包括:根据所述票据背景图像和预设配置文件生成初始票据模板;响应于对所述初始票据模板的标注操作,以及对根据所述标注操作生成的过程票据图像的图像处理操作,生成所述扩充票据。3.根据权利要求1所述的方法,其特征在于,所述预设模型的工作过程包括:提取所述原始票据和所述扩充票据的票据图像特征;将所述票据图像特征与空间位置编码相加并输入编码器;将经过所述编码器处理得到的结果输入解码器;其中所述解码器中的各层均输出对应解码结果;根据前向传播网络和所述解码结果确定模型输出结果。4.根据权利要求1所述的方法,其特征在于,获取待识别票据,通过调用所述票据文本检测模型,检测所述待识别票据中的文本,包括:获取待识别票据,启动对应的子线程,通过应用程序接口调用所述票据文本检测模型,检测所述待识别票据中的文本。5.根据权利要求4所述的方法,其特征在于,启动对应的子线程,通过应用程序接口调用所述票据文本检测模型,包括:通过所述子线程监听所述待识别票据是否存在文本检测请求;若存在,则通过应用程序接口调用所述票据文本检测模型;其中,单个所述票据文本检测模型对应一个或多个所述子线程。6.一种票据文本检测装置,其特征在于,包括:扩充票...

【专利技术属性】
技术研发人员:向东王巍石明李捷王迪徐柯文涂洪健胡诗雨王慧厉超余非
申请(专利权)人:上海浦东发展银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1