票据的处理方法、系统和存储介质技术方案

技术编号:27577943 阅读:27 留言:0更新日期:2021-03-09 22:29
本发明专利技术提供了一种票据的处理方法、系统和存储介质,包括:采集票据的票据图像;定义票据图像的图像噪声;根据票据图像和图像噪声生成数据集;根据数据集搭建及训练对抗网络模型;获取待处理票据的待处理票据图像;将待处理票据图像输入对抗网络模型,得到去噪后的目标票据图像。本发明专利技术提出的票据处理方法,采集票据的票据图像,定义票据图像的图像噪声,并根据票据图像和图像噪声生成数据集,根据数据集搭建对抗网络模型,并对该对抗网络模型进行训练,使用最终的对抗网络模型对待处理票据图像进行处理,得到去噪后的目标票据图像,处理常见噪声的同时也能够处理票据上重叠或印章等部位的噪声问题。部位的噪声问题。部位的噪声问题。

【技术实现步骤摘要】
票据的处理方法、系统和存储介质


[0001]本专利技术涉及图像处理领域,具体而言,涉及到一种票据的处理方法、一种票据的处理系统和一种计算机可读存储介质。

技术介绍

[0002]相关技术中,使用图像二值化方法处理噪声,仅能处理简单噪声;使用深度学习检测方法无需特别处理噪声,但对于字符出现重叠,印章等问题效果较差。

技术实现思路

[0003]本专利技术旨在至少解决现有技术或相关技术中存在的技术问题之一。
[0004]为此,本专利技术的第一方面提出了一种票据的处理方法。
[0005]本专利技术的第二方面提出了一种票据的处理系统。
[0006]本专利技术的第三方面提出了一种计算机可读存储介质。
[0007]有鉴于此,本专利技术的一个目的提出了一种票据的处理方法,包括:采集票据的票据图像;定义票据图像的图像噪声;根据票据图像和图像噪声生成数据集;根据数据集搭建及训练对抗网络模型;获取待处理票据的待处理票据图像;将待处理票据图像输入对抗网络模型,得到去噪后的目标票据图像。
[0008]通过本专利技术提出的票据处理方法,采集票据的票据图像,定义票据图像的图像噪声,并根据票据图像和图像噪声生成数据集,根据数据集搭建对抗网络模型,并对该对抗网络模型进行训练,使用最终的对抗网络模型对待处理票据图像进行处理,得到去噪后的目标票据图像,处理常见噪声的同时也能够处理票据上重叠或印章等部位的噪声问题,与现有技术相比,对票据图像处理具有更好的去噪效果。
[0009]另外,本专利技术提供的上述技术方案中的票据的处理方法还可以具有以下的技术特征:
[0010]在上述技术方案中,图像噪声包括:第一噪声,第一噪声包括印章噪声、格线噪声、原始印刷文本噪声的任一种或其组合;第二噪声,第二噪声包括阴影噪声、背景底纹噪声、反光噪声、杂线噪声的任一种或其组合。
[0011]在该技术方案中,第一噪声包括票据本身在生成时产生的如印章噪声、格线噪声、原始印刷文本噪声等,第二噪声包括在生成待处理的票据图像时产生图像噪声,如阴影噪声、背景底纹噪声、反光噪声、杂线噪声等,通过将上述噪声同时设定为图像噪声,在对票据图像处理进行去噪处理时,能够在保留原始图像的同时实现更好的去噪效果。
[0012]在上述任一技术方案中,根据票据图像和图像噪声生成数据集的步骤,具体包括:
[0013]将票据图像中的机打字符去除生成背景图片,背景图片包括图像噪声;
[0014]选取背景图片随机位置生成第一背景图,第一背景图大小为d
×
d,d为预设的像素值;
[0015]根据第一背景图生成第二背景图;
[0016]在文本字符集中选取随机文本;
[0017]在第一背景图上画出随机文本,得到第三背景图;
[0018]在第二背景图上画出随机文本,得到第四背景图;
[0019]合并第三背景图和第四背景图得到噪声图片,所噪声图片大小为2d
×
d;
[0020]重复上述步骤N次,将N张噪声图片作为数据集。
[0021]在该技术方案中,将收集到的票据图像中的机打字符去除,同时保留图像噪声,生成背景图片,在该背景图片中随机选取大小为d
×
d的图片作为第一背景图,将第一背景图进行处理后生成第二背景图,第二背景图的大小也为d
×
d。
[0022]具体地,将GB2312作为文本字符集,在文本字符集中随机选取出随机文本,文本的长度为n,分别在第一背景图和第二背景图中画出随机文本,得到第三背景图和第四背景图,将第三背景图与第四背景图拼接,生成图片大小为2d
×
d的噪声图片,重复上述步骤N次,即得到大小为N的数据集,通过上述处理方法得到的噪声图片作为数据集,第三背景图和第四背景图形成对比效果,在使用该数据集训练和搭建的对抗网络模型对待处理的图像处理去噪效果更好。
[0023]在上述任一技术方案中,根据第一背景图生成第二背景图的步骤,具体包括:
[0024]获取第一背景图的三原色参数值,计算第一背景图的三原色参数值的均值;
[0025]生成空白图,空白图大小为d
×
d,d为预设的像素值;
[0026]设置空白图的三原色参数值为第一背景图的三原色参数值的均值,得到第二背景图。
[0027]在该技术方案中,首先生成一张空白的图片,空白图的大小与第一背景图相等,提取出第一背景图的R、G、B三原色参数值,设置空白图的R、G、B三原色参数值为第一背景图的R、G、B三原色参数值一致,得到的子图即为第二背景图,以第一背景图的R、G、B平均值作为第二背景图的R、G、B值,通过均值滤波的方式降低了图像的噪声。
[0028]在上述任一技术方案中,还包括:将数据集按预设比例分为第一数据集、第二数据集和第三数据集。
[0029]在该技术方案中,将数据集按比例分分为三部分,用于搭建和训练对抗网络模型。
[0030]具体地,预设比例为8:1:1。
[0031]在该技术方案中,按照8:1:1的预设比例将数据集分组,分别作为不同的子数据集使用。
[0032]在上述任一技术方案中,根据数据集搭建及训练对抗网络模型的步骤,具体包括:搭建对抗网络模型;将第一数据集作为训练集,用于对对抗网络模型进行训练;将第二数据集作为验证集,用于对对抗网络模型的参数进行调整;将第三数据集作为测试集,用于对对抗网络模型进行评估。
[0033]在该技术方案中,搭建对抗网络模型,分别使用按照8:1:1的预设比例分组的第一数据集、第二数据集和第三数据集。其中第一数据集中的数据量较多,第一数据集作为训练集,对对抗网络模型进行训练,采用相对较少数量的第二数据集作为验证集,对模型进行参数的调整和初步的评估,最后用第三数据集作为测试集,评估最终模型的泛化能力,直至达到预设的效果。
[0034]在上述任一技术方案中,对抗网络模型包括:CGAN模型、GAN模型、DCGAN模型或
WGAN模型。
[0035]在该技术方案中,对抗网络模型可以为CGAN模型、GAN模型、DCGAN模型或WGAN模型,其中最优的为CGAN模型。
[0036]有鉴于此,本专利技术的第二个方面提出了一种票据的处理系统,包括存储器,存储器上存储有可在处理器上运行的计算机程序;处理器,处理器执行计算机程序时实现上述任一技术方案的票据的处理方法的步骤,因此,该票据的处理系统包括上述任一技术方案中票据的处理方法的全部有益效果。
[0037]有鉴于此,本专利技术的第三个方面提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述任一技术方案中的票据的处理方法,因此,该计算机可读存储介质包括如上述任一技术方案中票据的处理方法的全部有益效果。
附图说明
[0038]本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
[0039本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种票据的处理方法,其特征在于,包括:采集票据的票据图像;定义所述票据图像的图像噪声;根据所述票据图像和所述图像噪声生成数据集;根据所述数据集搭建及训练对抗网络模型;获取待处理票据的待处理票据图像;将所述待处理票据图像输入所述对抗网络模型,得到去噪后的目标票据图像。2.根据权利要求1所述的票据的处理方法,其特征在于,所述图像噪声包括:第一噪声,所述第一噪声包括印章噪声、格线噪声、原始印刷文本噪声的任一种或其组合;第二噪声,所述第二噪声包括阴影噪声、背景底纹噪声、反光噪声、杂线噪声的任一种或其组合。3.根据权利要求2所述的票据的处理方法,其特征在于,所述根据所述票据图像和所述图像噪声生成数据集的步骤,具体包括:将所述票据图像中的机打字符去除生成背景图片,所述背景图片包括所述图像噪声;选取所述背景图片随机位置生成第一背景图,所述第一背景图大小为d
×
d,d为预设的像素值;根据所述第一背景图生成第二背景图;在文本字符集中选取随机文本;在所述第一背景图上画出所述随机文本,得到第三背景图;在所述第二背景图上画出所述随机文本,得到第四背景图;合并所述第三背景图和所述第四背景图得到噪声图片,所噪声图片大小为2d
×
d;重复上述步骤N次,将N张噪声图片作为数据集。4.根据权利要求3所述的票据的处理方法,其特征在于,所述根据所述第一背景图生成第二背景图的步骤,具体包括:获取所述第一背景图的三...

【专利技术属性】
技术研发人员:曾志辉欧阳一村邢军华许文龙
申请(专利权)人:深圳中兴网信科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1