一种基于GAN的任务分解式图像文档去噪方法技术

技术编号：38970453 阅读：13 留言：0更新日期：2023-09-28 09:34

本发明专利技术公开了一种基于GAN的任务分解式图像文档去噪方法，采用基于条件GAN的DTNS算法，将图像格式文档的去噪过程分为发现干扰区域和消除干扰区域两部分；其中，发现干扰区域为在图像中找到以水印和印章为代表的所有噪声区域，消除干扰区域为去除所述噪声区域，将图像中的信息还原到加噪前的状态。本发明专利技术提出一种基于条件GAN的DTNS算法，通过将去噪任务分解为水印发现和水印去除两个部分，大大降低了直接通过GAN去除水印的任务难度，降低网络复杂度，并且通过在重合区域使用高维结构的特征空间中高斯采样，可以减缓重合区域的文字轮廓丢失现象，从而较好地去除文档图像中的噪声。从而较好地去除文档图像中的噪声。从而较好地去除文档图像中的噪声。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于GAN的任务分解式图像文档去噪方法

[0001]本专利技术属于深度学习领域，具体涉及一种基于GAN的任务分解式图像文档去噪方法。

技术介绍

[0002]企业中存在大量的图像文档，从图像中提取有效文字信息的需求衍生出了OCR(Optical Character Recognition)相关技术。现有的OCR技术一般分为文字检测和文字识别两部分，如图1所示。对于清晰、无干扰的一般文档，现有的OCR相关技术能正常检测和识别出文字。
[0003]但由于加密、验证等因素，会存在大量被水印或者印章干扰的文档，如图2所示，使现有的OCR方法无法准确完整地进行文本检测和识别，严重影响图像文档的信息提取。
[0004]目前虽然有通过传统图像处理和深度学习图像处理的方法来消除干扰源，但是还存在以下缺点：1、由于图像文档中包含大量文字信息，并且在标注后的图像不能丢失已有的文字信息，需要逐个像素精细地标注出目标区域，并且在目标区域较小时标注困难，导致去噪文档的像素到像素(pixel2pixel)的标注成本太高，能使用的数据大部分都是合成数据，因为可能的数据样式太多，无法完全枚举，导致无法覆盖到足够的图像样本空间，会有很明显的数据偏移性。
[0005]2、传统的基于阈值的图像处理算法需对不同数据场景定制，通过对比度、灰度等进行过滤处理，经常会受到光照、噪声、水印图、印章图等的影响，导致对于不同的图像需要适配不同的参数，甚至有些需要修改算法的细节，会严重导致算法的适用范围大大降低，无法在图像文档处理的工业化场景中...

【技术保护点】

【技术特征摘要】
1.一种基于GAN的任务分解式图像文档去噪方法，其特征在于，采用基于条件GAN的DTNS算法，将图像格式文档的去噪过程分为发现干扰区域和消除干扰区域两部分；其中，发现干扰区域为在图像中找到以水印和印章为代表的所有噪声区域，发现干扰区域采用映射模块实现，所述映射模块包括第一判别器和第一生成器，所述第一判别器采用多层判别器，所述第一生成器使用skip
‑
connection网络结构，消除干扰区域为去除所述噪声区域，将图像中的信息还原到加噪前的状态。2.根据权利要求1所述的基于GAN的任务分解式图像文档去噪方法，其特征在于，所述第一判别器中采用spectral
‑
norm层。3.根据权利要求1所述的基于GAN的任务分解式图像文档去噪方法，其特征在于，所述映射模块中卷积核的大小为4。4.根据权利要求1所述的基于GAN的任务分解式图像文档去噪方法，其特征在于，消除干扰区域的过程为：将加噪的原始图像与发现干扰区域所形成的噪声图像进行合并，以将加噪的原始图像中被所述噪声图像遮挡的部分恢复成加噪前状态。5.根据权利要求4所述的基于GAN的任务分解...

【专利技术属性】
技术研发人员：李巍豪，周炳诚，高翔，魏舒，许诺，潘新星，杨彬彬，黄登，陈运文，纪达麒，
申请(专利权)人：达而观信息科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人