图像去噪方法及其装置、电子设备及存储介质制造方法及图纸

技术编号:39001438 阅读:11 留言:0更新日期:2023-10-07 10:33
本发明专利技术公开了一种图像去噪方法及其装置、电子设备及存储介质,涉及人工智能技术领域,其中,该图像去噪方法包括:接收待处理的文档图像,并对文档图像进行预处理;采用预设深度学习网络去除经过预处理后的文档图像中的第一频率噪声,并提取经过噪声去除处理后的图像特征,得到第一图像特征集合,采用预设深度残差网络提取文档图像中符合第二频率噪声的图像特征,得到第二图像特征集合,融合第一图像特征集合以及第二图像特征集合,并将融合后得到的特征图输入至目标卷积神经网络,输出目标文档图像。本发明专利技术解决了相关技术中对文档图像进行去噪时,易导致图像模糊的技术问题。易导致图像模糊的技术问题。易导致图像模糊的技术问题。

【技术实现步骤摘要】
图像去噪方法及其装置、电子设备及存储介质


[0001]本专利技术涉及人工智能
或其他相关领域,具体而言,涉及一种图像去噪方法及其装置、电子设备及存储介质。

技术介绍

[0002]在日常工作中,每家企业每天都会产生大量的证件、票据、合同等各类型的材料文档,且其会随着企业经营发展不断增长。对于这类纸质文档,无法进行实时编辑、检索,存在存储成本高、数据价值低等问题。随着人工智能技术的不断成熟,企业通过各种文字识别技术可将经营过程产生的各类凭证与资料智能识别、结构化输出,有效降低了人工操作成本。
[0003]在识别图像中文档内容时,内容识别的准确性严重受限于文档扫描的图像质量,若存在噪声等,会极大程度影响文本识别精准度。为提高文档识别精度,亟需对含有噪声的文档图像进行去噪处理。相关技术中,图像去噪方法主要有两类,具体分析如下:
[0004]1.基于滤波的方法:主要利用某些人工设计的低通滤波器来过滤掉图像中的高频噪声。这种基于滤波的方法,虽然可有效滤除图像的椒盐噪声,但块操作易导致图像模糊,且超参数需手动设置;
[0005]2.基于模型的方法:通常将去噪任务定义为基于最大后验的优化性能,其性能主要依赖于图像的先验。虽然数学推导能力强,但在高度噪声下难以恢复纹理结构,去噪效果较差。
[0006]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0007]本专利技术实施例提供了一种图像去噪方法及其装置、电子设备及存储介质,以至少解决相关技术中对文档图像进行去噪时,易导致图像模糊的技术问题。
[0008]根据本专利技术实施例的一个方面,提供了一种图像去噪方法,包括:接收待处理的文档图像,并对所述文档图像进行预处理;采用预设深度学习网络去除经过预处理后的所述文档图像中的第一频率噪声,并提取经过噪声去除处理后的图像特征,得到第一图像特征集合,其中,所述第一频率噪声的噪声频度大于第一频度阈值;采用预设深度残差网络提取所述文档图像中符合第二频率噪声的图像特征,得到第二图像特征集合,其中,所述第二频率噪声的噪声频度小于等于第二频度阈值;融合所述第一图像特征集合以及所述第二图像特征集合,并将融合后得到的特征图输入至目标卷积神经网络,输出目标文档图像。
[0009]可选地,对所述文档图像进行预处理的步骤,包括:将所述文档图像的当前尺寸调整为预设图像尺寸;采用预设图像处理库对所述文档图像进行特征增强处理,完成预处理步骤,其中,所述特征增强处理包括下述至少之一:图像对比度增强处理、图像色彩增强处理、图像亮度增强处理。
[0010]可选地,采用预设深度学习网络去除经过预处理后的所述文档图像中的第一频率噪声,并提取经过噪声去除处理后的图像特征,得到第一图像特征集合的步骤,包括:将经
过预处理后的所述文档图像输入至自编码器,其中,所述自编码器是采用预设深度学习网络构建的;由所述自编码器中的编码器对所述文档图像编码为预设维度表示,由所述自编码器中的解码器对所述预设维度表示中第一频率噪声进行去除处理,并对所述预设维度表示进行图像重建,得到目标重建图像,其中,所述预设维度表示是指维度值小于预设维度阈值的维度表示;提取所述目标重建图像中的图像特征,得到所述第一图像特征集合。
[0011]可选地,所述自编码器是通过以下方式得到的:获取携带有所述第一频率噪声的历史文档图像以及去除所述第一频率噪声后的历史重建图像;将所述历史文档图像以及所述历史重建图像组建为图像样本集,并将所述图像样本集划分为训练集以及测试集,其中,在所述图像样本集中每份图像样本包含一张历史文档图像以及与该历史文档图像对应的历史重建图像;采用所述预设深度学习网络构建初始自编码器,其中,所述初始自编码器包括初始编码器和初始解码器;将所述训练集中的历史文档图像输入至所述初始编码器,由所述初始编码器将所述历史文档图像编码为预设维度表示,由所述初始解码器对所述预设维度表示进行图像重建,得到与所述历史文档图像对应的历史重建图像;对所述初始自编码器进行迭代训练,直至所述训练集中的所有图像样本全部输入完毕;采用所述测试集对所述初始自编码器进行测试,在测试结果指示所述初始自编码器输出的重建图像与所述历史重建图像的相似度大于预设相似度阈值的情况下,确认训练完毕,得到所述自编码器。
[0012]可选地,所述预设深度残差网络是通过如下方式得到的:构建多层级的残差块,并将多层级的残差块进行跳跃连接,得到所述预设深度残差网络,其中,每个层级中包含M个残差块,所述残差块包含:卷积层和激活层,M为正整数。
[0013]可选地,采用预设深度残差网络提取所述文档图像中符合第二频率噪声的图像特征的步骤,包括:采用所述预设深度残差网络提取所述文档图像中的文本笔画特征以及文本轮廓特征,得到符合第二频率噪声的图像特征。
[0014]可选地,融合所述第一图像特征集合以及所述第二图像特征集合,并将融合后得到的特征图输入至目标卷积神经网络,输出目标文档图像的步骤,包括:将所述第一图像特征集合以及所述第二图像特征集合中的图像特征在通道维度以及空间维度进行拼接,得到特征向量;采用预设特征解码器将所述特征向量映射回原始图像空间,得到融合后得到的特征图;将融合后得到的特征图输入至目标卷积神经网络,输出目标文档图像。
[0015]根据本专利技术实施例的另一方面,还提供了一种图像去噪装置,包括:图像预处理单元,用于接收待处理的文档图像,并对所述文档图像进行预处理;噪声去除单元,用于采用预设深度学习网络去除经过预处理后的所述文档图像中的第一频率噪声,并提取经过噪声去除处理后的图像特征,得到第一图像特征集合,其中,所述第一频率噪声的噪声频度大于第一频度阈值;特征提取单元,用于采用预设深度残差网络提取所述文档图像中符合第二频率噪声的图像特征,得到第二图像特征集合,其中,所述第二频率噪声的噪声频度小于等于第二频度阈值;融合单元,用于融合所述第一图像特征集合以及所述第二图像特征集合,并将融合后得到的特征图输入至目标卷积神经网络,输出目标文档图像。
[0016]可选地,所述图像预处理单元包括:尺寸调整模块,用于将所述文档图像的当前尺寸调整为预设图像尺寸;特征增强模块,用于采用预设图像处理库对所述文档图像进行特征增强处理,完成预处理步骤,其中,所述特征增强处理包括下述至少之一:图像对比度增强处理、图像色彩增强处理、图像亮度增强处理。
[0017]可选地,噪声去除单元包括:图像输入模块,用于将经过预处理后的所述文档图像输入至自编码器,其中,所述自编码器是采用预设深度学习网络构建的;编码模块,用于由所述自编码器中的编码器对所述文档图像编码为预设维度表示,由所述自编码器中的解码器对所述预设维度表示中第一频率噪声进行去除处理,并对所述预设维度表示进行图像重建,得到目标重建图像,其中,所述预设维度表示是指维度值小于预设维度阈值的维度表示;第一提取模块,用于提取所述目标重建图像中的图像特征,得到所述第一图像特征集合。
[0018]可选地,所述自编码器是通过以下方式得到的:获取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像去噪方法,其特征在于,包括:接收待处理的文档图像,并对所述文档图像进行预处理;采用预设深度学习网络去除经过预处理后的所述文档图像中的第一频率噪声,并提取经过噪声去除处理后的图像特征,得到第一图像特征集合,其中,所述第一频率噪声的噪声频度大于第一频度阈值;采用预设深度残差网络提取所述文档图像中符合第二频率噪声的图像特征,得到第二图像特征集合,其中,所述第二频率噪声的噪声频度小于等于第二频度阈值;融合所述第一图像特征集合以及所述第二图像特征集合,并将融合后得到的特征图输入至目标卷积神经网络,输出目标文档图像。2.根据权利要求1所述的图像去噪方法,其特征在于,对所述文档图像进行预处理的步骤,包括:将所述文档图像的当前尺寸调整为预设图像尺寸;采用预设图像处理库对所述文档图像进行特征增强处理,完成预处理步骤,其中,所述特征增强处理包括下述至少之一:图像对比度增强处理、图像色彩增强处理和图像亮度增强处理。3.根据权利要求1所述的图像去噪方法,其特征在于,采用预设深度学习网络去除经过预处理后的所述文档图像中的第一频率噪声,并提取经过噪声去除处理后的图像特征,得到第一图像特征集合的步骤,包括:将经过预处理后的所述文档图像输入至自编码器,其中,所述自编码器是采用预设深度学习网络构建的;由所述自编码器中的编码器对所述文档图像编码为预设维度表示,由所述自编码器中的解码器对所述预设维度表示中第一频率噪声进行去除处理,并对所述预设维度表示进行图像重建,得到目标重建图像,其中,所述预设维度表示是指维度值小于预设维度阈值的维度表示;提取所述目标重建图像中的图像特征,得到所述第一图像特征集合。4.根据权利要求3所述的图像去噪方法,其特征在于,所述自编码器是通过以下方式得到的:获取携带有所述第一频率噪声的历史文档图像以及去除所述第一频率噪声后的历史重建图像;将所述历史文档图像以及所述历史重建图像组建为图像样本集,并将所述图像样本集划分为训练集以及测试集,其中,在所述图像样本集中每份图像样本包含一张历史文档图像以及与该历史文档图像对应的历史重建图像;采用所述预设深度学习网络构建初始自编码器,其中,所述初始自编码器包括初始编码器和初始解码器;将所述训练集中的历史文档图像输入至所述初始编码器,由所述初始编码器将所述历史文档图像编码为预设维度表示,由所述初始解码器对所述预设维度表示进行图像重建,得到与所述历史文档图像对应的历史重建图像;对所述初始自编码器进行迭代训练,直至所述训练集中的所有图像样本全部输入...

【专利技术属性】
技术研发人员:张佳颖
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1