一种基于残差自编码的图像深度去噪方法技术

技术编号:37439010 阅读:12 留言:0更新日期:2023-05-06 09:11
本发明专利技术提出了一种基于残差自编码的图像深度去噪方法,步骤如下:以噪声的标准差作为分级依据将噪声分级;通过数据增强策略扩充数据集中的图片数量得到训练集;构建图像去噪模型:图像去噪模型包括依次连接的编码模块、密集残差模块和解码模块;将训练集的图片分别添加步骤一中各个噪声等级范围内的高斯噪声得到含噪图像,将含噪图像输入图像去噪模型分别进行学习训练,获得训练好的不同噪声等级的图像去噪模型;在图像去噪应用时将含噪图片输入训练好的图像去噪模型,直接重构输出去噪后的图片。本发明专利技术在去除大部分噪声信息的同时能够有效的保留图像的局部细节特征和图像的边缘特征信息,获得高质量的重建图像;实现简单且轻量化,参数量少。参数量少。参数量少。

【技术实现步骤摘要】
一种基于残差自编码的图像深度去噪方法


[0001]本专利技术涉及图像处理的
,具体涉及一种基于残差自编码的图像深度去噪方法,实现图像的高质量重建,尤其涉及高噪声条件下的图像快速重建能力。

技术介绍

[0002]利用计算机视觉技术提升国家重要安全区域和城市敏感公共场所的全天候实时监控和有效人员管理已经成为世界各国高度重视的研究课题。在现实生活中,由于图像传感器CMOS/CCD的工作特性导致在夜间光照条件差的环境下,获得的图像通常含有大量的随机噪声,进而影响了图像质量。如何从含有噪声图像或者视频中实现对重要人员的有效跟踪监视和重要区域的人员识别以及进出管理,已经成为目前智能安防系统研究的一个重要发展方向。然而含随机噪声图像影响了安防系统的有效特征信息提取,进而影响了目标的识别精度。因此,如何从含随机噪声的图像中获得高质量的重建图像是研究的重点问题。
[0003]近年来,人工智能技术的快速发展,促进了机器学习技术的快速兴起。深度学习技术作为机器学习中重要的研究方向,是人工智能发展的主要驱动力。深度学习主要使用的是人工神经网络算法,允许发现中间表示来扩展标准机器学习。这些中间表示能够解决更复杂的问题,并且以更高的精度、更少的观察和更简便的手动调谐,潜在地解决其他问题。深度学习在某些方面已经超越了人类的认知能力和认知范围深度学习,目前在图像识别、语音识别、自动驾驶、机器翻译和智能安防等领域都得到了落地和实际的应用。在图像去噪方面,深度学习方法能够更深层次地挖掘图像的内部信息,对图像数据进行更精细地筛选,从含噪图像数据中精确筛选出图像数据信息。
[0004]在深度学习图像去噪中,图像去噪自编码器具有结构简单、参数量少、重建速度快的优点,然而在图像细节特征信息的保护方面有限,导致去噪重建图像细节特征丢失较多,进而影响了重建图像质量。如何在去除噪声信息的同时对细节特征信息进行有效保护,是图像去噪自编码器需要解决的重要问题。

技术实现思路

[0005]针对传统图像去噪自编码器不能提取图像细节特征信息,图像重建质量差的技术问题,本专利技术提出一种基于残差自编码的图像深度去噪方法,能快速准确的去除图像噪声,复原图像原始信息,尤其对图像细节复原较好。
[0006]为了达到上述目的,本专利技术的技术方案是这样实现的:一种基于残差自编码的图像深度去噪方法,其步骤如下:
[0007]步骤一:以噪声的标准差作为分级依据将噪声分为10级;
[0008]步骤二:选用BSD500数据集中的图片,通过数据增强策略扩充图片数量得到训练集;
[0009]步骤三:构建图像去噪模型:图像去噪模型包括依次连接的编码模块、密集残差模块和解码模块;
[0010]步骤四:将训练集的图片分别添加步骤一中各个噪声等级范围内的高斯噪声得到含噪图像,将含噪图像输入步骤三构建的图像去噪模型分别进行学习训练,获得训练好的不同噪声等级的图像去噪模型;
[0011]步骤五:在图像去噪应用时将含噪图片输入训练好的图像去噪模型,直接重构输出去噪后的图片。
[0012]优选地,所述噪声的分级情况为:
[0013]噪声等级12345标准差范围0~55~1010~1515~2020~25噪声等级678910标准差范围25~3030~3535~4040~4545~50。
[0014]优选地,所述数据增强策略包括按相关比例缩放、旋转和裁剪一系列处理,实现方法为:将BSD500数据集中的图片按相关比例进行缩放处理,之后根据欲搭建的图像去噪模型的深度和感受野的范围将缩放后的图片按照10步长切割为30*30的图像补丁块,再将图像补丁块随机进行翻转、旋转处理,最后获得的图像块作为训练集。
[0015]优选地,所述编码模块用于将输入的含噪图像映射到低维特征空间中,在此过程中卷积层不断学习图像的特征信息并且过滤掉噪声信息,得到全局图像特征;所述密集残差模块用于将编码模块所得到的全局图像特征进行更加细致的提取融合,充分获得含噪图像的局部细节特征信息,得到低维特征;所述解码模块用于将低维特征向高维图像转换,即将图像的抽象特征逐步还原成图像数据,同时逐层增大特征图尺寸,直至还原到与输入图片尺寸相同,还原过程中对部分图像细节进行恢复。
[0016]优选地,所述编码模块包括6个卷积核大小为3*3的卷积层,卷积核个数分别为32、32、64、64、64、128,其中第5个卷积层的步长为2,其余均为1,第五个卷积层用来代替最大池化层从而减少参数个数,卷积层后连接采用LeakyReLU激活函数的激活层;所述密集残差模块的网络结构为两个卷积核大小3*3、卷积核个数128的卷积层和一个卷积核大小1*1、卷积核个数128的卷积层组成的密集残差结构,其中每个卷积层后面都添加BN层;所述解码模块包括5个卷积核大小为3*3以及卷积核个数分别为128、64、64、32、32的反卷积层,卷积层后跟采用LeakyReLU激活函数用来增加该神经网络模型的非线性表达能力,第一个卷积层后面为2*2的上采样层;最后通过卷积核大小3*3、卷积核个数为1的卷积层用来重构复原去噪后的图像。
[0017]优选地,所述LeakyReLU激活函数为:
[0018][0019]其中,参数a1取值为0.1,表示输入的自变量,LReLU(LeakyReLU)是ReLU激活函数的变体,在≥0时,导数为1,可以加快梯度下降的收敛速度,x<0时也有很小的斜率,能在一定程度上保留负梯度信息,有效缓解DeadReLU现象。
[0020]优选地,所述密集残差结构自适应的融合来自上一编码模块和当前密集残差模块中所有卷积层的特征,将上层编码模块的全局特征图以拼接的方式直接引入密集残差模块,用来增强提取图像局部细节特征,其公式为:
[0021]F
g
=H
d
([F0,1,

,d]);
[0022]其中,0,1,

,d分别表示编码模块和密集残差模块中生成的特征图,H
d
表示用1*1卷积层将不同级别的特征自适应融合在一起,F
g
表示通过密集残差融合提取后的细节特征。
[0023]优选地,对图像块添加不同等级的符合正态随机分布的高斯噪声,获得含噪水平不同的含噪图像,高斯噪声的函数公式为:
[0024][0025]其中,x代表图像的灰度值,代表灰度值x的均值,σ2代表灰度值x的方差。
[0026]优选地,所述图像去噪模型模型的训练过程中采用MSE和MS

SSIM联合函数作为图像的重构误差函数计算降噪图像和目标图像之间的损失,联合损失函数为:
[0027]Loss=a
·
lOSS
MSE
+b
·
OSS
MS

SSIM

[0028][0029][0030]其中,a、b为系数,Loss表示总的联合损失函数,LOSS
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于残差自编码的图像深度去噪方法,其特征在于,其步骤如下:步骤一:以噪声的标准差作为分级依据将噪声分为10级;步骤二:选用BSD500数据集中的图片,通过数据增强策略扩充图片数量得到训练集;步骤三:构建图像去噪模型:图像去噪模型包括依次连接的编码模块、密集残差模块和解码模块;步骤四:将训练集的图片分别添加步骤一中各个噪声等级范围内的高斯噪声得到含噪图像,将含噪图像输入步骤三构建的图像去噪模型分别进行学习训练,获得训练好的不同噪声等级的图像去噪模型;步骤五:在图像去噪应用时将含噪图片输入训练好的图像去噪模型,直接重构输出去噪后的图片。2.根据权利要求1所述的基于残差自编码的图像深度去噪方法,其特征在于,所述噪声的分级情况为:噪声等级12345标准差范围0~55~1010~1515~2020~25噪声等级678910标准差范围25~3030~3535~4040~4545~50。3.根据权利要求1或2所述的基于残差自编码的图像深度去噪方法,其特征在于,所述数据增强策略包括按相关比例缩放、旋转和裁剪一系列处理,实现方法为:将BSD500数据集中的图片按相关比例进行缩放处理,之后根据欲搭建的图像去噪模型的深度和感受野的范围将缩放后的图片按照10步长切割为30*30的图像补丁块,再将图像补丁块随机进行翻转、旋转处理,最后获得的图像块作为训练集。4.根据权利要求3所述的基于残差自编码的图像深度去噪方法,其特征在于,所述编码模块用于将输入的含噪图像映射到低维特征空间中,在此过程中卷积层不断学习图像的特征信息并且过滤掉噪声信息,得到全局图像特征;所述密集残差模块用于将编码模块所得到的全局图像特征进行更加细致的提取融合,充分获得含噪图像的局部细节特征信息,得到低维特征;所述解码模块用于将低维特征向高维图像转换,即将图像的抽象特征逐步还原成图像数据,同时逐层增大特征图尺寸,直至还原到与输入图片尺寸相同,还原过程中对部分图像细节进行恢复。5.根据权利要求4所述的基于残差自编码的图像深度去噪方法,其特征在于,所述编码模块包括6个卷积核大小为3*3的卷积层,卷积核个数分别为32、32、64、64、64、128,其中第5个卷积层的步长为2,其余均为1,第五个卷积层用来代替最大池化层从而减少参数个数,卷积层后连接采用LeakyReLU激活函数的激活层;所述密集残差模块的网络结构为两个卷积核大小3*3、卷积核个数128的卷积层和一个卷积核大小1*1、卷积核个数128的卷积层组成的密集残差结构,其中每个卷积层后面都添加BN层;所述解码模块包括5个卷积核大小为3*3以及卷积核个数分别为128、64、64、32、32的反卷积层,卷积层后跟采用LeakyReLU激活函数用来增加该神经网络模型的非线性表达能力,第一个卷积层后面为2*2的上采样层;最后通过卷积核大小3*3、卷积核个数为1的卷积层用来重构复原去噪后的图像。6.根据权利要求5所述的基于残差自编码的图像深度去噪方法,其特...

【专利技术属性】
技术研发人员:张杰卢淼鑫黄雯潇张焕龙张建伟王凤仙李林伟曲光
申请(专利权)人:郑州轻工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1