一种基于U-Net的图像非均匀模糊核的估计方法技术

技术编号:34851716 阅读:29 留言:0更新日期:2022-09-08 07:52
本发明专利技术是基于U

【技术实现步骤摘要】
一种基于U

Net的图像非均匀模糊核的估计方法


[0001]本专利技术涉及的是一种基于U

Net的图像非均匀模糊核的估计方法,属于图像处理


技术介绍

[0002]图像模糊是数字图像处理领域中,图像在获取的过程中经常遇到的一种图像质量退化的情况。导致图像模糊的原因有多种,其中运动模糊是一种比较典型的原因,其主要是由于摄像头与场景或者场景中不同的物体之间所存在的相对运动,相机曝光时间较长所导致的。从图像生成的方式来看,不同程度和类型的相对运动,就会有不同的运动模糊的核,从而导致拍摄出来的图像出现不同程度以及不同类型的模糊。
[0003]另外,根据图像不同区域的模糊是否相同,图像模糊的情况又可以分为均匀模糊和非均匀模糊两种情况。均匀模糊是指整幅图像的运动模糊核是一致的,这种情况相对较为简单;而非均匀模糊是指图像的不同区域的模糊核是不一样的,这种情况较为复杂,也更符合实际中我们所碰到的情况。
[0004]本专利技术主要考虑非均匀模糊的情况,提出一种从模糊图像中估计出非均匀模糊核的方法。图像模糊核估计的准确与否,对于从模糊图像中恢复出清晰的图像起着至关重要的作用。然而在现实生活中,往往只有单一的模糊图像,因此从单一的模糊图像中估计运动模糊的核往往是一个比较困难的问题。
[0005]现有技术中,主要存在两类方法可以用来估计模糊核,一种是基于自然图像统计先验的传统迭代优化类的方法,另一种是基于深度学习的从大量数据中学习的方法。最近几年,基于深度神经网络的算法模型被广泛的应用到各种计算机视觉领域的问题上,取得了很大的进展。在图像去模糊这个问题上,也有各种各样的深层网络的模型被开发出来,用于从模糊的图像中估计核,或者是直接从模糊的图像恢复出清晰的图像,取得了良好的效果。
[0006]然而在现有的基于深度学习的图像非均匀模糊核的估计方法中,有的是利用图像块来训练学习图像局部的模糊核,有的方法虽然利用了整个的图像来学习,但是没有考虑相邻图像块的模糊核之间的关联性,从而影响了图像模糊核估计的精确性。

技术实现思路

[0007]本专利技术提出的是一种基于U

Net的图像非均匀模糊核的估计方法,其目的旨在克服现有技术存在的上述不足,提高模糊核估计的准确性。
[0008]本专利技术的技术解决方案:一种基于U

Net的图像非均匀模糊核的估计方法,包括以下步骤:
[0009]步骤S1:获取若干清晰的自然图像:利用这些清晰的自然图像来构建数据集进行训练模型。
[0010]步骤S2:生成非均匀的模糊核,并利用该模糊核对清晰图像进行模糊处理,得到相
对应的模糊图像,构成训练数据集:先通过人工采样生成若干不同的非均匀的模糊核,然后通过卷积运算把清晰的自然图像生成相对应的模糊图像,从而构成训练模型所需要的数据集;
[0011]步骤S3:搭建基于U

Net的估计非均匀模糊核的网络模型:利用U

Net型的网络模型来估计模糊图像的非均匀模糊核,U

Net型的网络模型包括编码器模块、解码器模块以及跳层连接,其输入是一个3通道的非均匀模糊的彩色图像,输出是导致该图像模糊的非均匀的模糊核,是个1通道的灰度图像;
[0012]步骤S4:设计网络模型训练的损失函数:模型优化的损失函数为是一个关于给定模糊图像的代价函数,目的是使得利用估计出来的核去模糊相应的清晰的图像,所得到的模糊图像与原始的模糊图像尽可能相同,其计算公式为:
[0013]其中i是清晰图像u中的像素的位置,k
i
是像素i处的局部的模糊核,u
i
是清晰图像中以像素i为中心的一个与核k
i
大小相同的局部区域,v是与清晰图像u所对应的模糊图像,*是卷积运算符号;
[0014]步骤S5:选择优化算法,利用训练数据集优化网络模型:采用梯度下降的方法来优化代价函数,具体是使用Adam算法,该算法利用梯度的一阶矩估计和二阶矩估计动态调整参数的学习率,使得参数的更新比较平稳;学习速率为0.0001,并且在每当训练集迭代200个epoch以后,学习速率减半,总共把训练集迭代800个epoch;
[0015]步骤S6:将待处理的模糊图像输入到模型,得到其非均匀的模糊核。
[0016]优选的,所述的步骤S3中的编码器模块包括卷积层和下采样层,通过逐步减小特征图的尺寸并提升通道的数量,从输入图像中提取特征,起到对输入进行编码的作用,编码器模块包含的基本单元和网络结构参数设置如下:
[0017](1)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是16;
[0018](2)一个下采样层,采用窗口大小为2
×
2的最大池化,步长为2;
[0019](3)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是32;
[0020](4)一个下采样层,采用窗口大小为2
×
2的最大池化,步长为2;
[0021](5)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是64;
[0022](6)一个下采样层,采用窗口大小为2
×
2的最大池化,步长为2;
[0023](7)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是128;
[0024](8)一个下采样层,采用窗口大小为2
×
2的最大池化,步长为2;
[0025](9)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是256;
[0026]解码器模块包括上采样层和卷积层,通过逐步增大特征图的尺寸并减少通道的数量,来逐步恢复原始的分辨率,从而最终得到输入图像所对应的非均匀的模糊核图像,解码器模块包含的基本单元和网络结构参数设置如下:
[0027](1)一个上采样层,采用放大尺度为2
×
2的双线性差值;
[0028](2)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是128;
[0029](3)一个上采样层,采用放大尺度为2
×
2的双线性差值;
[0030](4)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是64;
[0031](5)一个上采样层,采用放大尺度为2
×
2的双线性差值;
[0032](6)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是32;
[0033](7)一个上采样层,采用放大尺度为2
×
2的双线性差值;
[0034](8)一个卷积层,卷积核的大小为3
×
3,步长为1,通道数是16;
[0035](9)一个卷积层,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于U

Net的图像非均匀模糊核的估计方法,其特征在于,包括以下步骤:步骤S1:获取若干清晰的自然图像:利用这些清晰的自然图像来构建数据集进行训练模型;步骤S2:生成非均匀的模糊核,并利用该模糊核对清晰图像进行模糊处理,得到相对应的模糊图像,构成训练数据集:先通过人工采样生成若干不同的非均匀的模糊核,然后通过卷积运算把清晰的自然图像生成相对应的模糊图像,从而构成训练模型所需要的数据集;步骤S3:搭建基于U

Net的估计非均匀模糊核的网络模型:利用U

Net型的网络模型来估计模糊图像的非均匀模糊核,U

Net型的网络模型包括编码器模块、解码器模块以及跳层连接,其输入是一个3通道的非均匀模糊的彩色图像,输出是导致该图像模糊的非均匀的模糊核,是个1通道的灰度图像;步骤S4:设计网络模型训练的损失函数:模型优化的损失函数为是一个关于给定模糊图像的代价函数,目的是使得利用估计出来的核去模糊相应的清晰的图像,所得到的模糊图像与原始的模糊图像尽可能相同,其计算公式为:其中i是清晰图像u中的像素的位置,k
i
是像素i处的局部的模糊核,u
i
是清晰图像中以像素i为中心的一个与核k
i
大小相同的局部区域,v是与清晰图像u所对应的模糊图像,*是卷积运算符号;步骤S5:选择优化算法,利用训练数据集优化网络模型:采用梯度下降的方法来优化代价函数,具体是使用Adam算法,该算法利用梯度的一阶矩估计和二阶矩估计动态调整参数的学习率,使得参数的更新比较平稳;学习速率为0.0001,并且在每当训练集迭代200个epoch以后,学习速率减半,总共把训练集迭代800个epoch;步骤S6:将待处理的模糊图像输入到模型,得到其非均匀的模糊核。2.如权利要求1所述的一种基于U

Net的图像非均匀模糊核的估计方法,其特征在于,所述的步骤S3中的编码器模块包括卷积层和下采样层,通过逐步减小特征图的尺寸并提升通道的数量,从输入图像中提取特征,起到对输入进行编码的作用,编码器模块包含的基本单元和网络结构参数设置如下:(1)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是16;(2)一个下采样层,采用窗口大小为2
×
2的最大池化,步长为2;(3)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是32;(4)一个下采样层,采用窗口大小为2
×
2的最大池化,步长为2;(5)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是64;(6)一个下采样层,采用窗口大小为2
×
2的最大池化,步长为2;(7)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是128;(8)一个下采样层,采用窗口大小为2
×
2的最大池化,步长为2;(9)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是256;解码器模块包括上采样层和卷积层,通过逐步增大特征图的尺寸并减少通道的数量,来逐步恢复原始的分辨率,从而最终得到输入图像所对应的非均匀的模糊核图像,解码器模块包含的基本单元和网络结构参数设置如下:
(1)一个上采样层,采用放大尺度为2
×
2的双线性差值;(2)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是128;(3)一个上采样层,采用放大尺度为2
×
2的双线性差值;(4)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是64;(5)一个上采样层,采用放大尺度为2
×
2的双线性差值;(6)两个卷积层,卷积核的大小为3
×
3,步长为1,通道数是32;(7)一个上采样层,采用放大尺度为2
×
2的双线性差值;(8)一个卷积层,卷积核的大小为3
×
3,步长为1,通道数是16;(9)一个卷积层,卷积核的大小为1
×
1,步长为1,通道数是1;跳层连接的目的是进行特征融合,即在解码器模块进行上采样的过程中,把编码器同一层次下采样过程中得到的特征图与当前的特征图融合在一起,即将特征图的通道进行叠加,再进行下一步的操作;在这个网络中采用了4个跳层连接的基本操作:(...

【专利技术属性】
技术研发人员:张克廷黄建杰
申请(专利权)人:央视国际网络无锡有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1