【技术实现步骤摘要】
一种基于注意力模型的非均匀运动模糊图像自适应复原方法
本专利技术属于数字图像/视频信号处理领域,特别涉及一种基于注意力模型的非均匀运动模糊图像自适应复原方法。
技术介绍
图像已成为人们获取信息的一种重要方式,图像中的文本、标识和标牌等信息对场景的理解具有重要的作用。然而,在图像采集的过程中,由于受到相机抖动、图像场景深度变化以及物体运动等因素的影响,往往会造成图像模糊,且由于拍摄场景不可再现,从而导致图像信息永久性丢失,给人们的工作生活带来诸多损失。虽然可以通过提高设备质量减少图像模糊,但是购置设备成本昂贵,且仍然存在很多模糊问题难以解决。因此,一个行之有效的模糊图像复原算法对于充分发挥图像质量有着重要意义,具有重要的学术价值和应用价值。模糊图像复原方法包含两大类:基于传统方法的图像复原和基于深度学习方法的图像复原。传统的模糊复原方法需要估计每个像素点对应的模糊核,因此传统方法往往需要对模糊源作出假设,且大部分传统方法的研究主要集中于解决相机平移、旋转产生的均匀模糊,而真实模糊图像的模糊核往往是非均匀的。传统方法难以解决实际情况中复杂因素引起的图像模糊。真实模糊图像的模糊核往往是未知的,再加上盲复原问题的欠定性,使得非均匀模糊图像盲复原成为一个极具挑战性的计算机视觉问题。近年来,基于深度学习的卷积神经网络在图像复原问题中得到了广泛的应用,这类图像复原方法避免了传统方法手工设计特征的过程,仅通过卷积神经网络端到端地学习图像的层级特征,得到低质图像与高质图像的映射关系。但是,现有的基于学习的方法过分依赖于 ...
【技术保护点】
1.一种基于注意力模型的非均匀运动模糊图像自适应复原方法,其特征在于:/n该方法采用生成对抗网络框架,首先,模糊图像通过融入视觉注意力机制的生成网络得到复原图像,然后,将复原图像与清晰图像送入判别网络进行判断,在两种网络的相互博弈中,训练得到复原能力更强的生成网络;/n该方法的整体网络分为两部分:生成网络和判别网络/n生成网络由4部分组成,特征降维网络、密集连接网络、注意力网络和特征重建网络;判别网络采用马尔可夫判别器,由全卷积网络组成;/n以下是分别对生成网络和判别网络的介绍;/n1)生成网络:/n第一步,特征降维网络降低特征维度;/n特征降维网络由3个卷积操作组成,输入图像分别送入一个7×7卷积层和两个3×3卷积层,每个卷积层后都跟有Instance Normalization归一化操作和RELU激活层;/n第二步,密集连接网络提取特征;/n在生成网络中设计了针对模糊图像复原任务的密集连接网络,密集连接网络包含3个密集连接子模块,每个子模块由6个卷积层组成,记x
【技术特征摘要】
1.一种基于注意力模型的非均匀运动模糊图像自适应复原方法,其特征在于:
该方法采用生成对抗网络框架,首先,模糊图像通过融入视觉注意力机制的生成网络得到复原图像,然后,将复原图像与清晰图像送入判别网络进行判断,在两种网络的相互博弈中,训练得到复原能力更强的生成网络;
该方法的整体网络分为两部分:生成网络和判别网络
生成网络由4部分组成,特征降维网络、密集连接网络、注意力网络和特征重建网络;判别网络采用马尔可夫判别器,由全卷积网络组成;
以下是分别对生成网络和判别网络的介绍;
1)生成网络:
第一步,特征降维网络降低特征维度;
特征降维网络由3个卷积操作组成,输入图像分别送入一个7×7卷积层和两个3×3卷积层,每个卷积层后都跟有InstanceNormalization归一化操作和RELU激活层;
第二步,密集连接网络提取特征;
在生成网络中设计了针对模糊图像复原任务的密集连接网络,密集连接网络包含3个密集连接子模块,每个子模块由6个卷积层组成,记xl为密集连接子模块第l层的输出,第0到第l-1层的输出特征图分别用x0...xl-1表示,其中每层的输入是前面所有输出层在通道维度的叠加,用公式(1)表示:
xl=Fl([x0,x1,...,xl-1]),(1)
其中,Fl(·)表示非线性转换函数,它是一个组合操作,包括InstanceNormalization归一化操作、RELU激活层和3×3卷积操作,卷积层的输出通道数,也即增长率growthrate为72;
为了降低密集连接子模块的规模和复杂度,设计了bottleneck结构减少计算量,在每个密集连接子模块内部的6个卷积层的相邻卷积层之间加入一个1×1的卷积层,其后跟一个Instancenormalization归一化操作和一个RELU激活函数,进行特征降维操作;
在三个密集连接子模块中相邻子模块之间加入过渡层,过渡层是一个组合操作,包括InstanceNormalization归一化操作和1×1的卷积操作,卷积操作的输出通道维度为θ×N,其中θ为压缩率,N为输入过渡层的通道数,θ=0.5;
第三步,设计了混合注意力机制帮助网络自适应地选择并提取模糊图像的区域特征;
混合注意力机制由通道和空间注意力机制两个模块串联组成,具体操作为,首先分别计算输入特征图基于每个通道平面的Averagepooling和Maxpooling,得到两个维度为C即输入特征图的通道数×1的特征向量,然后将两个特征向量分别经过权值共享的单隐层多层感知机,其中输入层到隐藏层的权重隐藏层到输出层的权重得到两个C×1维的特征向量,最后将两个特征向量线性相加后经过sigmoid激活层得到维度为C×1的通道注意力特征图;
空...
【专利技术属性】
技术研发人员:李晓光,杨飞璠,张辉,卓力,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。