基于多尺度自适应非局部注意力网络的图像超分辨率方法技术

技术编号：38704976 阅读：14 留言：0更新日期：2023-09-08 14:45

本发明专利技术公开了一种多尺度自适应非局部注意力网络的图像超分辨率方法，包括：S1全局密集连接、局部残差连接的网络框架；S2非局部注意力模块中的基于自适应稀疏聚合的多尺度非注意力模块；S3非局部注意力模块中的反向残差投影特征融合方法；S4通道注意力模块中的二次通道注意力计算方法；S5基于亚像素卷积算法的上采样层。本发明专利技术首先将降采样后的低分辨率图像输入基于注意力机制的超分辨率模型中，经过浅层特征提取、深层特征提取、上采样以及重构后获得超分辨率图像。其中在深层特征提取中本发明专利技术设计了自适应稀疏聚合策略以及多尺度非局部注意力计算，使得网络能够关注更相关的特征信息以提升生成的超分辨率图像的精度。征信息以提升生成的超分辨率图像的精度。征信息以提升生成的超分辨率图像的精度。

全部详细技术资料下载

【技术实现步骤摘要】
基于多尺度自适应非局部注意力网络的图像超分辨率方法

[0001]本专利技术属于基于深度学习神经网络的图像超分辨率领域，具体涉及通过注意力机制挖掘图像中潜在的非局部语义信息以及局部结构特征信息的基于多尺度自适应非局部注意力网络的图像超分辨率方法。

技术介绍

[0002]图像超分辨率技术，简称超分SR，指的是利用数字图像处理、计算机视觉等领域的相关知识，借由特定的算法和处理流程，从给定的低分辨率图像中复原出高分辨率图像的过程。其旨在克服或补偿由于图像采集系统或采集环境本身的限制，导致的成像图像模糊、质量低下、感兴趣区域不显著等问题。该技术在多个领域都有着广泛的应用范围和研究意义，主要包括：在图像压缩方面，网络传输过程中可以只传输低分辨率的图片，然后通过重建操作得到高分辨率图像。传输低分辨率图像相比高分辨率图像来说，可以减少网络负载；在医学图像方面，可以通过设备得到低分辨率图像，通过重建，能更加清晰地看到组织、细胞的状态；在公安安防方面，通过超分辨率重建可以恢复清晰的车牌号码、人脸；在视频感知领域，通过图像超分辨率重建技术，可以起到聚合视频画质、改善视频的质量，提升用户视觉体验的作用。随着深度学习的发展，基于深度学习的超分辨率方法性能相比传统的方法提升十分显著，并逐渐取代了传统的方法作为主流的超分辨率研究方法。如何设计网络拓扑结构、挖掘图片中潜藏的相关特征成为了学术界和工业界的核心关注点。
[0003]目前，国内外学者在基于注意力机制的图像超分领域做出了很多有价值的研究成果。Dai等人使用二阶通道注意(SPCA)模...

【技术保护点】

【技术特征摘要】
1.基于多尺度自适应非局部注意力网络的图像超分辨率方法，其特征在于，包括以下步骤：步骤1.将低分辨率图像输入到超分辨率网络中；首先输入通过浅层特征提取层；该层由一个3
×
256
×3×
3的卷积层构成，将低分辨率图像通道维映射到高维空间；计算公式为：F0＝H
FSE
(I
LR
)其中H
FSE
表示浅层特征提取过程，I
LR
表示低分辨率图像，F0为浅层特征提取层的输出特征图；步骤2.将上述得到的浅层特征图作为非线性映射层的输入；计算公式为：F1＝H
DF
(F0)其中H
DF
表示非线性映射整体过程，F1为非线性映射层的输出特征图；步骤3.将非线性映射部分的输出作为上采样层的输入；上采样层采用亚像素卷积算法来实现特征图的尺寸放大到指定大小；计算公式为：F2＝H
PS
(F1)其中H
PS
表示亚像素卷积层，F2为上采样层的输出特征图；步骤4.将放大尺寸后的特征图通过一个卷积层进行重构，该卷积核拥有三个通道分别对应颜色的RGB三个通道，生成高分辨率的图像I
SR
；重构的计算公式可以表示为：I
SR
＝H
RE
(F2)其中H
RE
表示重构模块的单卷积层；整个模型用计算公式表示为：I
SR
＝H
A
(I
LR
)其中H
A
()表示本发明所设计的超分辨率模型；步骤5.采用平均绝对误差作为损失函数计算损失；损失函数公式为：其中，N表示图像中特征的总个数，I
LR
表示低分辨率图像，I
HR
表示高分辨率图像；在优化过程中，将当前批量的数据集作为输入传入模型，然后计算预测值与实际值之间的损失函数值；根据损失函数的值来更新模型参数，使得损失函数的值下降；重复进行这种迭代的优化过程，直到达到收敛条件为止，最终训练结束得到模型；步骤6.计算超分辨率模型定量评估指标PSNR以及SSIM来量化模型性能；PSNR值的计算公式为：其中，M是像素值的最大值，MSE是均方误差，是两幅图像之间每个像素误差的平方和的平均值；SSIM值的计算公式为：
其中，x和y分别为两幅图像；μ
x
和μ
y
为两幅图像的均值；和为两幅图像的方差；σ
xy
为两幅图像的协方差；C1和C2为需要进行调整的常数参数。2.根据权利要求1所述的基于多尺度自适应非局部注意力网络的图像超分辨率方法，其特征在于，步骤2包括以下子步骤：步骤2.1.非线性映射层由若干个残差块RB密集连接而成，所以每一个残差块RB中的第一个构成模块RCABP都需要接收前面所有残差块的输出，从而构成密集连接；密集连接通过连接所有先前的层，使得所有层都能够访问之前的特征图；实现密集连接的模块分别由由一个(256*n)
×
256
×3×
3的卷积层convD、relu函数、一个256
×
256
×3×
3的卷积层conv以及通道注意力层CAlayer构成；其中n为残差块的序号，Out
RCABP
是RCABP的输出结果，F
conv
表示卷积操作，F
convD
表示用于处理密集连接的卷积操作；计算公式为：Out
RCABP
＝F
CAlayer
(F
conv
(relu((F
convD
(F1))))步骤2.2.RCABP的输出作为非局部注意力模块的输入；非局部注意力将输入分别用基于自适应稀疏聚合的多尺度非局部注意力模块、普通非局部注意力模块和恒等映射进行处理，并通过反向残差投影对三个模块的输出进行特征融合；步骤2.3.非局部注意力...

【专利技术属性】
技术研发人员：张新，江胜嵊，殷昱煜，张伟，孙茜茜，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人