System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于NAFNet与注意力机制融合的水下图像增强方法技术_技高网

一种基于NAFNet与注意力机制融合的水下图像增强方法技术

技术编号:40223280 阅读:7 留言:0更新日期:2024-02-02 22:28
本发明专利技术公开了一种基于NAFNet与注意力机制融合的水下图像增强方法,具体包括:将获取得到的低质量水下图像数据集划分为训练集和测试集;基于训练集对加入注意力机制模块DAM的NAFNet网络进行训练,引入LAB和LCH颜色空间的损失函数,设计出多重损失函数;向优化好的水下图像增强网络模型输入测试集,得到相应的清晰图像。本发明专利技术使用NAFNet网络作为基本框架,以实现快速和轻量化。此外,通过注意力机制能够加强网络对衰减严重的颜色区域和重要的通道信息的关注,并有效缓解噪声干扰。

【技术实现步骤摘要】

本专利技术涉及图像处理以及计算机视觉领域,特别涉及一种基于nafnet与注意力机制融合的水下图像增强方法。


技术介绍

1、随着人类对海洋的不断探索,水下探测技术和水下机器人技术也不断得到发展和应用。水下图像作为一种重要的水下信息承载方式,已经成为人们了解海洋环境和资源、研究海洋科学的重要手段之一。

2、然而,受悬浮颗粒、浮游生物等多种干扰因素的影响,太阳光在水下传播时,产生了水下介质的散射现象,造成图像低对比度,且可能伴随着雾状效果。当太阳光线照射入水中后,其强度随距离呈指数衰减,水下图像通常会遭受严重的颜色失真。上述这些因素严重影响了水下图像中有效信息的提取,对基于视觉的水下作业构成了巨大挑战。

3、目前解决水下图像存在问题的方法主要分为基于传统的水下图像增强方法和基于深度学习的水下图像增强方法。传统的水下图像增强方法通过调整像素值或利用人工构造的先验方法来估计水下成像模型参数的方式来增强低质量水下图像。然而,由于水下成像退化的多样性,传统方法只能适用于单一的水下环境,难以处理复杂场景下的水下图像。得益于深度学习的快速发展和图形处理器等设备的处理能力的提升,深度学习在图像分割、目标跟踪和图像增强等计算机视觉的多个领域,都表现出了强大的特征选择和提取能力。

4、近年来,水下图像增强领域的研究不断取得新的突破,但如何解决在复杂水下成像环境中色彩失真和去噪是待解决的难题。


技术实现思路

1、有鉴于此,本专利技术目的在于提出一种基于nafnet与注意力机制融合的水下图像增强方法,用于恢复水下图像的真实色彩和去除图像噪声,以帮助水下目标检测等高层次水下视觉任务的执行提供一种有效的解决方案。

2、为达到上述目的,本专利技术采用的技术方案如下:

3、一种基于nafnet与注意力机制融合的水下图像增强方法,该方法具体包括以下步骤:

4、s1,获得不同场景下的配对低质量水下图像与清晰图像数据集;

5、s2,将数据集随机划分为训练集和测试集,并对图片进行预处理,作为网络的输入;

6、s3,通过训练集数据训练基于nafnet与注意力机制融合的水下图像增强网络,并保存训练完成后的网络参数;

7、s4,将测试集数据输入到训练好的水下图像增强网络模型中,得到增强后的水下图像。

8、优选地,步骤s2包括:将数据集划分为训练集及测试集,将训练集和测试集的每组配对图像缩放至相同尺寸,并进行归一化处理;

9、优选地,根据训练集训练基于nafnet与注意力机制融合的水下图像增强网络模型的步骤包括:

10、s31,搭建基于nafnet与注意力机制融合的水下图像增强网络模型结构;所述基于nafnet与注意力机制融合的水下图像增强网络模型结构包括顺序连接的编码器模块和解码器模块;每一层的编码器和解码器之间均采用双重注意力机制模块dam进行连接;

11、s3101,所述编码器模块由4个阶段组成,其中,4个阶段分别采用2个、2个、4个和8个非线性激活自由网络模块nafblock组成;

12、s3102,所述非线性激活自由网络模块nafblock由第一归一化层、第一1×1卷积层、第一3×3深度卷积层、第一simplegate模块、第一简化通道注意力模块、第一1×1卷积层和第二归一化层、第二1×1卷积层、第二simplegate模块、第二1×1卷积层通过级联的方式构成;所述simplegate模块,直接将特征图划分为通道维度中的两个部分并将它们相乘;所述简化通道注意力模块,首先通过全局平均池化操作,将空间信息聚合到通道中,接着直接利用1x1卷积操作来实现通道间的信息交换;

13、s3103,所述解码器部分与编码器相似,由4个阶段组成,其中,4个阶段均采用2个非线性激活自由网络模块nafblock组成;

14、s3104,所述双重注意力机制模块dam包括通道注意模块cab和空间注意模块sab;输入的图像先通过非线性激活自由网络模块nafblock进行特征提取,然后将提取得到的特征图同时送至通道注意模块cab和空间注意模块sab中,最后再将特征图分别与通道注意特征图和空间注意特征图相乘并相加;

15、s3105,编码器和解码器之间通过12个非线性激活自由网络模块nafblock相连接;

16、s32,构造损失函数:

17、为了更好地恢复图像的色彩效果,同时尽可能保留细节特征,本专利技术将内容损失、lab和lch颜色空间的多种损失函数集合起来训练模型;本专利技术损失函数定义如下:

18、l=λ1losslab(g(x),y)+λ2losslch(g(x),y)+λ3lcon

19、其中,losslab表示lab颜色空间损失函数;losslch表示lch颜色空间损失函数;lcon表示内容损失函数;λ1,λ2,λ3表示权重因子,用于目标函数中的各项损失函数,其中λ1=0.001,λ2=1,λ3=0.2;

20、引入的lab损失函数和lch损失函数可以获得更广泛的色域表示范围和更准确的颜色饱和度;首先将rgb空间中的图像转换lab和lch空间,其定义如下:

21、lg(x),ag(x),bg(x)=rgb2lab(g(x)),ly,ay,by=rgb2lab(y)

22、lg(x),cg(x),hg(x)=rgb2lch(g(x)),ly,cy,hy=rgb2lch(y)

23、其中x、y和g(x)分别表示原始输入、参考图像和生成图像输出。

24、lab和lch损失函数则可表示为:

25、

26、

27、其中q代表量化算子。

28、为激励模型生成与参考图像更加相似的内容,本专利技术将内容损失加入目标函数之中,其定义为vgg19预训练网络中的第5块conv2层提取出的高级特征,其定义如下:

29、

30、其中,表示提取到的高级特征。

31、优选地,步骤s4包括:在已划分好的测试集中读取低质量水下图像数据,按照训练集的预处理方法对测试集数据进行预处理;将预处理过后的测试集输入至基于nafnet与注意力机制融合的水下图像增强网络模型中,得到清晰的水下图像;将生成的清晰图像与测试集中与之对应的参考图像进行对比,计算衡量指标psnr和ssim。

32、与现有技术相比,本专利技术具有如下有益效果:

33、本专利技术针对低质量水下图像增强问题,提出一种基于nafnet与注意力机制融合的水下图像增强网络模型,该方法通过在每层的编码器网络块和解码器网络块之间添加双重注意力机制模块dam,解决不同颜色通道在不同空间区域下衰减不一致问题,同时抑制图像噪声;为了进一步提高对比度和饱和度,引入lab和lch颜色空间的损失函数,设计出多重损失函数。

本文档来自技高网...

【技术保护点】

1.一种基于NAFNet与注意力机制融合的水下图像增强方法,其特征在于包括以下步骤:

2.根据权利要求1所述的基于NAFNet与注意力机制融合的水下图像增强方法,其特征在于,步骤S2包括:将数据集划分为训练集及测试集,将训练集和测试集的每组配对图像缩放至相同尺寸,并进行归一化处理。

3.根据权利要求2所述的基于NAFNet与注意力机制融合的水下图像增强方法,其特征在于,根据训练集训练基于NAFNet与注意力机制融合的水下图像增强网络模型的步骤包括:

4.根据权利要求1所述的基于NAFNet与注意力机制融合的水下图像增强方法,其特征在于,步骤S4包括:在已划分好的测试集中读取低质量水下图像数据,按照训练集的预处理方法对测试集数据进行预处理;将预处理过后的测试集输入至优化好的水下图像增强网络模型中,得到清晰的水下图像;将生成的清晰图像与测试集中与之对应的参考图像进行对比,计算衡量指标PSNR和SSIM。

【技术特征摘要】

1.一种基于nafnet与注意力机制融合的水下图像增强方法,其特征在于包括以下步骤:

2.根据权利要求1所述的基于nafnet与注意力机制融合的水下图像增强方法,其特征在于,步骤s2包括:将数据集划分为训练集及测试集,将训练集和测试集的每组配对图像缩放至相同尺寸,并进行归一化处理。

3.根据权利要求2所述的基于nafnet与注意力机制融合的水下图像增强方法,其特征在于,根据训练集训练基于nafne...

【专利技术属性】
技术研发人员:陶洋刘羽婷武萍方文俊
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1