一种基于改进Swin Transformer的生成对抗网络水下图像增强模型制造技术

技术编号:42669458 阅读:99 留言:0更新日期:2024-09-10 12:24
随着对海洋探索的不断深入,水下图像增强与恢复技术备受关注。针对水下图像对比度低,噪声大和色彩偏差等问题,本发明专利技术提出一种基于改进Swin Transformer的生成对抗网络水下图像增强模型(SwinGAN)。在输入生成器前对水下图像进行双三次插值预处理,在瓶颈层将输入的特征图分割成多个不重叠的局部窗口,再使用双路窗口多头自注意力机制,在加强捕获全局信息和距离依赖关系的同时,增强局部注意力。最后,在解码器经过多个窗口重新组合成原始尺寸的特征图,对抗网络中的判别网络采用改进马尔科夫判别器。使用Charbonnier损失函数,边缘损失函数,对抗损失函数和MS‑SSIM+L1损失函数提升图像结构和视觉质量。本发明专利技术在改善水下图像的色彩偏差和模糊问题取得显著效果。

【技术实现步骤摘要】

本专利技术涉及基于深度学习的海洋图像处理技术,特别涉及一种基于改进swintransformer的生成对抗网络水下图像增强模型。


技术介绍

1、随着海洋资源开发与海洋环境保护日益受到重视,水下图像的获取与处理成为了研究的热点。然而,水下环境的复杂性给图像的质量和可用性带来了诸多挑战,如光线衰减、水下浑浊和颜色失真等问题,严重限制了图像分析和应用的准确性。为了解决这些问题,首先出现了两种基于深度学习的水下图像增强(uie)网络模型,即卷积神经网络(cnn)和生成对抗网络(gan)。

2、cnn方法依赖于其强大的特征提取能力,通过多层卷积层自动学习图像的层次化特征。这些网络通常被设计为端到端的结构,直接将输入的退化水下图像转换为增强后的图像。其优势在于其能够通过训练学习到图像中的局部和全局模式,从而有效地进行颜色校正、对比度增强和去模糊等任务。此外,还通过多任务学习同时解决多个图像增强问题,如颜色校正和去雾化。然而,其性能在很大程度上依赖于训练数据的质量和多样性。对于水下图像而言,获取大量标注的高质量训练样本可能具有挑战性,这限制了处理未知或极端水本文档来自技高网...

【技术保护点】

1.一种基于改进SwinTransformer的生成对抗网络水下图像增强模型,其特征在于,所述方法包括:首先对水下图像进行双三次插值预处理,统一不同来源图像的尺寸。通过,生成网络部分遵循编码器-瓶颈层-解码器的结构设计,在瓶颈层将输入的特征图分割成多个不重叠的局部窗口,再使用双路窗口多头自注意力机制,在加强捕获全局信息和距离依赖关系的同时,增强局部注意力。最后,在解码器经过多个窗口重新组合成原始尺寸的特征图,对抗网络中的判别网络采用改进马尔科夫判别器。复合损失函数使用Charbonnier损失函数,边缘损失函数,对抗损失函数和MS-SSIM+L1损失函数提升图像结构和视觉质量。

<...

【技术特征摘要】

1.一种基于改进swintransformer的生成对抗网络水下图像增强模型,其特征在于,所述方法包括:首先对水下图像进行双三次插值预处理,统一不同来源图像的尺寸。通过,生成网络部分遵循编码器-瓶颈层-解码器的结构设计,在瓶颈层将输入的特征图分割成多个不重叠的局部窗口,再使用双路窗口多头自注意力机制,在加强捕获全局信息和距离依赖关系的同时,增强局部注意力。最后,在解码器经过多个窗口重新组合成原始尺寸的特征图,对抗网络中的判别网络采用改进马尔科夫判别器。复合损失函数使用charbonnier损失函数,边缘损失函数,对抗损失函数和ms-ssim+l1损失函数提升图像结构和视觉质量。

2.根据权利要求1所述的基于改进swin transformer的生成对抗网络水下图像增强模型的水下图像的处理方法,其特征在...

【专利技术属性】
技术研发人员:李慧贾炳志王晨曦董子宇张舒仲兆满胡文彬吴加莹
申请(专利权)人:江苏海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1