一种基于掩码自监督对比学习的水下目标检测方法技术

技术编号：46052212 阅读：8 留言：0更新日期：2025-08-11 15:40

本发明专利技术公开了一种基于掩码自监督对比学习的水下目标检测方法，涉及水下目标检测领域，旨在解决现有水下目标检测方法中存在的识别精度低，场景适应能力差的问题，该检测方法具体为：构建水下目标检测基准数据集；将Swin‑Transformer和自适应特征融合金字塔模块添加到对比学习框架中并对图像添加掩码进行预训练；冻结主干网络参数，调整自适应特征融合金字塔模块参数；更换YOLOX中的主干网络为Swin‑Transformer，使用改进的自适应特征融合金字塔模块；使用改进后的YOLOX进行水下目标检测，获取水下目标的位置和类别信息。本发明专利技术针对水下场景的目标检测方法进行改进，改善了网络的结构，优化了网络的参数，提升目标检测算法在水下场景的适应能力，适用于水下复杂环境的高精度目标检测。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机、深度学习领域、水下机器视觉领域、尤其涉及水下目标检测领域，具体涉及一种基于掩码自监督对比学习的水下目标检测方法。

技术介绍

1、海洋是生命的发源地，蕴藏着大量的可利用资源。海洋勘探对于资源的合理利用，生态环境的可持续发展具有重要意义。近年来，随着深度学习技术的发展，配备智能目标检测算法的水下无人航行器在海洋资源勘探中起到了巨大作用。然而，复杂的水下环境使得捕获的图像带有较大的噪声，目标检测网络难以学习到很好的视觉表征，这对常见的目标检测算法提出了巨大挑战。因此，提高目标检测网络学习到的视觉表征质量，设计一种高精度的水下目标检测算法成为了重点研究方向。

2、自监督学习是无监督学习的一种，主要有掩码图像建模(mim)方法和实例判别(id)方法，其主要目的是让网络学习到更丰富的语义表征。它通过挖掘数据本身蕴含的结构或者特征，能够更好地完成相关任务。然而，id方法避免特征，但缺乏了空间敏感度，mim方法维持了空间敏感度，却未进行语义对齐。因此，结合mim方法和id方法的优势，将自监督学习引入到水下目标检测中，适...

【技术保护点】

1.一种基于掩码自监督对比学习的水下目标检测方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种基于掩码自监督对比学习的水下目标检测方法，其特征在于，所述步骤S2的具体方式为：将步骤S1构建的水下目标检测基准数据集按照标注文件中的目标框进行裁剪，保存裁剪后的图片并进行归类，作为掩码自监督对比学习数据集。

3.根据权利要求1所述的一种基于掩码自监督对比学习的水下目标检测方法，其特征在于，所述的Swin-Transformer编码器具有分层的体系结构，在设置移位窗口的同时还允许跨窗口连接；所述AFFPM采用加权融合的结构，融合后的输出用公式表示如下：

...

【技术特征摘要】

1.一种基于掩码自监督对比学习的水下目标检测方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种基于掩码自监督对比学习的水下目标检测方法，其特征在于，所述步骤s2的具体方式为：将步骤s1构建的水下目标检测基准数据集按照标注文件中的目标框进行裁剪，保存裁剪后的图片并进行归类，作为掩码自监督对比学习数据集。

3.根据权利要求1所述的一种基于掩码自监督对比学习的水下目标检测方法，其特征在于，所述的swin-transformer编码器具有分层的体系结构，在设置移位窗口的同时还允许跨窗口连接；所述affpm采用加权融合的结构，融合后的输出用公式表示如下：

4.根据权利要求1所述的一种基于掩码自监督对比学习的水下目标检测方法，其特征在于，所述步骤s3完成框架搭建后，输入imagenet数据集，利用随机裁剪，提取不同视图，然后缩放到相同的尺寸，进行训练，在线分支的视图被称为在线视图，仅在在线视图中添加掩码块，为了防止过多的掩码块导致在线分支和目标分支中的视图差异过大，进而影响对比学习中的语义一致性，仅...

【专利技术属性】
技术研发人员：王新星，董姚林，王盛文，莫潇宇，
申请(专利权)人：燚智盐城云计算科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人