一种基于混合建模的轻量化前视声呐图像语义分割方法技术

技术编号：39166175 阅读：24 留言：0更新日期：2023-10-23 15:04

本发明专利技术提供一种基于混合建模的轻量化前视声呐图像语义分割方法，包括模型搭建、训练、采集和预测等模块；模型搭建模块，使用混合建模网络作为主干网络提取特征，结合动态注意力门控模块和解码器搭建模型；训练模块，基于训练数据集进行训练；采集模块，获取新的前视声呐图像；预测模块，将新获取的前视声呐图像输入训练好的模型进行像素级类别预测，输出用于语义分割结果。本发明专利技术提出了准确度高、运行速度快、参数量少的前视声呐图像语义分割方法，可用于水下航行器识别水下物体，辅助水下物体抓取和避障。抓取和避障。抓取和避障。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于混合建模的轻量化前视声呐图像语义分割方法

[0001]本专利技术涉及图像数据分割
，具体为一种基于混合建模的轻量化前视声呐图像语义分割方法。

技术介绍

[0002]声呐是水下探测的一种有效工具，可以通过处理声呐回波成像后的图像获取信息。声呐可分为侧扫声呐、合成孔径声呐和前视声纳等。其中，前视声呐通过声波发射基阵，以扇形前向或垂直方向发射脉冲信号并实施成像，相比与其他类型的声纳可以广泛地采集水下信息，可用于水下航行器的环境感知和导航。由于海底混响、海洋环境噪声和声波在传播过程中的折射、吸收，声呐图像往往具有噪声干扰、混叠失真等特点，为声呐图像的处理带来了困难。传统的声呐图像处理算法往往采用人工提取特征的方式，这些算法容易受各类噪声的干扰，同时也不够智能化，对于不同种类物体的泛化能力差。因此，一种引入深度学习技术的高性能前视声呐图像分割方法显得尤为重要。
[0003]经检索，申请号为CN202010811312.6的中国专利，一种基于respath
‑
Unet的水下声呐图像数据分割方法，通

【技术保护点】

【技术特征摘要】
1.一种基于混合建模的轻量化前视声呐图像语义分割方法，其特征在于，包括以下步骤：S1：获取水下前视声呐数据集；S2：对获取的水下前视声呐数据集进行像素级标注，其中，背景部分标注为0，各类检测目标标注为1
‑
10；S3：将标注好的水下前视声呐图像数据进行划分为训练集合和验证集；S4：构建混合建模网络作为模型主干网络，基于混合建模模组和结构化重参数式前馈网络构成的编码器，以各阶段的编码器输出作为动态注意力门控模组和解码器的输入，构建混合建模分割网络；S4.1在混合建模分割网络的编码器部分，采用混合建模网络作为骨干网络，混合建模模组由卷积建模和注意力式建模组成，结构化重参数式前馈网络由经过改进的结构化重参数卷积层和批归一化层作为前馈网络，每个阶段由混合建模模组和结构化重参数式前馈网络先后构成；其中，骨干网络分为四个阶段；S4.2阶段一，构建动态注意力门控模组，动态注意力门控模组由动态卷积和门控注意力机制构成，针对不同特征图动态提取信息，并通过高层特征降低噪声干扰；S4.3阶段二，构建解码器，将基于S4.1的骨干网络各阶段提取的特征图，输入基于S4.3构建的动态注意力门控模组中，再构建U形结构和特征金字塔结构；S4.4阶段三和阶段四，阶段三是掩膜分割的混合损失函数，由交叉熵损失和Lovasz
‑
softmax损失组成，阶段四特征图的语义损失函数，采用交叉熵损失，最终的优化目标函数如下：Loss＝CE_Loss(mask)+Lovasz_Loss(mask)+0.3*CE_Loss(Feature...

【专利技术属性】
技术研发人员：刘志，王奕柯，李恭杨，陆小锋，刘学锋，
申请(专利权)人：上海大学温州研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人