System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于改进Deformable DETR的水面目标检测方法及系统技术方案_技高网

一种基于改进Deformable DETR的水面目标检测方法及系统技术方案

技术编号:41329339 阅读:4 留言:0更新日期:2024-05-13 15:07
本发明专利技术公开了一种基于改进Deformable DETR的水面目标检测方法及系统,该方法包括:基于Deformable DETR模型,通过集成轻量级的MobileNetV3作为特征提取网络,引入CBAM注意力机制模块,构建基于改进Deformable DETR的水面目标检测模型;获取水面目标的训练图像数据集输入到水面目标检测模型中;经过集成轻量级的MobileNetV3进行特征提取,提取三层通道数不同的特征层,并进行额外特征变换,将四个特征层进行融合后送入含有可变形卷积的编码器和解码器,再通过分类网络得到最终的水面目标检测结果;重复训练并计算损失函数,直到得到训练好的模型;将待检测的水面目标图像输入训练好的模型,得到水面目标检测结果。本发明专利技术减少了模型参数量,降低了对计算资源的需求,提升了推理速度、训练速度和检测精度。

【技术实现步骤摘要】

本专利技术涉及计算机视觉,尤其涉及一种基于改进deformable detr的水面目标检测方法及系统。


技术介绍

1、随着世界各国日益重视水域资源的开发与利用,内海航运与远洋航运业务迅速发展。近几十年来,船舶的数量和相应的装载能力、运输速度都在不断增加。而另一方面,船舶碰撞事故的发生频率也在增加,因此水面目标的检测对于现代船舶预防碰撞具有重要意义。

2、目前比较成熟的两种水面目标感知手段是船舶自动识别系统(automaticidentification system,ais)和船用雷达。这两种感知方法在船舶上应用范围较广,但是ais信息存在主观错误和延迟,而雷达存在检测盲区,对近距离目标检测效果不理想,且其本身不具有判别目标属性的能力。相比之下,基于可见光图像的水面目标检测有助于船舶驾驶人员及时确定周围障碍物分布情况,也可以通过检测水上船舶防止非法捕捞,非法停靠等活动。

3、通过深度学习算法训练的目标检测模型可以部署在各种设备中,应用于智能视频监控、船舶导航、船舶停靠定位、海面运动目标检测与识别、跟踪技术的防撞感知、海防安全、海关管理、港口船舶调度等各个方面。因此水面目标检测具有广阔的应用前景和极大的实用价值。但是相较于陆上目标检测,水面目标检测更具挑战性。首先是水面目标检测的数据获取途径相对于其他目标检测来说更少,目前的监控、视频设备主要应用于地面环境,海上图像的数据集至今仍很匮乏。此外,水面目标场景中的可见光图像会受水波、光线、风等联合作用的影响,从而包含更多的噪声。

4、当前基于深度学习的算法在计算机视觉目标检测领域取得了很好的效果,基于深度学习的目标检测依据检测方式一般被分为两类:两阶段检测和单阶段检测。前者先生成预测框,预测框中可能包含待检测的目标,然后对预测框分析并微调,从而得到理想的检测结果,其代表性算法如区域卷积神经网络r-cnn、fast r-cnn、faster r-cnn、mask r-cnn等。后者直接在网络中对图像特征进行提取,并直接在特征图上对预设锚框中的潜在目标进行分类和位置回归,从而检测出所有目标。代表算法如ssd,yolo系列等。

5、相较于上述的yolo和r-cnn系列算法,detr是一种基于transformer结构的新的目标检测算法。detr真正的端到端设计的算法,不需要像传统目标检测算法一样设计先验的锚框和对检测结果进行非极大值抑制处理。相比之下,detr将目标检测视为集合预测问题,极大的优化了目标检测流程。且detr使用了自注意力机制,更注重精度和全局上下文的特征捕捉。detr作为一种新的目标检测框架表现出了具有竞争力的检测效果,但存在训练速度慢和小目标检测精度低的问题。为了解决detr的这些问题,zhu等人提出了deformabledetr,该模型提出的可变形注意力机制模块可以学习利用多尺度的特征信息,从而提升模型在小目标上的检测性能,并且该模块通过稀疏采样的方式与指定数量的采样特征进行交互,极大的减小了计算复杂度。因此deformable detr实现了更好的性能且训练度更快,是一种高效、快速收敛的端到端的目标检测算法。

6、虽然基于transformer的detr系列检测算法已经被越来越多的应用于各个目标检测场景,但仍未见到其被用于水面目标检测领域。deformable detr相比detr虽然训练速度更快,但是其特征提取网络特征网络参数较多,减慢了训练和推理速度。本专利提出一种改进deformable detr算法将其用于水面目标检测领域,实验证明该算法可以减少网络模型参数量,在进一步提升模型推理速度的同时提升算法的精确度。


技术实现思路

1、本专利技术要解决的技术问题在于针对现有技术中的缺陷,提供一种基于改进deformable detr的水面目标检测方法及系统。

2、本专利技术解决其技术问题所采用的技术方案是:

3、本专利技术提供一种基于改进deformable detr的水面目标检测方法,该方法包括以下步骤:

4、步骤1、基于deformable detr模型,通过集成轻量级的mobilenetv3作为特征提取网络,引入cbam注意力机制模块,构建基于改进deformable detr的水面目标检测模型;

5、步骤2、获取水面目标的训练图像数据集,对其进行图像标注处理后,随机选取一定batch-size的图像及其标签数据输入到水面目标检测模型中;

6、步骤3、输入的图像经过集成轻量级的mobilenetv3进行特征提取,mobilenetv3中含有多个cbam注意力机制模块增强特征提取效果;从mobilenetv3中直接提取三层通道数不同的特征层,并对其中一层特征层进行额外特征变换作为第四特征层,将四个特征层进行融合;

7、步骤4、将融合的特征送入含有可变形卷积的transformer编码器,并通过transformer解码器对transformer编码器输出进行处理,最终通过分类网络得到最终的水面目标检测结果,与图像标注结果对比计算网络损失函数值,利用梯度反向传播改进网络模型性能;

8、步骤5、重复执行步骤2-步骤4,并计算损失函数,直到得到训练好的损失函数值不再变化或变化幅度小于一定阈值的水面目标检测模型;

9、步骤6、将待检测的水面目标图像输入训练好的水面目标检测模型,并结合绘图脚本输出目标检测边界框、分类标签及对应置信度,得到水面目标检测结果。

10、进一步地,本专利技术的所述步骤1中基于deformable detr模型包括:一个特征提取网络,一个基于transformer的编码器-解码器,做出最终预测输出的两个前馈神经网络。

11、进一步地,本专利技术的所述步骤1中集成轻量级的mobilenetv3作为特征提取网络的方法包括:

12、将mobilenetv3作为特征提取网络;通过深度可分离卷积替换传统的卷积层;通过线性瓶颈层和逆残差结构进一步降低了模型参数大小;并引入了se注意力模块和激活函数hard-swish。

13、进一步地,本专利技术的所述步骤1中引入cbam注意力机制模块的方法包括:

14、将mobilenetv3中的se注意力模块替换为cbam注意力模块;cbam注意力模块结合了空间注意力机制,cbam注意力模块包括通道注意力模块和空间注意力模块;cbam注意力模块的表达式为:

15、

16、

17、其中,f为输入cbam注意力模块的特征图,mc和ms分别为通道注意力模块和空间注意力模块,f”为cbam注意力模块最后的输出,表示逐元素相乘。

18、进一步地,本专利技术的所述cbam注意力模块还包括:

19、在通道注意力模块中,特征图输入f分别进行平均池化和最大池化操作,得到两组池化特征向量;得到的池化特征向量分别通过参数共享的神经网络,将输出进行逐元素相加,最后通过激活函数sigmoid处本文档来自技高网...

【技术保护点】

1.一种基于改进Deformable DETR的水面目标检测方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于改进Deformable DETR的水面目标检测方法,其特征在于,所述步骤1中基于Deformable DETR模型包括:一个特征提取网络,一个基于Transformer的编码器-解码器,做出最终预测输出的两个前馈神经网络。

3.根据权利要求2所述的基于改进Deformable DETR的水面目标检测方法,其特征在于,所述步骤1中集成轻量级的MobileNetV3作为特征提取网络的方法包括:

4.根据权利要求3所述的基于改进Deformable DETR的水面目标检测方法,其特征在于,所述步骤1中引入CBAM注意力机制模块的方法包括:

5.根据权利要求4所述的基于改进Deformable DETR的水面目标检测方法,其特征在于,所述CBAM注意力模块还包括:

6.根据权利要求3所述的基于改进Deformable DETR的水面目标检测方法,其特征在于,所述步骤1中的构建的基于改进Deformable DETR的特征提取网络结构具体为:

7.根据权利要求6所述的基于改进Deformable DETR的水面目标检测方法,其特征在于,所述步骤3中从MobileNetV3中直接提取三层通道数不同的特征层的方法包括:

8.根据权利要求1所述的基于改进Deformable DETR的水面目标检测方法,其特征在于,所述步骤4中将融合的特征送入含有可变形卷积的Transformer编码器的方法包括:

9.一种基于改进Deformable DETR的水面目标检测系统,其特征在于,该系统包括:

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~8任一项所述的基于改进Deformable DETR的水面目标检测方法的步骤。

...

【技术特征摘要】

1.一种基于改进deformable detr的水面目标检测方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于改进deformable detr的水面目标检测方法,其特征在于,所述步骤1中基于deformable detr模型包括:一个特征提取网络,一个基于transformer的编码器-解码器,做出最终预测输出的两个前馈神经网络。

3.根据权利要求2所述的基于改进deformable detr的水面目标检测方法,其特征在于,所述步骤1中集成轻量级的mobilenetv3作为特征提取网络的方法包括:

4.根据权利要求3所述的基于改进deformable detr的水面目标检测方法,其特征在于,所述步骤1中引入cbam注意力机制模块的方法包括:

5.根据权利要求4所述的基于改进deformable detr的水面目标检测方法,其特征在于,所述cbam注意力模块还包括:

6....

【专利技术属性】
技术研发人员:罗威王鹏九谢晓乐陆雷黄骁
申请(专利权)人:中国舰船研究设计中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1