System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于基于计算机视觉的水下目标检测,尤其涉及一种基于rt-detr改进的水下目标检测系统及方法。
技术介绍
1、近年来,水下目标识别一直是水下深度学习的重要研究方向。水下目标检测能够探测和检测水下资源,对水下资源的开发、利用和保护有重要作用。然而,由于水下环境的复杂性,会有衰减散射、噪声等影响,并且数据集稀缺、目标尺寸大小不一,导致目标识别的准确率一直没有得到有效的提升。水下目标识别一直因其识别的复杂性和水下环境多样性是难度较高的识别任务。传统的水下目标检测方法大多基于特征提取和分类,由于水下环境的特殊性,这种方式限制了目标识别的准确性和普适性,尤其是在较为复杂的水下环境。
2、为解决这一问题,目前众多研究聚焦于深度学习技术在复杂水下环境mub 识别的应用。针对目前的主流水下目标识别网络,主要以yolo系列为主,yolo主要采用锚框(anchor boxes)机制,通过非极大值抑制(nms)后处理技术来去除重叠的预测框。但是nms过程依赖于两个关键超参数:得分阈值和iou(交并比)阈值,这两个参数的设置对检测的准确性和速度都有影响。detr是一种基于transformer架构的目标检测方法,它避免了nms的使用,通过自注意力和交叉注意力机制来处理图像特征和位置信息,rt-detr是在detr基础上的优化,它能够在保持高精度的同时,实现了实时处理,解决了传统detr运行速度慢的问题。但是rt-detr尚未在水下目标识别领域得到有效的应用,并且针对水下目标大小目标掺杂,且模糊不清和数据集小的问题,rt-detr无
技术实现思路
1、针对上述问题,本专利技术在rt-detr基础上进行了优化,提高了水下运行效率,实现了参数轻量化的同时增加了准确度,并且针对水下环境特殊性进行了适配,并针对小目标检测进行了增强。
2、本专利技术第一方面提出了一种基于rt-detr改进的水下目标检测系统,包括主干网络模块、混合编码器模块、innermpdiou感知模块和解码器模块;
3、所述主干网络模块基于大型可分离核注意力,构建多层基准模块,采用预处理后的水下目标图像作为输入,提取特征后进行大型可分离核注意力计算,输出多层特征图;
4、所述混合编码器模块包括可变形大核注意力的尺度内特征交互单元和基于卷积神经网络的跨尺度特征融合单元;所述尺度内特征交互单元针对主干网络模块输出的最上层尺度的特征,使用可变形大核注意力机制进行编码处理;所述跨尺度特征融合单元进行跳跃连接,在原来三层特征融合网络基础上,引入主干网络中自上而下的第四层的基准模块输出进行细节特征融合,,同时引入小波变换,在不显著增加参数的情况下扩大感受野;上采样单元替换为dysample动态上采样单元,下采样单元替换为轻量下采样单元,使用融合机制来合并不同尺度的特征,输出融合处理后的特征表示;
5、所述innermpdiou感知模块将原iou感知模块的iou计算引入尺度因子和辅助边界框,利用innermpdiou感知的查询选择改进目标查询初始化;
6、所述解码器模块用于将混合编码器模块的输出转换为最终的检测结果,包括边界框坐标和类别预测。
7、优选的,所述主干网络模块采用resnet50网络,在四层瓶颈层结构增加大型可分离核注意力模块,构建四层基准模块,用于提取四个阶段的特征,生成不同级别的特征,每个基准模块第一分支包括一个1*1的卷积层、批标准化层、激活函数层、一个3*3的卷积层、批标准化层、激活函数层再接一个1*1的卷积层、批标准化层以及一个大型可分离核注意力模块,以在多层特征中增加大型可分离核注意力,获取能多的多语义信息,其第二分支包括平均池化层、1*1卷积层、批标准化层;将第一分支和第二分支进行逐元素相加后经过激活函数层输出,四个模块通道大小分别为64、128、256和512,表示为:
8、
9、其中,表示第层的经过大型可分离核注意力计算的特征,表示大型可分离核注意力的集合。
10、优选的,所述大型可分离核注意力模块具体为:
11、维度为n×c×w×h的特征图l,经过一个1×3的深度卷积(输入输出通道数为c,卷积核大小为1×3,步长为1×1,填充为0×1),再经过一个3×1的深度卷积(输入输出通道数为c,卷积核大小为3×1,步长为1×1,填充为1×0),再经过一个1×3的深度扩张卷积(输入输出通道数为c,卷积核大小为1×3,步长为1×1,填充为0×2,膨胀为2×2),再经过一个3×1的深度扩张卷积(输入输出通道数为c,卷积核大小为3×1,步长为1×1,填充为2×0,膨胀为2×2),再经过一个1×1的卷积操作(输入输出通道数为c,卷积核大小为1×1),得到的结果与输入的特征图l逐元素相乘得到输出特征图l’,维度为n×c×w×h。
12、优选的,所述可变形大核注意力机制采用多个卷积层,包括标准的2d卷积和带有偏移量的变形卷积;所述带有偏移量的变形卷积允许网络根据输入特征自适应地调整感受野,其内部包含偏移场的计算,用于指导变形卷积层调整采样位置;
13、可变形大核注意力机制的输入经过2d卷积后经gelu激活函数,后经带有偏移量的变形卷积再经2d卷积,与未经变形卷积的值相加后再经2d卷积在与输入相融合后输出。
14、优选的,所述dysample动态上采样单元具体为:
15、输入各特征图或融合后的特征图,维度为c×h×w,以及上采样尺度因子s,使用一个线性层,其输入和输出通道数分别为c和,生成大小为×h×w 的偏移量后乘系数m得到偏移量o,偏移量表示采样点相对于原始网格点的位移;然后,通过像素洗牌将其重塑为2×sh×sw维度,将偏移量转换为合适的空间分辨率,最终的采样点坐标由原始网格点坐标和偏移量加权相加得到;通过grid_sample函数进行采样操作,根据生成的采样点对特征图进行重新采样,得到上采样后的维度为c×sh×sw 的特征图,采样集s是偏移量o和原始采样网格g的和:
16、
17、
18、其中,o为偏移量,x为输入特征网络,g为原始采样网络,s为采样集,m为加权系数。
19、优选的,所述轻量下采样单元具体为:
20、输入各融合后特征图,经过平均池化后将数据分割为两部分,分为两个分支,第一个分支经过3×3的卷积,第二分支经过最大池化后经1×1卷积,将第一和第二分支结果连接起来输出给下一个单元即降采样后的特征图。
21、优选的,所述引入小波变化是将重参化卷积repc3结构中的卷积模块替换为小波变换模块,包括n个膨胀卷积后连接小波变换卷积,小波变换卷积内包括小波变换过滤器:
22、
23、
24、
25、
26、经过过滤器后将图像分为四部分,(low-low)表示低频部分的过滤器,经此过滤器得到的部分包含本文档来自技高网...
【技术保护点】
1.一种基于RT-DETR改进的水下目标检测系统,其特征在于:包括主干网络模块、混合编码器模块、InnerMPDIoU感知模块和解码器模块;
2.如权利要求1所述的一种基于RT-DETR改进的水下目标检测系统,其特征在于:所述主干网络模块采用Resnet50网络,在四层瓶颈层结构增加大型可分离核注意力,构建四层基准模块,用于提取四个阶段的特征,生成不同级别的特征,每个基准模块第一分支包括一个1*1的卷积层、批标准化层、激活函数层、一个3*3的卷积层、批标准化层、激活函数层再接一个1*1的卷积层、批标准化层以及一个大型可分离核注意力模块,以在多层特征中增加大型可分离核注意力,获取能多的多语义信息,其第二分支包括平均池化层、1*1卷积层、批标准化层;将第一分支和第二分支进行逐元素相加后经过激活函数层输出,四个模块通道大小分别为64、128、256和512,表示为:
3.如权利要求1所述的一种基于RT-DETR改进的水下目标检测系统,其特征在于,所述大型可分离核注意力模块具体为:
4.如权利要求1所述的一种基于RT-DETR改进的水下目标检测系统,其
5.如权利要求1所述的一种基于RT-DETR改进的水下目标检测系统,其特征在于,所述DySample动态上采样单元具体为:
6.如权利要求1所述的一种基于RT-DETR改进的水下目标检测系统,其特征在于,所述轻量下采样单元具体为:
7.如权利要求1所述的一种基于RT-DETR改进的水下目标检测系统,其特征在于:所述引入小波变化是将重参化卷积RepC3结构中的卷积模块替换为小波变换模块,包括N个膨胀卷积后连接小波变换卷积,小波变换卷积内包括小波变换过滤器:
8.如权利要求1所述的一种基于RT-DETR改进的水下目标检测系统,其特征在于,所述InnerMPDIoU感知模块损失函数的计算方式为:
9.一种基于RT-DETR改进的水下目标检测方法,其特征在于:应用如权利要求1至8任意一项所述的水下目标检测系统,并包括以下过程:
...【技术特征摘要】
1.一种基于rt-detr改进的水下目标检测系统,其特征在于:包括主干网络模块、混合编码器模块、innermpdiou感知模块和解码器模块;
2.如权利要求1所述的一种基于rt-detr改进的水下目标检测系统,其特征在于:所述主干网络模块采用resnet50网络,在四层瓶颈层结构增加大型可分离核注意力,构建四层基准模块,用于提取四个阶段的特征,生成不同级别的特征,每个基准模块第一分支包括一个1*1的卷积层、批标准化层、激活函数层、一个3*3的卷积层、批标准化层、激活函数层再接一个1*1的卷积层、批标准化层以及一个大型可分离核注意力模块,以在多层特征中增加大型可分离核注意力,获取能多的多语义信息,其第二分支包括平均池化层、1*1卷积层、批标准化层;将第一分支和第二分支进行逐元素相加后经过激活函数层输出,四个模块通道大小分别为64、128、256和512,表示为:
3.如权利要求1所述的一种基于rt-detr改进的水下目标检测系统,其特征在于,所述大型可分离核注意力模块具体为:
4.如权利要求1所述的一种基于rt-detr改进的水下目标检测系统,其特征...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。