基于改进CenterNet网络的SAR图像舰船检测方法技术

技术编号：37478078 阅读：11 留言：0更新日期：2023-05-07 09:19

本发明专利技术涉及合成孔径雷达图像目标检测领域，具体地说，是基于改进CenterNet网络的SAR图像舰船目标检测方法，采用数据增强，扩充数据集，充分训练参数，提高模型的泛化能力。在原有的CenterNet框架融入特征金字塔结构，利用改进的RepVGG网络提取特征，减少模型中参数的数量，减少训练时间，优化模型性能。特征信息通过ECA注意力机制，提高模型在目标特征的注意力，降低模型复杂度，最终提高检测精度并实现轻量化。特征融合时经过CAFAFE上采样，结合不同位置生成不同的采样核，充分捕捉特征图信息，不会造成遗漏，降低误检和漏检。降低误检和漏检。

全部详细技术资料下载

【技术实现步骤摘要】
基于改进CenterNet网络的SAR图像舰船检测方法

[0001]本专利技术涉及合成孔径雷达图像目标检测领域，具体地说，是基于改进CenterNet网络的SAR图像舰船目标检测方法。

技术介绍

[0002]合成孔径雷达(Synthetic Aperture Radar，SAR)是一种主动式的微波成像传感器。SAR能够穿透云层，不受天气的影响，持续地成像来实现全天时全天候的海洋遥感的监测。而我国拥有广袤的海域，利用SAR对海洋进行监测，开展研究基于SAR图像的舰船检测，对保卫国家海洋安全，维护国家利益具有重要的意义。
[0003]利用SAR图像进行舰船检测是存在困难的，影响SAR图像舰船检测的性能主要由SAR系统本身和海域环境的影响，由于相干斑噪声和散射成像的影响，其目标区域的像素散射强度不定，容易存在目标特征丢失的迹象。而且由于拍摄的角度与距离的影响，舰船的目标在较远海域时的尺寸会变小，就会检测不到目标存在。而对于近岸区域，会存在建筑物以及岛屿相似的散射特性，误认为是舰船目标，导致检测不精确。传统的舰船检测的方法，如恒虚警率(Constant FalseAlarm Rate，CFAR)。对于大目标的舰船有一定的检测能力，但是对于远海的舰船目标和复杂场景仍然不能表现出很好的性能，且耗时长，难以用于满足舰船检测的基本要求。但是，随着硬件的升级以及深度学习的发展，对于舰船检测的任务上展现出强大的能力。
[0004]基于深度学习的目标检测算法，按是否利用锚框产生候选框，被分为基于锚框的检测方法和无锚框的检测...

【技术保护点】

【技术特征摘要】
1.一种基于改进CenterNet网络的SAR图像舰船检测方法，其特征在于，包括如下步骤：步骤1、获取原始图像，对原始图像进行数据预处理，并进行数据增强，扩充数据集，将扩充后的数据集图片变成同一尺寸的分辨率，将他们划分为7:2:1的比例，依次作为实验的训练集、测试集和验证集；步骤2、采用注意力机制增强的RepVGG网络提取图像特征；步骤3、将提取出来图像的特征图进行多尺度特征融合；步骤4、将融合后的特征图进行预测，得到热力图、目标的宽、高和中心点的坐标；步骤5、从热力图取出检测框，得到检测结果。2.根据权利要求1所述的基于改进CenterNet网络的SAR图像舰船检测方法，其特征在于，所述步骤1中具体数据增强操作包括随机裁剪出来的图片大小是原来图片大小的0.8倍到1倍之间，裁剪长宽比为4∶3，随机锐化增强采用USM锐化增强算法，亮度与对比度操作为调整图片的亮度为1.2，对比度为100，伽马校正算法的伽马值设为0.7。3.根据权利要求2所述的基于改进CenterNet网络的SAR图像舰船检测方法，其特征在于，所述步骤2的具体流程如下：流程2.1、特征提取主干网络采用的RepVGG网络，通过重构的方式，将1*1的支链卷积和恒等映射合并到3*3的卷积堆栈中，减小模型参数量；流程2.2、将RELU激活函数转换为Mish函数，该函数更加的平滑，允许更好的信息深入神经网络，使得能够有更好的泛化性和准确性；流程2.3、利用全局平均池化层对上一个卷积模块提取特征图的每个通道进行尺寸修改，完成降维，将降维后的特征图通过一维卷积减少特征映射的深度，提取输出的特征图，让所有的通道和K个邻居之间信息交互来提高主干网络的模型性能；流程2.4、利用不降维的聚合特征为x∈R
C
'，C'为通道维数，那么通道注意力通过以下公式得到：ω＝σ(C1D
k
(x))式中C1D
k
表示卷积核大小为k的快速的一维卷积，σ表示为Sigmoid函数，ω表示通道的权重，k表示模块的参数个数；流程2.5、对于k值的确定采用自适应的方式，其大小由通道维数C'的正比关系由以下公式得到：式中，|*|
odd
表示最临近的奇数，C'为通道维数，γ和b在本次实验中分别设为2和1。4.根据权利要求3所述的基于改进CenterNet网络的SAR图像舰船检测方法，其特征在于，所述步骤2的流程2.1中，在训练时在每次卷积后都加入BN层，即归一化层，若使用表示在输入通道为C1，输出通道为C2时使用的卷积核为3
×
3大小，μ3，θ3，α3，β3分别表示为其后BN层中的均值、方差、学习比例因子和偏置量，当表示使用的为1
×
1的卷积核，μ1，θ1，α1，β1同样表示为其后BN层中的均值、方差、学习比例因子和偏置量，而对于只含有BN层的恒等映射层来说，则其参数因子表示为μ0，θ0，α0，β0，为表示输入，为输出，假设C1＝C2，H1＝H2,W1＝W2的情况下，*
表示卷积操作的过程，则训练时原始卷积块运算过程的数字形式由以下公式表示为：O2＝BN{(O1*W3),μ3,θ3,α3,β3}+BN{(O1*W1),μ1,θ1,α1,β1}+BN{O1,μ0,θ0,α0,β0}在重新参数化的过程中，为便于卷积核的计算，将1
×
1的卷积核通过边缘补零的方式转换成同样的3
×
3形状；要进行统一操作，可将恒等映射的过程看作线性的过程，即可看作用单位矩阵进行转换；利用同样的操作原理，用边缘零填充得到3
×
3卷积核尺寸，最终通过卷积和叠加运算，将分支路径统一为3
×
3的卷积操作。则经过重新参数化的方式后，运算的方式由以下公式表示为：O2＝O1*W
i
+b其中W
i
代表3
×
3卷积的卷积核大小，流程2.2具体内容如下：原CenterNet网络加入RELU(Rectified Linear Unit)激活函数是为了增加非线性因素，提高模型的表达能力。由该函数的公式α＝g(x)＝max(0,z)得出对于其他的激活函数能够更加有效率的梯度下降以及反向传播，避免梯度爆炸和梯度消失的问题。但是会在训练过程中容易出现神经元死亡，导致梯度为0。Mish函数是一种自正则的非单调神经激活函数，比原函数更加的平滑，由该函数的公式y＝x*tanh(ln(1+ex...

【专利技术属性】
技术研发人员：魏雪云，唐志勇，张贞凯，郑威，靳标，奚彩萍，尚尚，
申请(专利权)人：江苏科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人