基于改进CenterNet网络的SAR图像舰船检测方法技术

技术编号:37478078 阅读:11 留言:0更新日期:2023-05-07 09:19
本发明专利技术涉及合成孔径雷达图像目标检测领域,具体地说,是基于改进CenterNet网络的SAR图像舰船目标检测方法,采用数据增强,扩充数据集,充分训练参数,提高模型的泛化能力。在原有的CenterNet框架融入特征金字塔结构,利用改进的RepVGG网络提取特征,减少模型中参数的数量,减少训练时间,优化模型性能。特征信息通过ECA注意力机制,提高模型在目标特征的注意力,降低模型复杂度,最终提高检测精度并实现轻量化。特征融合时经过CAFAFE上采样,结合不同位置生成不同的采样核,充分捕捉特征图信息,不会造成遗漏,降低误检和漏检。降低误检和漏检。

【技术实现步骤摘要】
基于改进CenterNet网络的SAR图像舰船检测方法


[0001]本专利技术涉及合成孔径雷达图像目标检测领域,具体地说,是基于改进CenterNet网络的SAR图像舰船目标检测方法。

技术介绍

[0002]合成孔径雷达(Synthetic Aperture Radar,SAR)是一种主动式的微波成像传感器。SAR能够穿透云层,不受天气的影响,持续地成像来实现全天时全天候的海洋遥感的监测。而我国拥有广袤的海域,利用SAR对海洋进行监测,开展研究基于SAR图像的舰船检测,对保卫国家海洋安全,维护国家利益具有重要的意义。
[0003]利用SAR图像进行舰船检测是存在困难的,影响SAR图像舰船检测的性能主要由SAR系统本身和海域环境的影响,由于相干斑噪声和散射成像的影响,其目标区域的像素散射强度不定,容易存在目标特征丢失的迹象。而且由于拍摄的角度与距离的影响,舰船的目标在较远海域时的尺寸会变小,就会检测不到目标存在。而对于近岸区域,会存在建筑物以及岛屿相似的散射特性,误认为是舰船目标,导致检测不精确。传统的舰船检测的方法,如恒虚警率(Constant FalseAlarm Rate,CFAR)。对于大目标的舰船有一定的检测能力,但是对于远海的舰船目标和复杂场景仍然不能表现出很好的性能,且耗时长,难以用于满足舰船检测的基本要求。但是,随着硬件的升级以及深度学习的发展,对于舰船检测的任务上展现出强大的能力。
[0004]基于深度学习的目标检测算法,按是否利用锚框产生候选框,被分为基于锚框的检测方法和无锚框的检测算法,如SSD、Faster R

CNN、Mask R

CNN和YOLO系列都是基于锚框的算法。确实,相比于传统算法是有很大的进步,但是他们都需要很大的锚框,需要用大量的锚框对真实框尽可能的重叠,可是只有一小部分能够重合,从而导致正负样本不平衡,减慢训练速度,还有就是需要很多超参数的引入,致使难以调通和通用。而无锚框检测的算法,大都采用关键点进行定位目标,减少大量的锚框的匹配计算,加快检测速度。CenterNet就是无锚框的检测算法,利用目标物体的中心点的特征信息完成对目标的定位于分类,其检测的速度和精度都取得不错的结果,但是对于小目标还是会将特征信息丢失,导致检测精度略低。
[0005]申请号为201910718858.4,名称为“基于边界约束CenterNet的遥感目标检测方法”的专利技术专利中披露了一种遥感目标检测方法,该方法利用级联多层的卷积层和采样层堆叠来提取特征信息,用边界约束卷积网络输出进行边界约束完成精度的提升。但是这类方法还是有许多问题,第一:对于SAR舰船图像数据集中的选取的场景单一,样本数太少,不能完全体现该网络检测的泛用性。第二:不断地堆叠网络深度确实是对舰船的分类更加准确,但是会将关键的特征信息丢失,定位造成偏差,训练速度也会变慢。第三:生成的边界约束预测标签,对于虚假目标的预测框约束少,不能完全剔除虚假的预测框,造成总体损失的偏差,对于检测的召回率和速度指标影响太大。
Linear Unit)激活函数是为了增加非线性因素,提高模型的表达能力。由该函数的公式α=g(x)=max(0,z)得出对于其他的激活函数能够更加有效率的梯度下降以及反向传播,避免梯度爆炸和梯度消失的问题。但是会在训练过程中容易出现神经元死亡,导致梯度为0。Mish函数是一种自正则的非单调神经激活函数,比原函数更加的平滑,由该函数的公式y=x*tanh(ln(1+exp(x)))看出当正值达到任何高度时,避免由于封顶导致的饱和,而对于负值可以轻微的允许,不像原函数那样的硬零边界,让更好的信息深入神经网络中,更快的学习信息特征;
[0024]流程2.3、利用全局平均池化层对上一个卷积模块提取特征图的每个通道进行尺寸修改,完成降维,将降维后的特征图通过一维卷积减少特征映射的深度,提取输出的特征图,让所有的通道和K个邻居之间信息交互来提高主干网络的模型性能;
[0025]流程2.4、利用不降维的聚合特征为x∈R
C
',C'为通道维数,那么通道注意力可以通过公式(3)得到:
[0026]ω=σ(C1D
k
(x))
ꢀꢀ
(3)
[0027]式中C1D
k
表示卷积核大小为k的快速的一维卷积,σ表示为Sigmoid函数;ω表示通道的权重,k表示模块的参数个数;
[0028]流程2.5、对于k值的确定采用自适应的方式,其大小由通道维数C'的正比关系由公式(4)得到:
[0029][0030]式中,|*|
odd
表示最临近的奇数,C'为通道维数,γ和b在本次实验中分别设为2和1。
[0031]本专利技术进一步改进,步骤3的具体流程如下:
[0032]轻量级通用上采样算子(CARAFE)上采样主要分为两个部分核预测和特征重组;
[0033]流程3.1、将经过通道注意力增强的特征图的尺寸进行通道压缩,由C
×
W
×
H处理成C
m
×
W
×
H的结果,来降低后续的计算量,C
m
为通道压缩后的通道数;
[0034]流程3.2、将内容编码卷积核尺寸为k
en
×
k
en
的卷积核对上述压缩特征图进行内容编码得到尺寸为的特征图(为预测的上采样核尺寸)。在通道维数上展开,此时尺寸变为
[0035]流程3.3、利用softmax函数进行归一化处理,使得上采样核的权重之和为1,并将输入的特征图与预测的上采样核进行卷积得到最终的上采样结果,则CARAFE上采样过程的参数量由公式(5)表示为:
[0036][0037]本专利技术进一步改进,步骤4的具体流程还包括:
[0038]流程4.1、将经过特征金字塔网络融合后的特征图,进行预测而产生关键点的热力图当对应检测目标的中心点,为目标的背景,通过计算得到低分辨率上对应的关键点用高斯函数下采样后的关键点映射,得到特征图中心
点的点权重,若对于同个关键点或同个类别c,当两个高斯函数发生重叠,则选择元素级最大的,训练目标函数,像素级逻辑回归的焦点损失L
k
由公式(6)表示为:
[0039][0040]式中,N表示图像关键点的个数,α和β表示焦点损失函数的超参数,x表示x轴坐标,y表示y轴坐标,z轴表示z轴坐标;Y
xyz
表示高斯函数结果值,为热力图的预测值;
[0041]流程4.2、设特征提取网络输出的偏置值为流程4.2、设特征提取网络输出的偏置值为R表示张量空间,H表示图像的高,W表示图像的宽,C表示图像的通道值,采用L1训练网络输出的偏置值由公式(7)表示为:
[0042][0043]其中,L
offset
表示目标偏移量的损失;N表示图像关键点个数,表示网络输出的偏置值,p表示目标框本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进CenterNet网络的SAR图像舰船检测方法,其特征在于,包括如下步骤:步骤1、获取原始图像,对原始图像进行数据预处理,并进行数据增强,扩充数据集,将扩充后的数据集图片变成同一尺寸的分辨率,将他们划分为7:2:1的比例,依次作为实验的训练集、测试集和验证集;步骤2、采用注意力机制增强的RepVGG网络提取图像特征;步骤3、将提取出来图像的特征图进行多尺度特征融合;步骤4、将融合后的特征图进行预测,得到热力图、目标的宽、高和中心点的坐标;步骤5、从热力图取出检测框,得到检测结果。2.根据权利要求1所述的基于改进CenterNet网络的SAR图像舰船检测方法,其特征在于,所述步骤1中具体数据增强操作包括随机裁剪出来的图片大小是原来图片大小的0.8倍到1倍之间,裁剪长宽比为4∶3,随机锐化增强采用USM锐化增强算法,亮度与对比度操作为调整图片的亮度为1.2,对比度为100,伽马校正算法的伽马值设为0.7。3.根据权利要求2所述的基于改进CenterNet网络的SAR图像舰船检测方法,其特征在于,所述步骤2的具体流程如下:流程2.1、特征提取主干网络采用的RepVGG网络,通过重构的方式,将1*1的支链卷积和恒等映射合并到3*3的卷积堆栈中,减小模型参数量;流程2.2、将RELU激活函数转换为Mish函数,该函数更加的平滑,允许更好的信息深入神经网络,使得能够有更好的泛化性和准确性;流程2.3、利用全局平均池化层对上一个卷积模块提取特征图的每个通道进行尺寸修改,完成降维,将降维后的特征图通过一维卷积减少特征映射的深度,提取输出的特征图,让所有的通道和K个邻居之间信息交互来提高主干网络的模型性能;流程2.4、利用不降维的聚合特征为x∈R
C
',C'为通道维数,那么通道注意力通过以下公式得到:ω=σ(C1D
k
(x))式中C1D
k
表示卷积核大小为k的快速的一维卷积,σ表示为Sigmoid函数,ω表示通道的权重,k表示模块的参数个数;流程2.5、对于k值的确定采用自适应的方式,其大小由通道维数C'的正比关系由以下公式得到:式中,|*|
odd
表示最临近的奇数,C'为通道维数,γ和b在本次实验中分别设为2和1。4.根据权利要求3所述的基于改进CenterNet网络的SAR图像舰船检测方法,其特征在于,所述步骤2的流程2.1中,在训练时在每次卷积后都加入BN层,即归一化层,若使用表示在输入通道为C1,输出通道为C2时使用的卷积核为3
×
3大小,μ3,θ3,α3,β3分别表示为其后BN层中的均值、方差、学习比例因子和偏置量,当表示使用的为1
×
1的卷积核,μ1,θ1,α1,β1同样表示为其后BN层中的均值、方差、学习比例因子和偏置量,而对于只含有BN层的恒等映射层来说,则其参数因子表示为μ0,θ0,α0,β0,为表示输入,为输出,假设C1=C2,H1=H2,W1=W2的情况下,*
表示卷积操作的过程,则训练时原始卷积块运算过程的数字形式由以下公式表示为:O2=BN{(O1*W3),μ3,θ3,α3,β3}+BN{(O1*W1),μ1,θ1,α1,β1}+BN{O1,μ0,θ0,α0,β0}在重新参数化的过程中,为便于卷积核的计算,将1
×
1的卷积核通过边缘补零的方式转换成同样的3
×
3形状;要进行统一操作,可将恒等映射的过程看作线性的过程,即可看作用单位矩阵进行转换;利用同样的操作原理,用边缘零填充得到3
×
3卷积核尺寸,最终通过卷积和叠加运算,将分支路径统一为3
×
3的卷积操作。则经过重新参数化的方式后,运算的方式由以下公式表示为:O2=O1*W
i
+b其中W
i
代表3
×
3卷积的卷积核大小,流程2.2具体内容如下:原CenterNet网络加入RELU(Rectified Linear Unit)激活函数是为了增加非线性因素,提高模型的表达能力。由该函数的公式α=g(x)=max(0,z)得出对于其他的激活函数能够更加有效率的梯度下降以及反向传播,避免梯度爆炸和梯度消失的问题。但是会在训练过程中容易出现神经元死亡,导致梯度为0。Mish函数是一种自正则的非单调神经激活函数,比原函数更加的平滑,由该函数的公式y=x*tanh(ln(1+ex...

【专利技术属性】
技术研发人员:魏雪云唐志勇张贞凯郑威靳标奚彩萍尚尚
申请(专利权)人:江苏科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1