一种遥感影像码头目标检测方法技术

技术编号:36021547 阅读:71 留言:0更新日期:2022-12-21 10:17
本发明专利技术涉及一种遥感影像码头目标检测方法,属于遥感影像处理技术领域。本发明专利技术以YOLOv4水平框检测算法为基础,在特征融合网络中增加PSA注意力模块,利用PSA注意力模块获得不同尺度的感受野,并通过提取通道的注意权重,以得到不同尺度通道注意力的权重,实现对不同尺度的上下文信息进行融合,进一步提升网络的检测精度;同时采用多维角点坐标检测框标定码头目标,能够有效表示码头目标的真实边界,解决码头方向任意的问题,进一步提升了目标的定位精度,实现了码头目标的准确检测。实现了码头目标的准确检测。实现了码头目标的准确检测。

【技术实现步骤摘要】
一种遥感影像码头目标检测方法


[0001]本专利技术涉及一种遥感影像码头目标检测方法,属于遥感影像处理


技术介绍

[0002]随着遥感技术的快速发展,利用遥感影像进行海洋近岸目标检测逐渐成为当前研究的热点。码头作为典型的海洋近岸目标,对其进行监测和提取为海战场环境建设和海洋经济开发提供重要依据。然而遥感影像中码头目标具有方向任意、尺寸多样等特点,并且受周围舰船、人工地物等环境影响,实现码头目标的精准定位具有挑战性。传统码头目标检测的方法包括边缘检测方法、面向对象的码头识别方法以及基于特征的港口检测方法,这些方法主要利用海岸带水边线的信息或者码头的长度、宽度等形状特征,通过虚警剔除和目标确认的过程实现码头的检测。然而这些方法受主观因素影响较大,在存在云层、舰船、海浪等干扰因素下难以准确提取码头目标。
[0003]近年来,深度学习特别是卷积神经网络(Convolutional Neural Networks,CNNs)在计算机视觉领域取得了巨大成功,基于深度学习的目标检测方法受到广泛关注,并取得了巨大的成就。其中R

FCN和FasterR

CNN等两阶段的检测方法,主要包括区域建议和区域分类两阶段。两阶段检测网络首先使用选择性搜索算法或者区域建议网络(Region Proposal Network,RPN)生成一系列候选框,然后进行目标分类和边界框回归;与两阶段检测网络不同,单阶段检测网络同时完成分类和定位两项任务,具有速度上的优势,例如SSD、YOLO等。此外,YOLOv3、YOLOv4利用性能更优异的骨干网络、多尺度融合等策略对YOLO网络进行改进,使模型在速度和精度上均得到了有效提升,为利用深度学习网络实现遥感影像目标检测奠定了基础。
[0004]这些先进的目标检测方法通常采用水平矩形框来描述所检测的目标,适用于自然场景影像的检测,但是无法满足遥感影像中码头目标检测的需求。在遥感影像中,码头目标通常具有较大的长宽比,并且具有一定的方向性,采用水平框检测时会包含过多的冗余信息,无法准确定位目标。另外,码头通常散乱分布在复杂场景中,水平检测框的冗余区域包含的噪声信息会干扰特征的提取,极大地影响码头目标检测的效果。

技术实现思路

[0005]本专利技术的目的是提供一种遥感影像码头目标检测方法,以解决目前采用水平检测对遥感影像码头进行检测存在定位精度差的问题。
[0006]本专利技术为解决上述技术问题而提供一种遥感影像码头目标检测方法,该方法包括以下步骤:
[0007]1)获取待检测的遥感影像;
[0008]2)将待检测的遥感影像输入到所述目标检测模型中,以输出码头目标检测结果;
[0009]所述目标检测模型包括主干网络、特征融合网络和预测层;
[0010]所述主干网络用于对输入的遥感影像进行特征提取,得到不同尺度大小的的特征
图;
[0011]所述特征融合网络包括SPP模块、PSA注意力模块和特征金字塔模块,所述SPP模块用于对主干网络输出的特征进行最大池化操作,将不同尺度的特征图进行融合;所述PSA注意力模块用于对SPP模块的输出结果进行切分并提取尺度特征和通道注意力加权,得到具有多尺度特征和注意力加权的特征图;所述的特征金字塔模块用于多得到的具有多尺度特征和注意力加权的特征图进行反复特征提取与融合,得到具有目标精确的位置信息和高层语义信息的特征;
[0012]所述预测层利用建立有多维角点坐标检测框和得到的具有目标精确的位置信息和高层语义信息的特征对待检测目标进行定位,所述的多维角点坐标包括检测框四个角点的坐标。
[0013]本专利技术以YOLOv4水平框检测算法为基础,在特征融合网络中增加PSA注意力模块,利用PSA注意力模块获得不同尺度的感受野,并通过提取通道的注意权重,以得到不同尺度通道注意力的权重,实现对不同尺度的上下文信息进行融合,进一步提升网络的检测精度;同时采用多维角点坐标检测框标定码头目标,能够有效表示码头目标的真实边界,解决码头方向任意的问题,进一步提升了目标的定位精度,实现了码头目标的准确检测。
[0014]进一步地,所述的PSA注意力模块包括有SPC模块、SE模块和输出模块;所述SPC模块用于将SPP模块输出的特征图在通道维度上切分成若干部分,并对每部分进行不同尺度的特征提取,得到各部分特征向量,生成对应通道的特征图;所述SE模块用于从各通道的特征图中提取对应通道注意力向量,并对各通道注意力向量重新进行特征标定,得到对应的多尺度通道交互后的注意力权重;输出模块用于根据得到的注意力权重对对应通道的特征图进行加权融合处理,得到具有多尺度特征和注意力加权的特征图。
[0015]本专利技术首先利用SPC模块获得不同尺度的感受野,以更好地提取影像的多尺度信息;其次,利用SE模块提取通道的注意权重,以得到不同尺度通道注意力的权重,使得PSA模块能够对不同尺度的上下文信息进行融合。
[0016]进一步地,所述SPC模块采用分组卷积对每部分进行不同尺度的特征提取,每组的卷积核与该分组的大小有关,卷积核大小k与分组之间的关系为:
[0017][0018]其中,G为分组的大小,k为卷积核的大小。
[0019]本专利技术为卷积核大小的不断增加会带来巨大的参数,因此对切分后各部分特征向量进行分组卷积时,定义卷积核大小k和每一部分的分组大小相关。
[0020]进一步地,所述的目标检测模型在训练时采用的多维角点坐标损失函数:
[0021]L=L
Pre
+L
Conf
+L
Cls
[0022][0023][0024][0025]S2表示输入的遥感影像被划分的网格个数,B表示每个网格中先验框的个数,,Pr
(object)表示当前先验框中是否包含目标,当包含目标时Pr(object)的值为1,当没有目标时Pr(object)值为0;x、y、x
gt
、y
gt
分别表示检测框和真实框坐标,c和c
gt
分别表示预测置信度和真实置信度,p和p
gt
分别表示预测类别的概率和真实概率。
[0026]为了能对具有方向信息的物体标定出更加贴合目标的检测框,本专利技术使用多维角点坐标来标定目标,因此,在对模型进行训练时,采用多维角点坐标损失函数来优化角点坐标检测框的检测结果。
[0027]进一步地,所述的主干网络采用CSPDarknet53网络。
[0028]本专利技术选用CSPDarkNet53作为骨干网络,将YOLOv3的骨干网络DarkNet53与跨阶段局部网络结合,从而更好地提取影像的特征信息。
[0029]进一步地,所述的预测层包括有3个,每个预测层中均包含有8个坐标信息、1个边框置信度和1个类别置信度。
[0030]进一步地,所述的边框置信度采用的计算公式为:
[0031][0032]其中C
ij
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种遥感影像码头目标检测方法,其特征在于,该方法包括以下步骤:1)获取待检测的遥感影像;2)将待检测的遥感影像输入到所述目标检测模型中,以输出码头目标检测结果;所述目标检测模型包括主干网络、特征融合网络和预测层;所述主干网络用于对输入的遥感影像进行特征提取,得到不同尺度大小的的特征图;所述特征融合网络包括SPP模块、PSA注意力模块和特征金字塔模块,所述SPP模块用于对主干网络输出的特征进行最大池化操作,将不同尺度的特征图进行融合;所述PSA注意力模块用于对SPP模块的输出结果进行切分并提取尺度特征和通道注意力加权,得到具有多尺度特征和注意力加权的特征图;所述的特征金字塔模块用于多得到的具有多尺度特征和注意力加权的特征图进行反复特征提取与融合,得到具有目标精确的位置信息和高层语义信息的特征;所述预测层利用建立有多维角点坐标检测框和得到的具有目标精确的位置信息和高层语义信息的特征对待检测目标进行定位,所述的多维角点坐标包括检测框四个角点的坐标。2.根据权利要求1所述的遥感影像码头目标检测方法,其特征在于,所述的PSA注意力模块包括有SPC模块、SE模块和输出模块;所述SPC模块用于将SPP模块输出的特征图在通道维度上切分成若干部分,并对每部分进行不同尺度的特征提取,得到各部分特征向量,生成对应通道的特征图;所述SE模块用于从各通道的特征图中提取对应通道注意力向量,并对各通道注意力向量重新进行特征标定,得到对应的多尺度通道交互后的注意力权重;输出模块用于根据得到的注意力权重对对应通道的特征图进行加权融合处理,得到具有多尺度特征和注意力加权的特征图。3.根据权利要求2所述的遥感影像码头目标检测方法,其特征在于,所述SPC模块采用分组卷积对每部...

【专利技术属性】
技术研发人员:郭海涛卢俊龚志辉阎晓东张衡林雨准刘相云高慧
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1