一种基于改进YOLOv5的SAR图像飞机目标检测方法技术

技术编号:38613086 阅读:15 留言:0更新日期:2023-08-26 23:40
本发明专利技术公开了一种基于改进YOLOv5的SAR图像飞机目标检测方法,涉及图像目标检测领域。收集获取包含飞机目标的SAR图像数据集,进行图像数据标注,划分为训练集和测试集;改进YOLOv5模型,搭建新的检测模型,包括输入层、主干网络、Neck网络、Head网络;设置好训练参数对检测模型进行训练,进行性能测试,采取精确度、召回率等评价指标来评估模型目标检测效果。本发明专利技术可以改进传统SAR飞机目标检测算法复杂背景下易漏检、虚检飞机的瓶颈,生成的飞机目标检测算法结合使用了引进注意力机制加强关注目标位置信息方法、特征融合方法以及全局信息关注方法,通过改进YOLOv5检测模型的主干网络、颈部结构、输出检测头来进行飞机目标的特征融合,提升飞机目标检测精度。提升飞机目标检测精度。提升飞机目标检测精度。

【技术实现步骤摘要】
一种基于改进YOLOv5的SAR图像飞机目标检测方法


[0001]本专利技术涉及图像目标检测领域,尤其涉及一种基于改进YOLOv5的SAR图像飞机目标检测方法。

技术介绍

[0002]合成孔径雷达(SyntheticAperture Radar,SAR)是一种主动式微波成像传感器,具有全天时、全天候的成像观测能力。SAR自20世纪50年代诞生之后,由于其独特的成像机制,其在军事和民用领域都得到了广泛的应用。在民用领域,SAR在矿藏资源探测、灾情探测与防治、地形探测与绘制及农业、林业等方面发挥着巨大的作用;在军事领域,SAR图像在战场态势感知、典型目标识别和精准指导、隐形目标散射特性的静动态测量等方面具有突出的意义。由于SAR的独特性能,SAR图像目标解译技术受到了各国的重视,飞机作为其中一类重要的目标,在民用领域,飞机检测有助于机场的有效管理;在军事领域,获取飞机的数量、分布等信息具有重要价值。因此,利用SAR图像进行飞机目标的精确检测识别是个研究的热点方向并且具有重要意义。
[0003]近年来,随着深度神经网络的发展,目标检测模型分为one

stage检测模型和two

stage检测模型。双阶段检测模型先在图像中生产大量的候选区域,再通过卷积神经网络对这些区域进行特征提取,最后识别目标类别和位置。常用的双阶段目标检测模型有R

CNN、Fast R

CNN、Faster R

CNN等。基于候选区域的双阶段目标检测算法虽然精度很高,但是检测效率不高,而单阶段目标检测方法不需要生成候选区域,直接从输入图像中提取特征,继而预测物体的类别与位置信息。常用的单阶段目标检测模型有SSD和YOLO。
[0004]单阶段检测模型在速度上远远优于双阶段检测模型。在单阶段检测模型检测速度较快的情况下,检测时精度都没有达到预想的要求,在复杂背景中容易虚检、漏检目标。因此,通过改进检测模型进一步提升SAR图像飞机目标检测精度具有重要意义。
[0005]因此,本领域的技术人员致力于开发一种基于改进YOLOv5的SAR图像飞机目标检测方法,能够尽量避免漏检、误检,使得复杂背景下的飞机目标能够被精准检测。

技术实现思路

[0006]有鉴于现有技术的上述缺陷,本专利技术所要解决的技术问题是避免漏检、误检,精准检测复杂背景下的飞机目标。
[0007]为实现上述目的,本专利技术提供了一种基于改进YOLOv5的SAR图像飞机目标检测方法,对目标检测算法YOLOv5进行改进,获得改进后的目标检测算法YOLOv5,包括以下步骤:
[0008]步骤1、在输入层中采用Mosaic数据增强方式,对输入图像进行预处理,采用K均值聚类算法针对飞机目标尺寸优化锚框;
[0009]步骤2、所述步骤1的特征图输入改进的主干网络,改进的主干网络是指在主干网络中引入坐标注意力机制CA,采用SPD

CA卷积块替换主干网络对图像进行下采样所采用的跨步卷积;
[0010]步骤3、所述步骤2得到的不同尺度的图像特征图输入到改进的YOLOv5网络中的Neck部分,采用设计的FFP特征融合金字塔网络结构改进目标检测算法YOLOv5的Neck结构,实现自适应特征融合;
[0011]步骤4、所述步骤3得到不同尺度的张量数据,输入到改进的YOLOv5网络中的预测层部分,在预测层之前添加全局注意力机制GAM,捕捉全局信息,减少不准确的目标定位。
[0012]进一步地,所述步骤1,所述Mosaic数据增强方式采用图片随机缩放、随机裁剪、随机排布的方式进行拼接,对输入图像进行预处理,提升小目标的检测效果。
[0013]进一步地,所述步骤1,采用K

means聚类算法针对数据集中飞机目标尺寸优化锚框,通过对数据进行聚类分析提升先验框和目标框的匹配度,进行自适应锚框计算,对每个检测头都更换所有初始锚框大小。
[0014]进一步地,所述步骤2,在YOLOv5模型的主干网络部分将下采样所用的3*3卷积核且步数为2的卷积块替换为设计的SPD

CA卷积块,完全替代卷积步长和池化层;SPD层是一个由空间到深度的连接层,具体操作是在图像中每隔一个像素提取出一个值,类似于邻近下采样,将特征图分为四张子特征图,具体表示如下:
[0015]f
0,0
=X[0:S:2,0:S:2],f
1,0
=X[1:S:2,0:S:2],
[0016]f
0,1
=X[0:S:2,1:S:2],f
1,1
=X[1:S:2,1:S:2][0017]S为图像尺寸size,之后沿着通道维度将这些子特征映射连接在一起,在对特征映射进行下采样的同时,保留了通道维度的所有信息,避免了信息的非歧视丢失;在SPD层后引入坐标注意力机制层CA,加强对目标点的注意,感受飞机目标的位置信息,最后添加一层单步长卷积层去改变使用学习参数的通道数量。
[0018]进一步地,所述步骤3,从主干网络的后端将所述步骤2得到的图像特征图输入到改进的YOLOv5网络中的Neck部分,Neck结构由原来的PANet简单双向特征金字塔结构变为设计的FFP特征融合金字塔结构;Neck在特征金字塔网络的基础上引入自下而上的路径增强结构,细化主干网络输出的图像特征矩阵实现双向特征金字塔,并吸收BiFPN与ASFF两种结构的思想,在主干网络与自下而上特征融合路径之间增加跳跃连接分支,即处在同一层次的输入节点与输出节点之间添加一条额外的边,使其能在同层次之间融合更多的特征;同时,在双向特征传输的路径当中加入ASFF特征融合结构,实现不同层次之间特征的交叉融合。
[0019]进一步地,所述步骤4,不同尺度的特征图数据输入到改进的YOLOv5网络中的预测层部分,在Neck部分后端即预测层之前集成一种全局注意力机制,使得模型结合不同尺度下的目标特征,保留特征融合之后的目标特征信息。
[0020]进一步地,还包括以下步骤:基于获取到的SAR图像飞机目标数据集,得到带有标签的图像数据集。
[0021]进一步地,所述图像数据集,划分为训练集和测试集,75%作为训练集,25%作为测试集。
[0022]进一步地,还包括以下步骤:设置训练参数,利用训练集对检测模型进行训练,得到训练后的模型以及权重文件,利用测试集以及精确率、召回率、F1分数等评价指标对训练后的模型进行性能评估。
[0023]进一步地,所述训练参数,包括:epoch为100,lr为0.01,momentum为0.937,
batchsize为8;损失函数由回归定位损失和置信度损失组成进行约束,使用随机梯度下降法SGD对目标函数进行优化,采用训练过程中将模型表现最好的权重参数保存文件对改进的目标检测算法YOLOv5进行评估,加载后对测试集飞机目标进行测试。
[0024]在本专利技术的较本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5的SAR图像飞机目标检测方法,其特征在于,对目标检测算法YOLOv5进行改进,获得改进后的目标检测算法YOLOv5,包括以下步骤:步骤1、在输入层中采用Mosaic数据增强方式,对输入图像进行预处理,采用K均值聚类算法针对飞机目标尺寸优化锚框;步骤2、所述步骤1的特征图输入改进的主干网络,改进的主干网络是指在主干网络中引入坐标注意力机制CA,采用SPD

CA卷积块替换主干网络对图像进行下采样所采用的跨步卷积;步骤3、所述步骤2得到的不同尺度的图像特征图输入到改进的YOLOv5网络中的Neck部分,采用设计的FFP特征融合金字塔网络结构改进目标检测算法YOLOv5的Neck结构,实现自适应特征融合;步骤4、所述步骤3得到不同尺度的张量数据,输入到改进的YOLOv5网络中的预测层部分,在预测层之前添加全局注意力机制GAM,捕捉全局信息,减少不准确的目标定位。2.如权利要求1所述的基于改进YOLOv5的SAR图像飞机目标检测方法,其特征在于,所述步骤1,所述Mosaic数据增强方式采用图片随机缩放、随机裁剪、随机排布的方式进行拼接,对输入图像进行预处理,提升小目标的检测效果。3.如权利要求1所述的基于改进YOLOv5的SAR图像飞机目标检测方法,其特征在于,所述步骤1,采用K

means聚类算法针对数据集中飞机目标尺寸优化锚框,通过对数据进行聚类分析提升先验框和目标框的匹配度,进行自适应锚框计算,对每个检测头都更换所有初始锚框大小。4.如权利要求1所述的基于改进YOLOv5的SAR图像飞机目标检测方法,其特征在于,所述步骤2,在YOLOv5模型的主干网络部分将下采样所用的3*3卷积核且步数为2的卷积块替换为设计的SPD

CA卷积块,完全替代卷积步长和池化层;SPD层是一个由空间到深度的连接层,具体操作是在图像中每隔一个像素提取出一个值,类似于邻近下采样,将特征图分为四张子特征图,具体表示如下:f
0,0
=X[0:S:2,0:S:2],f
1,0
=X[1:S:2,0:S:2],f
0,1
=X[0:S:2,1:S:2],f
1,1
=X[1:S:2,1:S:2]S为图像尺寸size,之后沿着通道维度将这些子特征映射连接在一起,在对特征映射进行下采样的同时,保留了通道维度的所...

【专利技术属性】
技术研发人员:张涛黄柏澄张增辉郁文贤
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1