一种基于改进YOLOv5的卫星图像小目标检测方法技术

技术编号:32787764 阅读:15 留言:0更新日期:2022-03-23 19:48
本发明专利技术公开了一种基于改进YOLOv5的卫星图像小目标检测方法。该发明专利技术在小目标检测方向上具有一定的通用性,该专利以遥感影像小目标检测为说明案例。为解决遥感图像目标检测中对小目标误检、漏检及特征提取能力不足等问题,提出基于改进YOLOv5的小目标检测算法。算法使用Mosaic

【技术实现步骤摘要】
一种基于改进YOLOv5的卫星图像小目标检测方法


[0001]本专利技术涉及深度学习中的目标检测领域,针对小目标检测特别是遥感影像目标检测技术。

技术介绍

[0002]在遥感领域中,卫星图像的分辨率一般比较大,其中存在着大量的小目标物体。由于这些目标相对于整幅图像来说,尺寸较小、分辨率较低,使得在实现快速检测识别目标时,很难准确检测到存在的小目标。随着深度学习技术的不断成熟,用于遥感影像的目标检测方法越来越多。由于图像中存在众多的目标物体,想要从其中检测并定位出小目标是非常具有挑战性的,实现过程中会存在大量误检和漏检,从而影响到整体的检测效果。因此,研究遥感影像中的小目标检测技术是人工智能发展领域中的热点之一。
[0003]为了能够准确的检测出遥感图像中存在的弱小目标,常用的检测方法有:Haar分类器;梯度定向直方图和支持向量机方法(HOG+SVM);可变形部分模型技术(DPM);基于深度神经网络的方法。Haar分类器将AdaBoost算法训练出来的强分类器进行级联,并且在底层的特征提取中采用了高效率的矩形特征和积分图方法,但是由于原始特征中含有较少的上下文信息,无法提取更多高频特征并有效识别出待检目标。梯度直方图特征(HOG)是一种对图像局部重叠区域的密集型描述符,它通过计算局部区域的梯度方向直方图来构成特征,使用梯度直方图特征结合SVM分类器来对目标进行检测,但是梯度直方图的方法存在描述子生成过程冗长,较难处理密集型目标等问题,并且有对噪声数据相当敏感等缺点。可变形部分模型(DPM)方法可以看作是梯度直方图和SVM分类器的升级版,但是DPM结构相对复杂,检测速度也比较慢,同时无法对复杂场景下的目标表现出良好的检测效果。
[0004]随着深度学习的不断进步和快速发展,其在遥感图像领域的应用越来越广泛,尤其是在目标检测领域,出现了YOLO、RCNN、SSD等优秀的目标检测框架,但对于小目标检测,始终是目标检测领域的一个难题。本专利技术就是着力于解决遥感影像中存在大量小目标造成的难题。本专利技术在小目标检测领域具有一定的通用性,并针对图像中存在小目标的问题而改进了数据增强模块,使得网络能够学习提取到更多微小细节。

技术实现思路

[0005]为了克服上述现有技术的不足,本专利技术提出了一种基于改进的YOLOv5小目标检测技术。该技术应用了深度学习中的高性能通用的目标检测模型YOLOv5,并针对遥感图像中存在的小目标以及分布数量众多等问题(如附图1所示)对YOLOv5算法作了进一步的改进。
[0006]本专利技术所采用的技术方案是:
[0007]步骤1:输入图像进入网络,第一进行锚框的自适应计算、第二进行图片的自适应缩放,第三实现Mosaic

6数据增强;
[0008]步骤2:特征提取主干网络采用Swin

Transformer结构,包括第一Focus切片操作,第一下采样层,第二卷积归一化层,第二下采样层,第三卷积归一化层,第三下采样层,第四
卷积归一化层,第四下采样层,第五卷积归一化层,第五下采样层;
[0009]步骤3:步骤2中第三至第五下采样层产生的特征图都采用1x1的卷积进行特征提取,得到的特征图分别记为M3,M4,M5;
[0010]步骤4:该步骤为传统的FPN网络结构,采用自底向上的通路进行多尺度目标检测,使得底层的特征与含有丰富位置信息的底层信息进行融合;M5经过3
×
3卷积消除融合带来的混叠效应,记为P5;M5经两倍上采样,与M4逐像素相加,再经过3
×
3卷积消除融合带来的混叠效应生成特征图,记为P4;M4经两倍上采样,与M3逐像素相加,经过3
×
3卷积消除融合带来的混叠效应生成特征图P3;
[0011]步骤5:在步骤4中FPN的基础上,添加一条自底向上的通路,称为PAN网络,使得底层特征与含有丰富语义信息的高层特征进行融合;P3作为底层特征A3,进行2倍下采样后,与P4进行逐像素相加,得到特征图A4;A4经过2倍下采样后,与P5进行逐像素相加,生成特征图A5;与步骤4一样,A3至A5经过3
×
3卷积消除混叠效应,生成最终特征图Q3至Q5;
[0012]步骤6:该步骤是该专利的核心内容,在步骤4每次上采样之后集成一个轻量的注意力模块(CBAM),将沿着通道和空间两个独立维度依次推断出注意力映射,然后将注意力映射与输入特征映射相乘,以执行自适应特征细化;同理,在步骤5每次下采样之后添加一个CBAM模块,从特征中学习或者提取出权重分布,再拿这个权重分布施加在原来的特征之上,改变原有特征的分布,增强有效特征抑制无效的特征;
[0013]步骤7:将特征图Q3至Q5分别输入yolo检测头网络,预测网络的Anchor设置依据事先对数据集的聚类进定;然后将预测网络通过非极大值抑制输出的候选框映射成原图大小,框选出图像中的目标物体,最终得出检测结果。
[0014]与现有技术相比,本专利技术的有益效果是:
[0015](1)在卫星图像小目标检测上,能够达到更高的识别精度;
[0016](2)对于密集型目标检测,能够表现出更好的检测效果。
附图说明
[0017]图1为:遥感影像典型小目标示意图。
[0018]图2为:Mosaic数据增强流程示意图。
[0019]图3为:Mosaic

6数据增强细节示意图。
[0020]图4为:原始YOLOv5特征提取模型示意图。
[0021]图5为:特征提取网络各层感受野。
[0022]图6为:增添Swin Transformer网络采样示意图。
[0023]图7为:改进后的特征融合网络示意图。
[0024]图8为:原始YOLOv5中Anchor尺寸示意图。
[0025]图9为:利用改进的算法模型对图像小目标的检测效果。
具体实施方式
[0026]下面结合附图对本专利技术进一步说明。
[0027]首先,利用YOLOv5网络模型CSPNet对遥感影像图像进行特征提取的过程如图4所示。输入图像的大小为640x640x3,图像首先经过Focus结构,进行切片操作,即降低图像尺
寸大小增加通道数,特征图的大小变成320x320x32;进行第二个卷积操作后,特征图的大小变成160x160x64;进行第三个卷积操作后,特征图的大小变成80x80x128;进行第四个卷积操作后,特征图的大小变成40x40x256;进行第五个卷积操作后,特征图的大小变成20x20x512。
[0028]在生成特征图的卷积网络中,生成底层特征图的神经元所叠加的前置计算较少,在原图上的感受野小,更注重保留图像的边缘、纹理等细节信息,而生成高层特征的神经元所叠加的前置计算较多,在原图上的感受野大,更注重保留图像的语义信息。高层特征经过多次下采样,一般会忽略较多的细节信息。图5是根是CSPNet各层输出特征图的感受野情况本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5的卫星图像小目标检测方法,其特征在于,包括以下步骤:步骤1:输入图像进入网络,第一进行图片的自适应缩放,第二实现Mosaic

6数据增强;步骤2:特征提取主干网络采用Swin

Transformer结构,包括第一Focus切片操作,第一下采样层,第二卷积归一化层,第二下采样层,第三卷积归一化层,第三下采样层,第四卷积归一化层,第四下采样层,第五卷积归一化层,第五下采样层;步骤3:步骤2中第三至第五下采样层产生的特征图都采用1x1的卷积进行特征提取,得到的特征图分别记为M3,M4,M5;步骤4:该步骤为传统的FPN网络结构,采用自底向上的通路进行多尺度目标检测,使得底层的特征与含有丰富位置信息的底层信息进行融合;M5经过3
×
3卷积消除融合带来的混叠效应,记为P5;M5经两倍上采样,与M4逐像素相加,再经过3
×
3卷积消除融合带来的混叠效应生成特征图,记为P4;M4经两倍上采样,与M3逐像素相加,经过3
×
3卷积消除融合带来的混叠效应生成特征图P3;步骤5:在步骤4中FPN的基础上,添加一条自底向上的通路,称为PAN网络,使得底层特征与含有丰富语义信息的高层特征进行融合;P3作为底层特征A3,进行2倍下采样后,与P4进行逐像素相加,得到特征图A4;A4...

【专利技术属性】
技术研发人员:王俊庞磊周焕来陈璐刘博文余梦鹏张诗涵朱敬伦贾海涛
申请(专利权)人:一拓通信集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1