一种基于无人机图像的小目标检测方法及系统技术方案

技术编号:35773650 阅读:19 留言:0更新日期:2022-12-01 14:16
本发明专利技术提供一种基于无人机图像的小目标检测方法及系统,该方法包括:获取无人机采集的图像,对图像进行预处理后,通过聚类算法计算出图像中不同尺寸的目标的anchor值;通过CSP-Darknet53骨干特征提取模型提取不同分辨率的特征图;基于swin-Transformer结构和SPPF结构对所述特征图进行特征加强;基于不同分辨率的特征图和特征加强后的特征图,融合不同网络层特征信息进行目标特征提取;根据提取的目标特征,检测输出目标位置和类别信息。通过该方案可以减少无人机图像中小目标检测存在的遗漏问题,提高小目标的检测精度。提高小目标的检测精度。提高小目标的检测精度。

【技术实现步骤摘要】
一种基于无人机图像的小目标检测方法及系统


[0001]本专利技术属于图像处理领域,尤其涉及一种基于无人机图像的小目标检测方法及系统。

技术介绍

[0002]随着无人机图像采集技术的迅速发展,基于无人机图像处理的应用也越来成熟。相较于普通图像,无人机视角图像小、目标多且密集,受限于目标类别及无人机的飞行高度,基于无人机图像的小目标检测较为困难。
[0003]当前,主流的无人机图像目标检测分类有单阶段和两阶段两种方式,典型的单阶段算法包括SSD和YOLO两种,典型的两阶段算法包括Fast R-CNN和Faster R-CNN。两阶段算法由于需要先生成候选框再进行分类回归,其精度也会优于单阶段。但对于小目标,受拍摄距离的影响,目标像素少、成像较为模糊且会受限于预测框尺寸等,导致对无人机图像中的小目标检测准确度偏低,容易存在漏检。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供了一种基于无人机图像的小目标检测方法及系统,用于解决现有无人机图像识别中小目标检测精度低的问题。
[0005]在本专利技术实施例的第一方面,提供了一种基于无人机图像的小目标检测方法,包括:
[0006]获取无人机采集的图像,对图像进行预处理后,通过聚类算法计算出图像中不同尺寸的目标的anchor值;
[0007]通过CSP-Darknet53骨干特征提取模型提取不同分辨率的特征图;
[0008]基于swin-Transformer结构和SPPF结构对所述特征图进行特征加强;
[0009]基于不同分辨率的特征图和特征加强后的特征图,融合不同网络层特征信息进行目标特征提取;
[0010]根据提取的目标特征,检测输出目标位置和类别信息。
[0011]在本专利技术实施例的第二方面,提供了一种基于无人机图像的小目标检测系统,包括:
[0012]预处理模块,用于接收无人机采集的图像,对图像进行预处理,通过聚类算法计算出图像中不同尺寸的目标的anchor值;
[0013]特征提取模块,用于通过CSP-Darknet53骨干特征提取模型提取不同分辨率的特征图;
[0014]特征增强模块,用于基于swin-Transformer结构和SPPF结构对所述特征图进行特征加强;
[0015]增强特征提取模块,用于基于不同分辨率的特征图和特征加强后的特征图,融合不同网络层特征信息进行目标特征提取;
[0016]目标预测模块,用于根据提取的目标特征,检测输出目标位置和类别信息。
[0017]在本专利技术实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本专利技术实施例第一方面所述方法的步骤。
[0018]在本专利技术实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本专利技术实施例第一方面提供的所述方法的步骤。
[0019]本专利技术实施例中,通过在CSP-Darknet53骨干特征提取模型的基础上,增加swin-Transformer结构和SPPF结构进行特征加强,从而可以提高无人机图像中小目标检测识别准确率,减少目标提取中对小目标的遗漏,保障目标检测精度。
附图说明
[0020]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单介绍,显而易见地,下面描述的附图仅仅是本专利技术的一些实施例,对本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他附图。
[0021]图1为本专利技术一个实施例提供的一种基于无人机图像的小目标检测方法流程示意图;
[0022]图2为本专利技术一个实施例提供的swin-Transformer结构和SPPF结构的连接示意图;
[0023]图3为本专利技术一个实施例提供的小目标检测效果示意图;
[0024]图4为本专利技术一个实施例提供的一种基于无人机图像的小目标检测系统的结构示意图;
[0025]图5为本专利技术的一个实施例提供的一种电子设备的结构示意图。
具体实施方式
[0026]为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0027]应当理解,本专利技术的说明书或权利要求书及上述附图中的术语“包括”以及其他相近意思表述,意指覆盖不排他的包含,如包含一系列步骤或单元的过程、方法或系统、设备没有限定于已列出的步骤或单元。此外,“第一”“第二”用于区分不同对象,并非用于描述特定顺序。
[0028]请参阅图1,本专利技术实施例提供的一种基于无人机图像的小目标检测方法的流程示意图,包括:
[0029]S101、获取无人机采集的图像,对图像进行预处理后,通过聚类算法计算出图像中不同尺寸的目标的anchor值;
[0030]获取无人机采集的图像,图像中一般包含有特定的成像目标,如人、车辆等。对无人机采集的原始图像进行预处理,标注出图像中小目标的位置,并添加标签。
[0031]其中,预处理过程至少包括:
[0032]将图像在预定区间内进行缩放处理,并对缩放后的图像进行mosaic数据增强处理。
[0033]所述预定区间为根据实际需要设定的缩放区间,可以在此区间内进行图片的放大和缩小,本实施例中区间大小为0.5-1.5的尺度,可以将原始图像放大至1.5倍,也可以将图像缩小至0.5倍。
[0034]所述mosaic数据增强处理是将选定的图片与随机的3张图片进行随机裁剪后,拼接到一张图片上作为训练数据,从而可以丰富图片背景,增强网络鲁棒性。
[0035]对预处理后的图像,通过聚类算法可以计算出目标的框集合,所述anchor值为与目标匹配的目标框宽度和高度。所述聚类算法可以为k-means等聚类方法。
[0036]其中,根据目标框的大小可以对目标进行分类,如将目标划分小目标、常规目标,常规目标也可以进一步根据尺寸划分小、中、大三类目标,由此,可以得到四类大小的目标。
[0037]S102、通过CSP-Darknet53骨干特征提取模型提取不同分辨率特征图;
[0038]所述CSP-Darknet53骨干特征提取模型为YOLOv4中的骨干网络,可用于图像特征的提取,CSP(Cross-Stage-Partial-connections)为跨阶段部分连接。
[0039]通过CSP-Darknet53骨干特征提取模型可以提取不同高低分辨率的特征图。
[0040]S103、基于swin-Transformer结构和SPPF结构对所述特征图进行特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于无人机图像的小目标检测方法,其特征在于,包括:获取无人机采集的图像,对图像进行预处理后,通过聚类算法计算出图像中不同尺寸的目标的anchor值;通过CSP-Darknet53骨干特征提取模型提取不同分辨率的特征图;基于swin-Transformer结构和SPPF结构对所述特征图进行特征加强;基于不同分辨率的特征图和特征加强后的特征图,融合不同网络层特征信息进行目标特征提取;根据提取的目标特征,检测输出目标位置和类别信息。2.根据权利要求1所述的方法,其特征在于,所述对图像进行预处理后包括:将图像在预定区间内进行缩放处理,并对缩放后的图像进行mosaic数据增强处理。3.根据权利要求1所述的方法,其特征在于,所述SPPF结构中,对输入的特征图进行最大池化,分别对池化后的特征图进行堆叠,通过CBL模块提取特征图特征。4.根据权利要求1所述的方法,其特征在于,所述基于不同分辨率的特征图和特征加强后的特征图,融合不同网络层特征信息进行目标特征提取包括:通过双向特征金字塔BiFPN上下连接融合不同阶段的特征图,并通过CBAM空间和通道注意模块,提取图像中密集对象的关注区域。5.根据权利要求1所述的方法,其特征在于,所述根据提取的目标特征,检测输出目标位置和类别信息还包括:定义目标尺寸加权的损失函数,增加预定目标的预测头损失,并增加预定目标的权重数值。6.一种基于无人机图像的小目标检测系统,其特征在...

【专利技术属性】
技术研发人员:朱敦尧余雄风
申请(专利权)人:武汉光庭信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1