一种基于深度学习的红外无人机目标检测算法制造技术

技术编号:39325066 阅读:10 留言:0更新日期:2023-11-12 16:03
一种基于深度学习的红外无人机目标检测算法,它涉及一种红外无人机目标检测算法。本发明专利技术为了解决现有深度学习目标检测算法应用到红外图像中后检测性能下降,难以达到实时性要求并且不适合在嵌入式AI设备上部署问题。本发明专利技术是基于深度学习的算法,相比于传统目标检测算法,不需要人为设计有效的红外图像特征,ScYOLO能够自主学习图像数据中的特征表示,算法的鲁棒性和泛化能力更强,并且不需要过多的图像先验知识,可以提高项目开发效率。本发明专利技术属于图像处理技术领域。属于图像处理技术领域。属于图像处理技术领域。

【技术实现步骤摘要】
一种基于深度学习的红外无人机目标检测算法


[0001]本专利技术涉及一种红外无人机目标检测算法,属于图像处理


技术介绍

[0002]随着无人机的使用日益增多,其在带来便利的同时,也在军事领域和民用领域都产生了巨大的安全隐患,威胁着国防安全、社会公共安全和隐私安全等各项安全问题,因此有效检测、监控和规范无人机的使用是一个亟需解决的重要问题。
[0003]无人机目标的探测技术主要有雷达探测、无线探测、音频探测、可见光探测、红外探测等技术。当前的无人机多采用隐形化、小型化设计,并且依靠电动机在低空慢速飞行,产生的噪声较小,采用雷达探测、音频探测等技术检测效果较差;可见光检测技术容易受到天气和光照等因素的影响,特别是在夜间无法正常检测;无人机在保持无线电静默时,无线探测技术也会失效。红外目标检测是通过红外传感器根据红外热辐射差异成像后进行目标检测的技术,不受极端天气和光照条件的影响,可以对目标进行全天候检测,具有探测范围广、探测距离远、检测精度高、穿透能力和抗干扰能力强的优势,因此红外目标检测技术目前备受各个领域的关注。
[0004]传统红外目标检测算法存在如下问题:一是人工设计并选择出有效的图像特征需要大量先验知识,总体开发效率很低;二是候选区域选择时会有冗余窗口产生,导致计算复杂度过高,检测速度慢,而且可能影响后续的分类效果,从而影响算法的实时性和准确性;三是手动设计的图像特征通常针对于特定的检测任务,若检测目标、应用背景、检测距离和角度等条件发生变化时,检测性能将会大打折扣,对于环境变化没有很好的鲁棒性,算法泛化能力弱,在复杂背景条件下的检测精度有限。
[0005]基于深度学习的目标检测算法能够自主学习图像数据中的特征表示,具有检测速度快、泛化能力强等优势,已经逐渐取代传统的目标检测算法。但是现有的深度学习目标检测算法应用到红外图像中还有如下问题:一是大多基于可见光RGB图像,从图像颜色、目标形状和细节纹理信息中提取高层语义特征,但红外图像缺失颜色和细节纹理,并且具有亮度不均匀、细节模糊和对比度差等特点,其所含的特征信息较少,会影响网络的特征表示,将可见光目标检测网络直接迁移到红外场景下,检测性能将会下降,因此需要对网络结构设计和图像预处理进行针对性优化;二是多数目标检测网络直接应用到红外图像上大多精度有限,而且参数量和计算量过大,其对于硬件设备条件要求较高,难以达到实时性要求并且不适合在嵌入式AI设备上部署,因此需要对其进行轻量化设计以及量化。

技术实现思路

[0006]本专利技术为解决现有深度学习目标检测算法应用到红外图像中后检测性能下降,难以达到实时性要求并且不适合在嵌入式AI设备上部署问题,进而提出一种基于深度学习的红外无人机目标检测算法。
[0007]本专利技术为解决上述问题采取的技术方案是:本专利技术所述一种基于深度学习的红外
无人机目标检测算法是通过一种单通道输入的神经网络ScYOLO实现的,所述单通道输入的神经网络ScYOLO由主干网络G

ELAN、颈部网络和头部网络组成;所述一种基于深度学习的红外无人机目标检测算法是通过如下步骤实现的:
[0008]步骤一、使用神经网络ScYOLO进行离线训练;
[0009]步骤二、使用神经网络ScYOLO进行在线推理。
[0010]进一步的,步骤一中离线训练阶段引入Mosaic数据增强算法,随机取四张图像经过随机变换后,合成一张新图像,新图像中包含多个无人机目标和四种不同的背景,Mosaic数据增强算法的具体流程为:
[0011]步骤1、从训练数据集中读取一个Batch,从中随机读取四张图像;
[0012]步骤2、分别对四张图像进行随机水平翻转、缩放以及长和宽的扭曲;
[0013]步骤3、在图像中心区域,随机设定中心裁剪位置(x,y),根据设定好的输出尺寸(w
×
h),限制x∈[0.3w,0.7w],y∈[0.3h,0.7h];
[0014]步骤4、裁剪图像,四张图像依次以裁剪位置的十字线裁剪,左上图像取裁剪位置的左上部分,右上图像取裁剪位置的右上部分,左下和右下图像同理,同时需要调整原图的目标框,使其不超过原图裁剪范围;
[0015]步骤5、拼接图像,将裁剪过的图像对应拼接,得到新图像;
[0016]步骤6、重复上述过程BatchSize次,得到BatchSize张拼接后的新图像,送入神经网络训练。
[0017]进一步的,步骤二中使用神经网络ScYOLO进行在线推理前,进行十次warm up,推理时BatchSize设置为1;模型的推理时间包括数据处理时间以及网络前馈计算时间;模型的推理步骤为:
[0018]步骤二(一)、图像预处理,通过双三次插值调整输入图像的尺寸,统一调整到416
×
416,并进行图像数据归一化;
[0019]步骤二(二)、网络前馈计算,将经过预处理的图像数据送入神经网络进行前馈计算;
[0020]步骤二(三)数据后处理,对网络的输出结果进行解码,并进行非极大抑制,最后得到检测结果;
[0021]步骤二(四)、绘制检测结果,在原输入图像上绘制出网络预测框、目标类别以及置信度。
[0022]进一步的,主干网络G

ELAN设置输入图像通道数为1,输入尺寸为416
×
416,整个网络的最大宽度为256;G

ELAN主要由Focus模块、多分支堆叠模块和最大池化层组成;Focus网络放置在主干网络的最前端,从图像的一个通道中,按行和列间隔采样取值,将一个通道扩充成四个通道,将其中包含的宽高维度上的特征信息转换到通道维度中,对于输入的单通道图像,Focus网络扩充为四通道。
[0023]进一步的,在主干网络G

ELAN中引入Ghost模块进行模型轻量化,对Ghost模块进行改进的步骤为:
[0024]步骤a、将激活函数由ReLU函数替换为Hardswish激活函数;
[0025]步骤b、模块内的第一个卷积层的核大小由1
×
1调整为3
×
3,第二个分组卷积层的核大小由3
×
3调整为5
×
5,扩大卷积层的感受野,以略微增大运算量和参数量的代价换取
更明显的性能提升。
[0026]进一步的,颈部网络是FPN组合PAN的结构,并使用了MCB模块进行加强特征提取,在颈部网络中使用了步长为2的3
×
3再参数化卷积RepConv,用于PAN结构中特征图的下采样。
[0027]进一步的,头部网络采用解耦检测头以及深度可分离卷积。
[0028]本专利技术的有益效果是:
[0029]1、本专利技术是基于深度学习的算法,相比于传统目标检测算法,不需要人为设计有效的红外图像特征,ScYOLO能够自主学习图像数据中的特征表示,算法的鲁棒性和泛化能力更强,并且不需要过多的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的红外无人机目标检测算法,其特征在于:所述一种基于深度学习的红外无人机目标检测算法是通过一种单通道输入的神经网络ScYOLO实现的,所述单通道输入的神经网络ScYOLO由主干网络G

ELAN、颈部网络和头部网络组成;所述一种基于深度学习的红外无人机目标检测算法是通过如下步骤实现的:步骤一、使用神经网络ScYOLO进行离线训练;步骤二、使用神经网络ScYOLO进行在线推理。2.根据权利要求1所述的一种基于深度学习的红外无人机目标检测算法,其特征在于:步骤一中离线训练阶段引入Mosaic数据增强算法,随机取四张图像经过随机变换后,合成一张新图像,新图像中包含多个无人机目标和四种不同的背景,Mosaic数据增强算法的具体流程为:步骤1、从训练数据集中读取一个Batch,从中随机读取四张图像;步骤2、分别对四张图像进行随机水平翻转、缩放以及长和宽的扭曲;步骤3、在图像中心区域,随机设定中心裁剪位置(x,y),根据设定好的输出尺寸(w
×
h),限制x∈[0.3w,0.7w],y∈[0.3h,0.7h];步骤4、裁剪图像,四张图像依次以裁剪位置的十字线裁剪,左上图像取裁剪位置的左上部分,右上图像取裁剪位置的右上部分,左下和右下图像同理,同时需要调整原图的目标框,使其不超过原图裁剪范围;步骤5、拼接图像,将裁剪过的图像对应拼接,得到新图像;步骤6、重复上述过程BatchSize次,得到BatchSize张拼接后的新图像,送入神经网络训练。3.根据权利要求1所述的一种基于深度学习的红外无人机目标检测算法,其特征在于:步骤二中使用神经网络ScYOLO进行在线推理前,进行十次warm up,推理时BatchSize设置为1;模型的推理时间包括数据处理时间以及网络前馈计算时间;模型的推理步骤为:步骤二(一)、图像预处理,通过双三次插值调整输入图像的尺寸,统一调整到416
×
416,并进行图像数据归一化;步骤二(二)、网络...

【专利技术属性】
技术研发人员:吴少川刘显鹏张佳岩
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1