一种复杂场景下的红外目标检测方法技术

技术编号:34510176 阅读:12 留言:0更新日期:2022-08-13 20:55
本发明专利技术提供了一种复杂场景下的红外目标检测方法,本发明专利技术通过改进的主干特征提取网络对输入红外图像进行特征提取,结合特征金字塔网络结构与路径聚集网络结构,实现不同尺度特征信息的融合,同时优化网络的损失函数,最后对不同尺度的特征图进行预测,并使用基于Distance

【技术实现步骤摘要】
一种复杂场景下的红外目标检测方法


[0001]本专利技术属于数字红外目标检测领域,具体涉及一种复杂场景下的红外目标检测方法。

技术介绍

[0002]目标检测是一项重要的计算机视觉任务,包括识别(例如目标分类)和定位(例如位置回归)任务。目标检测需要将特定目标类的目标与图像中的背景进行区分,并对每个目标实例进行精确定位和正确的分类标签预测。目标检测能够为图像和视频的语义理解提供有价值的信息。近年来,随着深度学习技术的快速发展,为目标检测注入了新鲜血液,取得了显著的突破,也将其推向了一个前所未有的研究热点。相对于传统的目标检测方法,深度学习的算法具有更高的精度。
[0003]为了实现鲁棒的检测和识别,用于验证的提取特征必须不受光照、姿态和其他变化的影响。可见光图像分辨率高、细节丰富,但是相比红外图像很容易受光照变化的影响,很大程度上增加了目标识别的难度。红外目标检测利用红外探测器感知目标与背景之间的红外辐射差异成像后进行检测。在一些特殊天气如雨天、雾天包括夜间和缺乏光源的情况下,红外成像也可以正常工作,且抗干扰能力强、工作距离远、受天气影响小、能昼夜工作。红外目标检测不仅应用于军事领域,在工业、安防、交通等民用领域也有着广泛应用。
[0004]目前基于深度学习的目标检测算法研究已经取得了显著性的成果,但是当下国内外研究的大多数应用场景均是基于可见光条件,有关红外场景的研究很少,因此需要针对红外目标检测进行深入研究。

技术实现思路

[0005]针对现有红外目标检测技术研究较少,且在人群密集、复杂场景下检测效果不佳等问题,本专利技术提出了一种复杂场景下的红外目标检测方法。其目的在于,使用改进的主干网络进行特征提取,提高模型对重要特征的提取能力。优化网络的损失函数,使得训练聚焦在高质量的正样本上,提高模型在复杂场景下的检测能力,增强鲁棒性。采用多尺度融合实现不同大小目标的检测,增强模型在不同尺度目标下的检测精度。
[0006]为了实现上述目的,本专利技术所采用的技术方案为:一种复杂场景下的红外目标检测方法,该方法包括如下步骤:
[0007](1)对输入红外图像进行Mosaic数据增强;
[0008](2)对特征提取网络CSPDarknet53结构进行优化改进,在特征提取网络中加入注意力机制ECA模块;使用Focus结构对输入图像进行切片操作,再经过多次卷积处理,然后利用优化的CSPDarknet53特征提取网络进行特征信息的提取,得到不同尺度的特征图,并在特征提取网络后加入SPP模块,解决目标尺度变化带来的精度下降的问题;
[0009](3)将(2)中最后所得的最小特征图通过特征金字塔网络结构与路径聚集网络结构,将高层的强语义特征信息与低层的强定位特征进行融合,结合两种网络结构最终得到
同时具备强语义特征和强定位特征的不同尺度的检测层;
[0010](4)优化损失函数,使用Varifocal Loss作为检测物体的置信度和类别概率的损失函数,实现多尺度检测,得到不同的预测框;
[0011](5)对(4)所得预测框进行非极大值抑制处理,通过基于DIoU的非极大值抑制对预测框进行筛选,消除置信度低的预测框,得到精确度更高的预测框;
[0012](6)使用FLIR红外图像数据集对(2)

(5)中的整体网络结构进行训练,使用训练得到的整体网络结构进行检测,得到测试结果。
[0013]进一步的,步骤(1)的具体实现方式如下;
[0014](1

1)对输入红外图像预处理,对图像进行自适应缩放,统一缩放为640
×
640的尺寸;
[0015](1

2)对缩放后的图像进行数据增强,每4张图片通过随机缩放、裁剪、排布的方式进行拼接,丰富检测数据集,提升小目标的检测效果。
[0016]进一步的,步骤(2)的具体实现方式如下;
[0017](2

1)对主干特征提取网络CSPDarknet53结构进行改进,在卷积层之间添加注意力机制ECA模块,将特征提取网络中的10层网络变为13层网络;
[0018](2

2)使用Focus结构将步骤(1)所得图像进行切片操作把高分辨率的特征图拆分为多个低分辨率的特征图,在通道维度上进行拼接再经过一次卷积得到320
×
320的特征图,然后经过步长为2的3
×
3卷积核对得到的320
×
320特征图进行4次下采样,并使用优化后的CSPDarknet53网络结构进行特征提取分别得到160
×
160、80
×
80、40
×
40、20
×
20的特征图;
[0019](2

3)在特征提取网络后加入SPP模块,首先对改进的CSPDarknet53网络进行特征提取所得到的20
×
20特征图经过1
×
1的卷积核进行降维,然后经过四种不同大小的池化层得到全局特征和局部特征,具体地,经过1
×
1大小的池化层获取全局特征,经过5
×
5、9
×
9、13
×
13大小的池化层获取不同大小的特征图得到局部特征,经过不同的通道获取不同的特征信息,然后将局部特征与全局特征进行融合,再经过一次卷积得到新的20
×
20特征图,增强特征表达能力,扩大特征图的感受野,解决目标尺度变化带来的精度下降的问题。
[0020]进一步的,步骤(3)的具体实现方式如下;
[0021]将步骤(2

3)中所得20
×
20特征图通过特征金字塔自顶向下将高层的特征信息通过上采样的方式进行传递融合,将20
×
20特征图进行上采样得到40
×
40特征图,再与(2

2)中特征提取网络所得40
×
40特征图进行融合,将融合所得40
×
40特征图进行上采样得到80
×
80特征图,与(2)中特征提取网络所得80
×
80特征图进行融合得到融合的80
×
80特征图,然后通过路径聚集网络将融合所得80
×
80特征图进行下采样得到40
×
40特征图,并与特征金字塔中经过融合所得到的40
×
40特征图进行融合,再将融合所得40
×
40特征图进行下采样得到的20
×
20特征图与(2

3)中经过SPP模块处理所得20
×
20特征图进行融合得到融合的20
×
20特征图;通过两种网络结构结合,最终得到同时具备强语义特征和强定位特征的20
×
20、40
×<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种复杂场景下的红外目标检测方法,其特征在于,包括如下步骤:(1)对输入红外图像进行Mosaic数据增强;(2)对特征提取网络CSPDarknet53结构进行优化改进,在特征提取网络中加入注意力机制ECA模块;使用Focus结构对输入图像进行切片操作,再经过多次卷积处理,然后利用优化的CSPDarknet53特征提取网络进行特征信息的提取,得到不同尺度的特征图,并在特征提取网络后加入SPP模块,解决目标尺度变化带来的精度下降的问题;(3)将(2)中最后所得的最小特征图通过特征金字塔网络结构与路径聚集网络结构,将高层的强语义特征信息与低层的强定位特征进行融合,结合两种网络结构最终得到同时具备强语义特征和强定位特征的不同尺度的检测层;(4)优化损失函数,使用Varifocal Loss作为检测物体的置信度和类别概率的损失函数,实现多尺度检测,得到不同的预测框;(5)对(4)所得预测框进行非极大值抑制处理,通过基于DIoU的非极大值抑制对预测框进行筛选,消除置信度低的预测框,得到精确度更高的预测框;(6)使用FLIR红外图像数据集对(2)

(5)中的整体网络结构进行训练,使用训练得到的整体网络结构进行检测,得到测试结果。2.如权利要求1所述的一种复杂场景下的红外目标检测方法,其特征在于:步骤(1)的具体实现方式如下;(1

1)对输入红外图像预处理,对图像进行自适应缩放,统一缩放为640
×
640的尺寸;(1

2)对缩放后的图像进行数据增强,每4张图片通过随机缩放、裁剪、排布的方式进行拼接,丰富检测数据集,提升小目标的检测效果。3.如权利要求1所述的一种复杂场景下的红外目标检测方法,其特征在于:步骤(2)的具体实现方式如下;(2

1)对主干特征提取网络CSPDarknet53结构进行改进,在卷积层之间添加注意力机制ECA模块,将特征提取网络中的10层网络变为13层网络;(2

2)使用Focus结构将步骤(1)所得图像进行切片操作把高分辨率的特征图拆分为多个低分辨率的特征图,在通道维度上进行拼接再经过一次卷积得到320
×
320的特征图,然后经过步长为2的3
×
3卷积核对得到的320
×
320特征图进行4次下采样,并使用优化后的CSPDarknet53网络结构进行特征提取分别得到160
×
160、80
×
80、40
×
40、20
×
20的特征图;(2

3)在特征提取网络后加入SPP模块,首先对改进的CSPDarknet53网络进行特征提取所得到的20
×
20特征图经过1
×
1的卷积核进行降维,然后经过四种不同大小的池化层得到全局特征和局部特征,具体地,经过1
×
1大小的池化层获取全局特征,经过5
×
5、9
×
9、13
×
13大小的池化层获取不同大小的特征图得到局部特征,经过不同的通道获取不同的特征信息,然后将局部特征与全局特征进行融合,再经过一次卷积得到新的20
×
20特...

【专利技术属性】
技术研发人员:马小林蔡永培旷海兰刘新华
申请(专利权)人:武汉理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1