当前位置: 首页 > 专利查询>常州大学专利>正文

一种街道场景红外目标检测方法技术

技术编号:39833256 阅读:8 留言:0更新日期:2023-12-29 16:16
本案涉及一种街道场景红外目标检测方法,针对现有目标检测模型在训练后,模型过于复杂且从街道场景等复杂背景中提取目标特征效果不好,本案通过将实时获取的街道场景红外图像输入红外目标检测器,获得指定目标的特征信息,并对目标进行定位和识别

【技术实现步骤摘要】
一种街道场景红外目标检测方法


[0001]本专利技术涉及目标检测
,涉及街道指定目标的检测方法,该方法可以更准确

更快速的预测行人,为无人驾驶

无人机探测等领域提供帮助


技术介绍

[0002]红外成像技术与可见光成像技术不同,它不需要借助外部环境光源,并且不受雨雪风霜等恶劣天气的影响,具有全天候成像

抗干扰能力强

可远距离成像

成像精度高等优点

街道场景下的红外目标检测是无人驾驶

交通监控

监控安全等场景下的关键技术,该场景下的红外图像对比度低

信噪比低
(
低信噪比特性会导致目标被淹没和干扰
)、
图像所含细节信息更少

背景更为复杂
(
复杂的背景会使目标区域昏暗而不均匀
)。
以上因素导致目前针对街道场景下的红外目标检测的算法难以提取图像的更深层次上的语义信息,检测效果欠佳

[0003]近年来,随着计算机视觉领域研究的逐渐深入,卷积神经网络已被证明具有更好的特征提取能力,并且目前已被用于解决诸多问题,例如,图像分类

超分辨率等

[0004]传统目标检测算法的过程大致可以分为三个阶段

首先,根据待检测目标的大小选取不同尺寸的滑动窗口扫描输入图像,并产生候选区域
(R0I)。
由于这个过程是对所有区域进行无差别扫描,因此会产生很多冗余窗口,十分影响检测效率

其次,使用人工设计的特征提取器从候选区域中提取特征,这其中包括
SIFT、Haar、HOG


但由于目标形态变化和背景光照变化的多样性,因此提取到的特征泛化能力一般

最后,使用支持向量机
SVM(support vector machine)

AdaBoost
来确定该区域中是否存在对象

[0005]虽然以上方法在无人驾驶等领域取得了不错的检测性能,但这些方法训练后的模型大都太过复杂

沉重,且在检测类似街道场景这样背景复杂的场景时表现一般


技术实现思路

[0006]为了提高复杂街道场景下的红外目标检测性能,同时达到实时检测的目标,本方案在分析了红外图像独特性的基础上,基于
YOLOv5
提出了一种针对街道场景下的红外目标检测器
SimAM

YOL0
;针对模型参数量大

复杂背景干扰,提出了新的特征提取模块
SimAM

C3
;针对街道场景下的红外图像目标尺度差异大的问题,引入了不同扩张率的空洞卷积模块,以增大模型的感受野,有效提升尺度差异较大目标的检测性能

本案具体技术方案如下

[0007]第一方面,本案提出一种街道场景红外目标检测方法,所述方法将实时获取的街道场景红外图像输入红外目标检测器,所述红外目标检测器提取街道场景中指定目标的特征信息,并利用该特征信息对目标进行定位和识别;所述红外目标检测器采用
YOLOv5
网络与无参注意力模块
SimAM
结合实现,对
YOLOv5
网络结构中的
C3
残差模块的重复部分,在每个重复部分后面串联加入无参注意力模块
SimAM
,实现在不增加参数量的同时,抑制背景噪声,增强检测性能

[0008]作为上述技术方案的进一步改进,所述红外目标检测器在每个
SPPF
模块的最大池化操作后加入不同扩张率的空洞卷积模块构成空洞快速空间池化金字塔
(dilated spatial pyramid pooling fast

DSPPF)
模块,使模型在检测大小差异较大的目标时,仍能保证较好的检测性能

[0009]在上述技术方案的一种实施方式中,每个
SPPF
模块从输入到输出的3个空洞卷积模块的扩张率分别设置为
3、6、6。
[0010]在上述技术方案的一种实施方式中,所述红外目标检测器在训练之前使用
Mosaic
数据增强来增加数据集的多样性

[0011]在上述技术方案的一种实施方式中,
Mosaic
的值设置为
0.01。
[0012]在上述技术方案的一种实施方式中,所述红外目标检测器在训练时,将
BatchSize
设置为
32
,学习率设置为
0.01
,动量衰减率设置为
0.937。
[0013]在上述技术方案的一种实施方式中,红外目标检测器的参数通过下述步骤确定:
[0014]将训练数据集输入红外目标检测器,记录训练结果,进行参数调整,将检测效果最好的参数权重作为候选权重;
[0015]使用验证数据集对红外目标检测器的候选权重进行调整,记录验证结果;
[0016]重复训练和验证过程,直至获得使全局最优的权重

[0017]在上述技术方案的一种实施方式中,所述红外目标检测器由骨架
(Backbone)、

(Neck)
以及检测头
(Detection Head)
构成;
[0018]所述骨架由第一卷积模块

第二卷积模块

第一
SimAM

C3
模块

第三卷积模块

第二
SimAM

C3
模块

第四卷积模块

第三
SimAM

C3
模块

第四卷积模块

第三
SimAM

C3
模块
、DSPPF
模块依次串联而成;
[0019]所述颈由第六卷积模块

第一上采样模块

第一
Concat
模块

第四
SimAM

C3
模块

第七卷积模块

第二上采样模块

第二
Concat
模块

第五
SimAM

C3
模块

第八卷积模块

第三
Conca本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种街道场景红外目标检测方法,其特征在于:所述方法将实时获取的街道场景红外图像输入红外目标检测器,所述红外目标检测器提取街道场景中指定目标的特征信息,并利用该特征信息对目标进行定位和识别;所述红外目标检测器采用
YOLOv5
网络与无参注意力模块
SimAM
结合实现,对
YOL0v5
网络结构中的
C3
残差模块的重复部分,在每个重复部分后面串联加入无参注意力模块
SimAM。2.
根据权利要求1所述的方法,其特征在于:所述红外目标检测器在每个
SPPF
模块的最大池化操作后加入不同扩张率的空洞卷积模块
。3.
根据权利要求2所述的方法,其特征在于,每个
SPPF
模块从输入到输出的3个空洞卷积模块的扩张率分别设置为
3、6、6。4.
根据权利要求2所述的方法,其特征在于,所述红外目标检测器在训练之前使用
Mosaic
数据增强来增加数据集的多样性
。5.
根据权利要求4所述的方法,其特征在于,
Mosaic
的值设置为
0.01。6.
根据权利要求1所述的方法,其特征在于,所述红外目标检测器在训练时,将
BatchSize
设置为
32
,学习率设置为
0.01
,动量衰减率设置为
0.937。7.
根据权利要求2所述的方法,其特征在于,红外目标检测器的参数通过下述步骤确定:将训练数据集输入红外目标检测器,记录训练结果,进行参数调整,将检测效果最好的参数权重作为候选权重;使用验证数据集对红外目标检测器的候选权重进行调整,记录验证结果;重复训练和验证过程,直至获得使全局最优的权重
。8.
根据权利要求2所述的方法,其特征在于,所述红外目标检测器由骨架
(Backbone)、

(Neck)
以及检测头
(Detection Head)
构成;所述骨架由第一卷积模块

第二卷积模块

第一
SimAM

C3
模块

第三卷积模块

第二
SimAM

C3
模块

第四卷积模块

第三
SimAM

C3
模块

第四卷积模块

第三
SimAM

C3
模块
、DSPPF
模块依次串联而成;所述颈由第六卷积模块

第一上采样模块

第一

【专利技术属性】
技术研发人员:李强龙周新文魏然
申请(专利权)人:常州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1