一种轻量化红外图像行人目标检测方法技术

技术编号:39006449 阅读:10 留言:0更新日期:2023-10-07 10:37
本发明专利技术公开了一种轻量化红外图像行人目标检测方法,该方法包括以下步骤:步骤1,构建改进的轻量化YOLOv5网络模型;步骤2,获取红外图像行人数据集;步骤3,训练改进后的YOLOv5网络模型;步骤4,用训练好的模型进行红外图像中的行人检测。本发明专利技术可以提高模型训练速度,降低了模型部署成本,增加检测的准确率,更好的学习鲁棒性和可辨别性特征,并且提高了检测精度。度。度。

【技术实现步骤摘要】
一种轻量化红外图像行人目标检测方法


[0001]本专利技术涉及红外图像行人目标检测
,尤其涉及一种轻量化红外图像行人目标检测方法。

技术介绍

[0002]红外成像抗干扰能力强、受光线和恶劣天气影响小,探测距离远,适合全天候目标检测,利用红外图像进行目标检测在很多领域具有不可替代的地位。红外图像目标检测算法可分为两类:传统算法和基于深度学习的算法。传统算法通常是根据目标本身灰度值,邻域背景信息等特征来进行检测识别,这些算法选取的特征大多是基于人工的选择,因此在算法设计中考虑的特征参数总是有限的,而深度学习能够通过训练提取数据中深层次的特征,用以目标表征,提升目标检测的鲁棒性。其中单阶段的YOLOv5目标检测模型具有高精度,灵活性,易用性强等特点,应用广泛。但YOLOv5的参数量较多,计算复杂度高,模型训练速度比较慢,部署成本比较高,只有高端图形处理器才能保证其性能。且由于红外行人目标距离远、能量弱、对比度低,分辨率低等问题导致行人目标检测识别率低。

技术实现思路

[0003]本专利技术针对上述
技术介绍
中提到的算法参数量大,计算复杂度高,部署成本高,以及识别率低等问题,提供一种轻量化红外图像行人目标检测方法。
[0004]本专利技术是通过以下技术方案来实现的:
[0005]本专利技术提供的轻量化红外图像行人目标检测方法,包括以下步骤:
[0006]步骤1,构建改进的轻量化YOLOv5网络模型:
[0007]步骤1.1:选择轻量化的骨干特征提取网络MBNet替代YOLOv5的backbone部分;
[0008]步骤1.2:在CBAM注意力机制中增加LOG滤波器,用于在注意力模块中突出行人边缘特征;
[0009]步骤1.3:在骨干特征提取网络MBNet中引入增加了LOG滤波器的CBAM注意力机制,用于在骨干特征网络提取过程中加强红外图像行人目标特征的提取;
[0010]步骤1.4:基于高斯概率密度分布以及指数分布改进损失函数,为图像中各像素点赋予权重,重新设计CIoU损失函数中的IoU部分;
[0011]步骤2:获取红外图像行人数据集;
[0012]步骤3:训练改进后的YOLOv5网络模型;
[0013]步骤4:用训练好的模型进行红外图像中的行人检测;
[0014]上述方法中,步骤1.1所述的MBNet网络由1个CBH模块和11个Hblock基础模块组成,其中,CBH模块包括参数为(1,16,3,2)的卷积层,批归一化以及Hardwish激活函数。
[0015]上述方法中,所述的Hblock基础模块有三种,包括1个Hblock_1模块、2个Hblock_2模块以及8个Hblock_3模块。
[0016]上述方法中,所述的将CBH模块、Hblock_1模块、Hblock_2模块、Hblock_3模块依次
连接,组成改进后的yolov5骨干层,即MBNet网络。
[0017]上述方法中,所述的Hblock_1模块由1个卷积核为3*3的DW卷积层,一个改进的CBAM注意力机制以及一个卷积核为1*1的卷积层构成;Hblock_2模块由1个卷积核为1*1的卷积层,1个卷积核为3*3的DW卷积层,以及一个卷积核为1*1的卷积层依次相连构成;Hblock_3模块由1个卷积核为1*1的卷积层,1个卷积核为3*3的DW卷积层,一个改进的CBAM注意力机制,以及一个卷积核为1*1的卷积层构成。此外,在Hblock_1模块、Hblock_2模块、Hblock_3模块中均添加残差结构,并且当且仅当输入与输出特征图的通道数一致时运行。
[0018]上述方法中,步骤1.3中所述的引入增加了LOG滤波器的CBAM注意力机制,分为三个部分,包括以下步骤:
[0019]步骤1.3.1:使输入的特征图经过CBAM的通道注意力模块得到加权特征图F


[0020]步骤1.3.2:通过LOG滤波器,将特征图F

与滤波后的图进行融合得到特征图F1;
[0021]步骤1.3.3:使特征图F1经过CBAM的空间注意力模块得到特征图F2。
[0022]上述方法中,步骤1.4中所述的基于概率密度函数改进的CIoU损失函数,其主要改进的部分为IoU,基于高斯概率密度分布以及指数分布重新设计IoU部分,具体步骤如下:
[0023]步骤1.4.1:建立图像概率分布模型,建立一个以图像左上角为原点的坐标系模型,其中纵轴方向以向下为正,并将长和宽归一化到坐标(0,1)上,其中y坐标在(0,0.5)范围内采用指数分布函数,在(0.5,1)范围采用高斯概率密度分布函数;
[0024]步骤1.4.2:通过多次对比实验,本文取高斯概率分布模型的均值为0.5,方差为0.3,指数分布的期望为1.33,得到概率分布模型f(y)如公式(1

1)所示。
[0025][0026]式中:y
c
为行人分布在纵轴方向上的坐标均值,σ为方差,λ指数系数,y为行人分布坐标,即行人所占像素区域在纵轴方向上的每行像素坐标;
[0027]步骤1.4.3:对于一张图像,利用得到的概率密度分布模型f(y),对其在上下限进行积分,以得到每行像素的权重;
[0028]步骤1.4.4:在预测框和真实框中每行像素权重上,分别乘上该行面积再求和,得到公式1

2、1

3、1

4所示预测框和真实框加权面积A

和B

以及IoU

,包括:
[0029][0030][0031][0032]其中,A,B分别为预测框和真实框的面积;n1为预测框中像素的行数,n2为真实框中像素的行数;A

为改进后的预测框加权面积,B

为改进后的真实框的加权面积;y
i
为第i行像素的坐标;f(y)为概率分布函数值;IoU

为改进的预测框和真实框相交部分面积与相并部分面积的比值,也称交并比;
[0033]步骤1.4.5:改进的损失函数以公式1

5表示:
[0034][0035]其中,b,b
gt
分别表示预测框和真实框的中心点,ρ表示两个矩形框之间的欧氏距离,c表示两个矩形框的闭包区域的对角线的距离;ω
gt
和h
gt
表示真实框的宽和高,ω和h表示预测框的宽和高;υ为预测框和真实框的宽高比相似度;α为υ的影响因子;IoU

为改进的预测框和真实框相交部分面积与相并部分面积的比值,也称交并比。
[0036]上述方法中,可以采用公开的数据集KAIST,以6:2:2划分训练集验证集和测试集,并进行数据清洗和Mosaic数据增强。
[0037]上述方法中,训练改进的YOLOv5网络模型时,设置训练参数,利用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种轻量化红外图像行人目标检测方法,其特征在于,包括以下步骤:步骤1,构建改进的轻量化YOLOv5网络模型:步骤1.1:选择轻量化的骨干特征提取网络MBNet替代YOLOv5的backbone部分;步骤1.2:在CBAM注意力机制中增加LOG滤波器,用于在注意力模块中突出行人边缘特征;步骤1.3:在骨干特征提取网络MBNet中引入增加了LOG滤波器的CBAM注意力机制,用于在骨干特征网络提取过程中加强红外图像行人目标特征的提取;步骤1.4:基于高斯概率密度分布以及指数分布改进损失函数,为图像中各像素点赋予权重,重新设计CIoU损失函数中的IoU部分;步骤2:获取红外图像行人数据集;步骤3:训练改进后的YOLOv5网络模型;步骤4:用训练好的模型进行红外图像中的行人检测。2.根据权利要求1所述的轻量化红外图像行人目标检测方法,其特征在于:步骤1.1所述的MBNet网络由1个CBH模块和11个Hblock基础模块组成,其中,CBH模块包括参数为(1,16,3,2)的卷积层,批归一化以及Hardwish激活函数。3.根据权利要求2所述的轻量化红外图像行人目标检测方法,其特征在于:Hblock基础模块有三种,包括1个Hblock_1模块、2个Hblock_2模块以及8个Hblock_3模块。4.根据权利要求2所述的轻量化红外图像行人目标检测方法,其特征在于:将CBH模块、Hblock_1模块、Hblock_2模块、Hblock_3模块依次连接,组成改进后的yolov5骨干层,即MBNet网络。5.根据权利要求3所述的轻量化红外图像行人目标检测方法,其特征在于:Hblock_1模块由1个卷积核为3*3的DW卷积层,一个改进的CBAM注意力机制以及一个卷积核为1*1的卷积层构成;Hblock_2模块由1个卷积核为1*1的卷积层,1个卷积核为3*3的DW卷积层,以及一个卷积核为1*1的卷积层依次相连构成;Hblock_3模块由1个卷积核为1*1的卷积层,1个卷积核为3*3的DW卷积层,一个改进的CBAM注意力机制,以及一个卷积核为1*1的卷积层构成;在Hblock_1模块、Hblock_2模块、Hblock_3模块中均添加残差结构,并且当且仅当输入与输出特征图的通道数一致时运行。6.根据权利要求1所述的轻量化红外图像行人目标检测方法,其特征在于:步骤1.3中所述的引入增加了LOG滤波器的CBAM注意力机制,分为三个部分,包括以下步骤:步骤1.3.1:使输入的特征图经过CBAM的通道注意力模块得到加权特征图F

;步骤1.3.2:通过LOG滤波器,将特征图F

与滤波后的图进行融合得到特征图F1;步骤1.3.3:使特征图F1经过CBAM的空间注意力模块得到特征图F2。7.根据权利要求1所述的轻量化红外图像行人目标检测方法,其特征在于:步骤1.4中所述的基于概率密度函数改进的CIoU损失函数,其主要改进的部分为IoU,基于高斯概率密度分布以及指数分布重新设计I...

【专利技术属性】
技术研发人员:张洪昌胡佳丽杨康
申请(专利权)人:武汉理工大学重庆研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1