一种基于改进YOLOv7算法的红外车辆快速检测方法技术

技术编号:37722021 阅读:7 留言:0更新日期:2023-06-02 00:21
本发明专利技术公开了一种基于改进YOLOv7算法的红外车辆快速检测方法,包括以下步骤;步骤1:采集交通道路上的车辆视频进行帧提取和图像预处理,得到红外车辆图像数据集;步骤2:构建一个新主干特征提取网络lite,替换YOLOv7算法中的主干特征提取网络;步骤3:将新的主干特征提取网络与原YOLOv7的预测网络连接,构成新的网络模型lite

【技术实现步骤摘要】
一种基于改进YOLOv7算法的红外车辆快速检测方法


[0001]本专利技术属于红外车辆快速检测
,具体涉及一种基于改进YOLOv7算法的红外车辆快速检测方法。

技术介绍

[0002]红外目标检测技术是指从红外图像中自动提取出目标的位置信息。鉴于红外热成像的优势,红外目标检测技术可应用于交通道路上的车辆检测场景中,并可适应黑夜、强光和极端天气的情况,因此,该技术的突破对自动驾驶和智能交通等领域具有重要理论意义和实用价值。
[0003]传统的红外车辆检测方法通常首先采用梯度方向直方图等方法提取目标的特征,然后利用正负样本训练支持向量机等分类器对目标特征进行分类。这种方法检测速度慢,无法满足时性的要求,且存在应用场景受限,鲁棒性差,泛化能力弱的问题。
[0004]近年来,随着人工智能技术的快速发展,基于卷积神经网络的红外车辆检测方法得到了广泛应用。它可通过卷积神经网络自动对图像进行特征抽象和特征提取,具有较高的检测准确率与较强的鲁棒性。目前,基于深度学习的目标检测算法主要包括两类,一类是两阶段检测算法,该类算法将检测过程分为两个阶段,第一阶段生成待检测图像的候选区域,第二阶段对生成的候选区域作分类和回归,得到最终的检测结果。该类算法第一阶段比较耗时,总体上检测准确率高,但检测速度慢,一般无法满足实时性的需求,代表算法有R

CNN、Fast R

CNN、Faster R

CNN等。另一类是单阶段检测算法,该类算法将上述的两阶段检测过程统一为一个端到端的回归过程,区域选择和检测判断这两个步骤合二为一,虽然检测速度较快,但是检测准确率较低,代表算法有YOLO和SSD等。
[0005]基于深度学习的目标检测算法在可见光图像目标检测场景中具有较好的检测效果,但在红外目标检测场景中,由于红外图像分辨率低、特征不明显,需要采用结构较为复杂的神经网络进行处理,致使检测速度较慢。上述传统红外车辆检测方法和基于卷积神经网络的红外车辆检测方法均因检测速度较慢,无法满足实时性的要求。
[0006]Conv31_YOLOv7模型通过堆叠31个卷积块来构建主干特征提取网络,增强了模型的特征提取能力,具有较高的检测准确率,然而,该模型网络结构复杂,参数量大,故检测速度慢,无法满足实时性检测的需求。

技术实现思路

[0007]为了克服上述现有技术存在的不足,本专利技术的目的在于提供一种基于改进YOLOv7算法的红外车辆快速检测方法,在保证较高检测准确率的前提下,显著提高检测速度。
[0008]为了实现上述目的,本专利技术采用的技术方案是:
[0009]一种基于改进YOLOv7算法的红外车辆快速检测方法,包括以下步骤;
[0010]步骤1:采集交通道路上的车辆视频进行帧提取和图像预处理,得到红外车辆图像数据集;
[0011]步骤2:对YOLOv7算法主干特征提取网络进行改进,即舍弃YOLOv7算法中的主干特征提取网络,构建一个包含18个普通卷积块和8个分组卷积块的新主干特征提取网络lite,替换YOLOv7算法中的主干特征提取网络;
[0012]步骤3:将新的主干特征提取网络与原YOLOv7的预测网络连接,构成新的网络模型lite

YOLOv7;
[0013]步骤4:将步骤1得到的训练数据集送入到新的网络模型lite

YOLOv7中,采用小批次随机梯度下降算法进行训练,得到训练好的红外车辆检测模型;
[0014]步骤5:将红外热成像设备实时采集的交通道路上的红外车辆视频按帧送入到已经训练好的模型,得到车辆的实时位置信息和置信度。
[0015]所述步骤1中进行帧提取和图像预处理的步骤:
[0016](1.1)采集交通道路上的红外车辆视频,读取视频,设置待输出图像的分辨率,将每一帧按顺序以图像格式输出,得到红外车辆图像,并对所得到的红外车辆图像的车辆目标的位置信息进行标注,制作成红外车辆图像数据集;
[0017](1.2)将红外车辆图像数据集划分为训练数据集和测试数据集,即从数据集中随机选取红外图像组成训练集,剩余红外图像组成测试集。
[0018]所述步骤2具体为:
[0019](2.1)舍弃YOLOv7算法中的主干特征提取网络,构建一个新的轻量化主干特征提取网络lite,用以替换YOLOv7算法中的主干特征提取网络,构建新的主干特征提取网络lite,包含18个普通卷积块和8个分组卷积块,其中每个卷积块结构如下:
[0020]第1个普通卷积块:包含一个输入通道数为1,输出通道数为1,卷积核大小为3
×
3,步长为1,填充为1的卷积层,一个通道数为1的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0021]第2个普通卷积块:包含一个输入通道数为1,输出通道数为32,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为32的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0022]第3个普通卷积块:包含一个输入通道数为32,输出通道数为32,卷积核大小为1
×
1,步长为2,填充为0的卷积层,一个通道数为32的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0023]第4个普通卷积块:包含一个输入通道数为32,输出通道数为64,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为64的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0024]第5个普通卷积块:包含一个输入通道数为64,输出通道数为64,卷积核大小为1
×
1,步长为2,填充为0的卷积层,一个通道数为64的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0025]第6个普通卷积块:包含一个输入通道数为64,输出通道数为128,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为128的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0026]第7个普通卷积块:包含一个输入通道数为128,输出通道数为128,卷积核大小为1
×
1,步长为2,填充为0的卷积层,一个通道数为128的批量归一化层,一个复斜率为0.1的
LeakyReLU激活函数层;
[0027]第8个普通卷积块:包含一个输入通道数为128,输出通道数为256,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为256的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0028]第9个普通卷积块和第12个普通卷积块:包含一个输入通道数为256,输出通道数为512,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为512的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv7算法的红外车辆快速检测方法,其特征在于,包括以下步骤;步骤1:采集交通道路上的车辆视频进行帧提取和图像预处理,得到红外车辆图像数据集;步骤2:对YOLOv7算法主干特征提取网络进行改进,即舍弃YOLOv7算法中的主干特征提取网络,构建一个包含18个普通卷积块和8个分组卷积块的新主干特征提取网络lite,替换YOLOv7算法中的主干特征提取网络;步骤3:将新的主干特征提取网络与原YOLOv7的预测网络连接,构成新的网络模型lite

YOLOv7;步骤4:将步骤1得到的训练数据集送入到新的网络模型lite

YOLOv7中,采用小批次随机梯度下降算法进行训练,得到训练好的红外车辆检测模型;步骤5:将红外热成像设备实时采集的交通道路上的红外车辆视频按帧送入到已经训练好的模型,得到车辆的实时位置信息和置信度。2.根据权利要求1所述的一种基于改进YOLOv7算法的红外车辆快速检测方法,其特征在于,所述步骤1中进行帧提取和图像预处理的步骤:(1.1)采集交通道路上的红外车辆视频,读取视频,设置待输出图像的分辨率,将每一帧按顺序以图像格式输出,得到红外车辆图像,并对所得到的红外车辆图像的车辆目标的位置信息进行标注,制作成红外车辆图像数据集;(1.2)将红外车辆图像数据集划分为训练数据集和测试数据集,即从数据集中随机选取红外图像组成训练集,剩余红外图像组成测试集。3.根据权利要求1所述的一种基于改进YOLOv7算法的红外车辆快速检测方法,其特征在于,所述步骤2具体为:(2.1)舍弃YOLOv7算法中的主干特征提取网络,构建一个新的轻量化主干特征提取网络lite,用以替换YOLOv7算法中的主干特征提取网络,构建新的主干特征提取网络lite,包含18个普通卷积块和8个分组卷积块,,其中每个卷积块结构如下:第1个普通卷积块:包含一个输入通道数为1,输出通道数为1,卷积核大小为3
×
3,步长为1,填充为1的卷积层,一个通道数为1的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第2个普通卷积块:包含一个输入通道数为1,输出通道数为32,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为32的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第3个普通卷积块:包含一个输入通道数为32,输出通道数为32,卷积核大小为1
×
1,步长为2,填充为0的卷积层,一个通道数为32的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第4个普通卷积块:包含一个输入通道数为32,输出通道数为64,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为64的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第5个普通卷积块:包含一个输入通道数为64,输出通道数为64,卷积核大小为1
×
1,步长为2,填充为0的卷积层,一个通道数为64的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
第6个普通卷积块:包含一个输入通道数为64,输出通道数为128,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为128的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第7个普通卷积块:包含一个输入通道数为128,输出通道数为128,卷积核大小为1
×
1,步长为2,填充为0的卷积层,一个通道数为128的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第8个普通卷积块:包含一个输入通道数为128,输出通道数为256,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为256的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第9个普通卷积块和第12个普通卷积块:包含一个输入通道数为256,输出通道数为512,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为512的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第10个普通卷积块:包含一个输入通道数为512,输出通道数为256,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为256的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第11个普通卷积块:包含一个输入通道数为256,输出通道数为256,卷积核大小为1
×
1,步长为2,填充为0的卷积层,一个通道数为256的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第13个普通卷积块、第16个普通卷积块、第18个普通卷积块:包含一个输入通道数为512,输出通道数为1024,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为1024的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第14个普通卷积块和第17个普通卷积块:包含一个输入通道数为1024,输出通道数为512,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为512的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第15个普通卷积块:包含一个输入通道数为512,输出通道数为512,卷积核大小为1
×
1,步长为2,填充为0的卷积层,一个通道数为512的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第1个分组卷积块:包含一个输入通道数为32,输出通道数为32,卷积核大小为3
×
3,步长为1,填充为1,分组数为32的卷积层,一个通道数为32的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第2个分组卷积块:包含一个输入通道数为64,输出通道数为64,卷积核大小为3
×
3,步长为1,填充为1,分组数为64的卷积层,一个通道数为64的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第3个分组卷积块:包含一个输入通道数为128,输出通道数为128,卷积核大小为3
×
3,步长为1,填充为1,分组数为128的卷积层,一个通道数为128的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第4个分组卷积块和第5个分组卷积块:包含一个输入通道数为256,输出通道数为256,卷积核大小为3
×
3,步长为1,填充为1,分组数为256的卷积层,一个通道数为256的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
第6个分组卷积块、第7个分组卷积块、第8个分组卷积块:包含一个输入通道数为512,输出通道数为512,卷积核大小为3
×
3,步长为1,填充为1,分组数为512的卷积层...

【专利技术属性】
技术研发人员:徐一铭姬红兵张文博李林臧博龙璐岚
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1