一种基于YOLOv7改进的车辆检测算法制造技术

技术编号:38160993 阅读:17 留言:0更新日期:2023-07-13 09:33
本发明专利技术涉及目标检测技术领域,且公开了一种基于YOLO v7改进的车辆检测算法,包括:步骤S1,获取Vehicle

【技术实现步骤摘要】
一种基于YOLO v7改进的车辆检测算法


[0001]本专利技术涉及目标检测领域,具体为一种基于YOLO v7改进的车辆检测算法,

技术介绍

[0002]目标检测算法是近二十年来人工智能的火热话题,是机器视觉领域中重要的版块之一。近些年来随着深度学习的发展,不少基于深度学习的目标检测算法脱颖而出,并且在公开数据集上体现出显著的检测效果。
[0003]传统检测算法通过穷举法列举出所有可能出现物体的区域,随后直接对这些区域进行图片特征匹配和分类,最后利用非极大值抑制算法输出最终结果。R

CNN(全称:Region

CNN,基于卷积神经网络(CNN),线性回归,和支持向量机(SVM)等算法,一种目标检测网络)算法在传统检测算法的基础上对选取区域和特征提取做出改进,所述R

CNN算法利用滑窗法进行选择性搜索,用卷积神经网络提取图像特征,将特征送入SVM分类器,最后利用非极大值抑制算法输出最终图像。R

CNN算法是典型的Two

stage(一种目标检测网络)算法,虽然有着较高的检测精度,但由于需要存储大量特征和繁琐的训练流程,耗费了大量的计算时间和磁盘空间,无法达到实时效果。
[0004]随着深度学习的发展,车辆检测领域出现了单阶段检测算法,对比双阶段检测算法的检测速度有着显著提升,例如SSD(全称:single

shot detector,多分类单杆检测器)系列和YOLO(单杆检测器)系列算法。YOLO系列算法是目标检测领域中One

stage(一种目标检测网络)的代表作,一次性检测出输入图片所含有的物体类别和位置,并巧妙地将分类问题转换为回归问题。YOLO v7算法是YOLO系列最新的算法,其速度和精确度超过了大部分目标检测算法和此前YOLO系列的所有算法,能够满足实时检测效果。
[0005]YOLO v7算法与大部分目标检测算法相同,应用在车辆检测时仍存在小目标漏检、背景识别错误的问题。

技术实现思路

[0006]本专利技术的目的在于克服现有的缺陷而提供的一种基于YOLO v7改进的车辆检测算法,在保证检测速度的同时,解决小目标漏检、背景识别错误的问题。
[0007]实现上述目的的技术方案是:
[0008]一种基于YOLO v7改进的车辆检测算法,包括:
[0009]步骤S1,获取Vehicle

Dataset(车辆数据集)车辆检测数据集,对获得的所有数据集进行马赛克数据增强扩充样本集;
[0010]步骤S2,基于现有YOLO v7算法的网络结构进行优化,得到改进的YOLO v7的目标检测算法;
[0011]步骤S3,基于所述马赛克数据增强后的数据集,训练改进后的YOLO v7目标检测网络,获取平均精确度最高的权重文件,用于Pytorch(一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用程序)环境下的目标检测算法;
[0012]步骤S4,利用所述改进后的YOLO v7目标检测算法检测视频或图片,输出检测后的视频或图片。
[0013]优选的,所述马赛克数据增强方式包括:在Vehicle

Dataset车辆检测数据集中随机抽取四张照片,将所述的四张图片进行图像处理,并且按照一定的方框区域进行随机拼接,获得新的样本图片,拼接过程中仍会保留原图像的label标签。
[0014]优选的,所述改进的YOLO v7的目标检测算法包括:主干特征提取网络、加强特征提取网络和多分类检测网络;
[0015]所述主干特征提取网络由Stem层、第一特征提取模块、第二特征提取模块、第三特征提取模块和第四特征提取模块组成,其中第一特征提取模块、第二特征提取模块、第三特征提取模块和第四特征提取模块分别输出160*160*256、80*80*512、40*40*1024和20*20*1024的特征图;
[0016]所述加强特征提取网络整合了CBAM卷积注意力模块,对来自所述主干特征提取网络的四个输入特征进行通道和空间维度上的特征优化,将尺寸为160*160*256、80*80*512、40*40*1024和20*20*1024的特征图进行卷积、特征堆叠和上采样,最后通过下采样和特征堆叠后,分别将尺寸为160*160*64的第一强化特征层、80*80*128的第二强化特征层、40*40*256的第三强化特征层和20*20*512的第四强化特征层输入所述多分类检测网络中;
[0017]所述多分类检测网络包括RepConv重参数化卷积层、第一YOLO_Head检测头、第二YOLO_Head检测头、第三YOLO_Head检测头和第四YOLO_Head检测头;所述第一强化特征层、第二强化特征层、第三强化特征层和第四强化特征层分别经过所述第一YOLO_Head检测头、第二YOLO_Head检测头、第三YOLO_Head检测头和第四YOLO_Head检测头的卷积层后,输出第一特征预测层、第二特征预测层、第三特征预测层和第四特征预测层。
[0018]优选的,所述主干特征提取网络中,
[0019]所述Stem层包括:串行的三层Conv(向量卷积运算)卷积,每层Conv由卷积层、BN(全称:Batch Normalization,归一化网络层)层和FReLU(Funnel激活函数)激活函数组成,输出一个二倍降采样的特征图;
[0020]所述第一特征提取模块包括:一个Conv卷积层和一个E

ELAN(全称:Extended

Extended efficient layer aggregation networks,一种网络架构)层,输出一张160*160*256的特征图作为上层特征feat0;
[0021]所述第二特征提取模块包括:一个DownSample层和一个E

ELAN层,输出一张80*80*512的特征图作为中间层特征feat1;
[0022]所述第三特征提取模块包括:一个DownSample层和一个E

ELAN层,输出一张40*40*1024的特征图作为中下层特征feat2;
[0023]所述第四特征提取模块包括:一个DownSample层和一个E

ELAN层,输出一张20*20*1024的特征图,作为底层特征feat3。
[0024]优选的,所述FReLU激活函数公式如下:
[0025]f(x
c,i,j
)=max(x
c,i,j
,T(x
c,i,j
));
[0026][0027]其中,x
c,i,j
表示第c个通道上对应二维空间位置为(i,j)的非线性激活函数FReLU
的输入像素值,函数T表示漏斗条件,表示以二维空间位置(i,j本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于YOLO v7改进的车辆检测算法,其特征在于,包括:步骤S1,获取Vehicle

Dataset车辆检测数据集,对获得的所有数据集进行马赛克数据增强扩充样本集;步骤S2,基于现有YOLO v7算法的网络结构进行优化,得到改进的YOLO v7的目标检测算法;步骤S3,基于所述马赛克数据增强后的数据集,训练改进后的YOLO v7目标检测网络,获取平均精确度最高的权重文件,用于Pytorch环境下的目标检测算法;步骤S4,利用所述改进后的YOLO v7目标检测算法检测视频或图片,输出检测后的视频或图片。2.根据权利要求1所述的一种基于YOLO v7改进的车辆检测算法,其特征在于,所述马赛克数据增强方式包括:在Vehicle

Dataset车辆检测数据集中随机抽取四张照片,将所述的四张图片进行图像处理,并且按照一定的方框区域进行随机拼接,获得新的样本图片,拼接过程中仍会保留原图像的label标签。3.根据权利要求1所述的一种基于YOLO v7改进的车辆检测算法,其特征在于,所述改进的YOLO v7的目标检测算法包括:主干特征提取网络、加强特征提取网络和多分类检测网络;所述主干特征提取网络由Stem层、第一特征提取模块、第二特征提取模块、第三特征提取模块和第四特征提取模块组成,其中第一特征提取模块、第二特征提取模块、第三特征提取模块和第四特征提取模块分别输出160*160*256、80*80*512、40*40*1024和20*20*1024的特征图;所述加强特征提取网络整合了CBAM卷积注意力模块,对来自所述主干特征提取网络的四个输入特征进行通道和空间维度上的特征优化,将尺寸为160*160*256、80*80*512、40*40*1024和20*20*1024的特征图进行卷积、特征堆叠和上采样,最后通过下采样和特征堆叠后,分别将尺寸为160*160*64的第一强化特征层、80*80*128的第二强化特征层、40*40*256的第三强化特征层和20*20*512的第四强化特征层输入所述多分类检测网络中;所述多分类检测网络包括RepConv重参数化卷积层、第一YOLO_Head检测头、第二YOLO_Head检测头、第三YOLO_Head检测头和第四YOLO_Head检测头;所述第一强化特征层、第二强化特征层、第三强化特征层和第四强化特征层分别经过所述第一YOLO_Head检测头、第二YOLO_Head检测头、第三YOLO_Head检测头和第四YOLO_Head检测头的卷积层后,输出第一特征预测层、第二特征预测层、第三特征预测层和第四特征预测层。4.根据权利要求3所述的一种基于YOLO v7改进的车辆检测算法,其特征在于,所述主干特征提取网络中,所述Stem层包括:串行的三层Conv卷积,每层Conv由卷积层、BN层和FReLU激活函数组成,输出一个二倍降采样的特征图;所述第一特征提取模块包括:一个Conv卷积层和一个E

ELAN层,输出一张160*160*256的特征图作为上层特征feat0;所述第二特征提取模块包括:一个DownSample层和一个E

ELAN层,输出一张80*80*512的特征图作为中间层特征feat1;所述第三特征提取模块包括:一个DownSample层和一个E

ELAN层,输出一张40*40*
1024的特征图作为中下层特征feat2;所述第四特征提取模块包括:一个DownSample层和一个E

E...

【专利技术属性】
技术研发人员:周家杰卢俊颖谢水生
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1