基于YOLOv5网络的头盔检测方法技术

技术编号:34391819 阅读:159 留言:0更新日期:2022-08-03 21:21
本发明专利技术公开了一种基于YOLOv5网络的头盔检测方法,包括:采用Mosaic

【技术实现步骤摘要】
基于YOLOv5网络的头盔检测方法


[0001]本专利技术属于计算机视觉应用
,尤其涉及一种基于YOLOv5网络的头盔检测方法。

技术介绍

[0002]电动车一直是人们日常出行的重要交通工具。近年来,随着新能源技术的发展,电动车的动力越来越强,续航也更持久,但引发的交通事故也在不断增多。
[0003]科学研究表明,如果正确佩戴安全头盔,当意外发生时,头盔能够吸收大部分的冲击能量,减少事故造成的头部伤害,从而降低60%到70%的交通事故死亡风险。传统的头盔佩戴检测方法是依靠人工对摄像设备拍摄的内容进行检测,其效率较低且成本较高。因此,设计一种头盔佩戴情况自动检测方法,对于提高头盔检测的精度和效率,协助交通执法、实现智能化交通管理显得尤为重要。
[0004]头盔具有小目标、多样性等属性,再加上场景的多样性以及目标间交互的复杂性,因此难以识别。除此之外,头盔检测还存在以下难点:在昏暗条件下,由于光照强度不大,可见度低,难以对电动车进行精确定位,头盔检测任务的难度大大提高。
[0005]已经公布的多数目标检测方法已在头盔检测任务上取得了不错的成绩,但对可见度不高、光照强度不强的昏暗条件下,其检测精度仍有待提高。在探索基于深度学习的头盔检测方法中,Prajwal等人先利用YOLOv2检测出视频帧中的人和电动车,再利用 YOLOv3检测感兴趣区域(Region ofinterest,ROI)中是否含有头盔,该方法使用的框架冗余,计算量大;Noel等先利用传统机器视觉方法对摩托车和电动车进行分类,再利用YOLOv3目标检测框架对头盔进行检测,该方法对拍摄角度和图像质量的要求较高。

技术实现思路

[0006]为了解决现有技术中的上述技术缺陷,本专利技术提出了一种基于YOLOv5网络的头盔检测方法。
[0007]实现本专利技术目的的技术方案为:一种基于YOLOv5网络的头盔检测方法,包括:
[0008]采用Mosaic

8图像增强算法对原始图片进行预处理;
[0009]将预处理后的图片输入到引入了注意力机制的YOLOv5网络中进行迭代训练,通过反复迭代训练获得最优权重模型;
[0010]将待检测图片进行预处理后输入最优权重模型进行头盔检测。
[0011]优选地,通过网络爬取与自行拍摄相结合制作原始图片数据集,其中80%图片来源于网络,20%来源于实际拍摄。
[0012]优选地,对原始图片进行标签标注,标签分为两种,分别是yes和no,其中no表示电动车骑行者未佩戴头盔,yes表示佩戴头盔,使用图像增强算法对标签为yes的图片进行图像平移、翻转、旋转、缩放,分离三个颜色通道并添加随机噪声。
[0013]优选地,目标YOLOv5算法模型中的所有C3

n模块均添加了卷积注意力模块 CBAM。
[0014]优选地,所述C3

n模块包含三个标准卷积层以及n个Bottleneck模块,C3

n模块用于对残差特征进行学习,其结构分为两支,一支指定n个Bottleneck模块和1个标准卷积层,另一支经过1个标准卷积层,最后将两支进行特征融合操作后经过1个标准卷积层,其中,每个Bottleneck模块的最后添加卷积注意力模块CBAM。
[0015]优选地,所述卷积注意力模块CBAM通道注意力模块CAM和空间注意力模块SAM,所述通道注意力模块CAM对输入的特征F∈R
C
×
H
×
W
分别采用基于宽和高的最大池化操作和全局平均池化于在空间维度上进行压缩,得到两个特征图与 R
C
×
H
×
W
为输入特征图,两个特征图共享一个两层的神经网络MLP,第一层神经元的个数为C/r,r为减少率,激活函数是ReLU,第二层的神经元个数是C,对MLP输出的两个特征图使用基于元素的加和操作,再经过Sigmoid激活函数进行归一化处理,得到最终的通道注意力特征图M
c
∈R
C
×1×1;
[0016]空间注意力模块SAM将通道注意力模块CAM的输出特征图作为输入,对输入的特征图分别进行基于通道的全局最大池化和全局平均池化,得到两个特征图与将两个特征图串联,基于通道做拼接操作,再经过一个7
×
7卷积操作生成空间注意力特征M
s
∈R1×
H
×
W

[0017]优选地,所述目标YOLOv5算法模型的损失函数由分类损失、定位损失和目标置信度损失组成。
[0018]优选地,所述目标YOLOv5算法模型采用CIOU Loss作为目标框回归的损失函数,具体为:
[0019][0020]其中,d1表示预测框与目标框两个中心点的欧式距离,d2表示最小外接矩形的对角线距离。和分别表示目标框和预测框各自的宽高比,
[0021]优选地,使用二元交叉熵损失函数来计算分类损失和目标置信度损失,具体为:
[0022][0023][0024]式中,K表示网络最后输出的特征图划分为K
×
K个格子,M表示每个格子对应的锚框的个数,表示有目标的锚框,表示没有目标的锚框,λ
no_obj
表示没有目标锚框的置信度损失权重系数,C
i
和分别代表第i个网格存在物体的预测和真实置信度。p
i
(c)和
分别表示物体属于类别c的预测和真实概率。
[0025]本专利技术与现有技术相比,其显著优点为:
[0026]本专利技术引入的注意力机制作用在特征图之上,通过获取特征图中的可用注意力信息,能够达到更好的任务效果;
[0027]本专利技术采用CIOU Loss作为目标框回归的损失函数,由于CIOU Loss从重叠面积、中心点距离和长宽比三个角度进行衡量,故预测框回归的效果更佳。
[0028]本专利技术在YOLOv5网络中添加了CBAM模块,由于CBAM模型在通道注意力模块中加入了全局最大池化操作,它能在一定程度上弥补全局平均池化所丢失的信息。其次,生成的二维空间注意力图使用卷积核大小为7的卷积层进行编码,较大的卷积核对于保留重要的空间区域有良好的帮助。使YOLOv5网络不仅能更为准确地对目标进行分类识别,而且能更为精准地定位目标所在的位置。
[0029]本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分的从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
[0030]附图仅用于示出具体实施例的目的,而并不认为是对本专利技术的限制,在整个附图中,相同的参考符号表示相同的部件。
[0031]图1为本专利技术实施例提供的一种基于YOLOv5网络的头盔检测方法流程图。
[0032]图2为本专利技术实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于YOLOv5网络的头盔检测方法,其特征在于,包括:采用Mosaic

8图像增强算法对原始图片进行预处理;将预处理后的图片输入到引入了注意力机制的YOLOv5网络中进行迭代训练,通过反复迭代训练获得最优权重模型;将待检测图片进行预处理后输入最优权重模型进行头盔检测。2.根据权利要求1所述的基于YOLOv5网络的头盔检测方法,其特征在于,通过网络爬取与自行拍摄相结合制作原始图片数据集,其中80%图片来源于网络,20%来源于实际拍摄。3.根据权利要求1所述的基于YOLOv5网络的头盔检测方法,其特征在于,对原始图片进行标签标注,标签分为两种,分别是yes和no,其中no表示电动车骑行者未佩戴头盔,yes表示佩戴头盔,使用图像增强算法对标签为yes的图片进行图像平移、翻转、旋转、缩放,分离三个颜色通道并添加随机噪声。4.根据权利要求1所述的基于YOLOv5网络的头盔检测方法,其特征在于,目标YOLOv5算法模型中的所有C3

n模块均添加了卷积注意力模块CBAM。5.根据权利要求4所述的基于YOLOv5网络的头盔检测方法,其特征在于,所述C3

n模块包含三个标准卷积层以及n个Bottleneck模块,C3

n模块用于对残差特征进行学习,其结构分为两支,一支指定n个Bottleneck模块和1个标准卷积层,另一支经过1个标准卷积层,最后将两支进行特征融合操作后经过1个标准卷积层,其中,每个Bottleneck模块的最后添加卷积注意力模块CBAM。6.根据权利要求4或5所述的基于YOLOv5网络的头盔检测方法,其特征在于,所述卷积注意力模块CBAM通道注意力模块CAM和空间注意力模块SAM,所述通道注意力模块CAM对输入的特征F∈R
C
×
H
×
W
分别采用基于宽和高的最大池化操作和全局平均池化于在空间维度上进行压缩,得到两个特征图与R
...

【专利技术属性】
技术研发人员:彭树生宋伟军吴礼郭林
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1