当前位置: 首页 > 专利查询>淮阴工学院专利>正文

一种基于改进YOLOv5模型的检测行人车辆的方法技术

技术编号:38647179 阅读:12 留言:0更新日期:2023-09-02 22:38
本发明专利技术公开了一种基于改进YOLOv5模型的检测行人车辆的方法,包括以下步骤:在城市道路上乘坐出租车或私家车在副驾驶位固定机位拍摄道路上行人车辆的图片,选择白天和黑夜分别对城市道路上的行人和车辆数据进行拍摄。将部分不包含行人和车辆的图片以及模糊不清的图片进行剔除。将拍摄完并处理好的图片放入文件夹中用图片标注工具进行图片的标注。将标注的数据集分类为训练集、检测集、测试集。对已经标注完毕的数据集中的目标框使用k

【技术实现步骤摘要】
一种基于改进YOLOv5模型的检测行人车辆的方法


[0001]本专利技术属于目标检测领域,涉及一种基于改进YOLOv5模型的检测行人车辆的方法。

技术介绍

[0002]目前,计算机视觉领域的目标检测算法已经不断取得了较大的进展,其中,基于深度学习的目标检测方法已经成为了当前较流行的技术之一。目前主要的检测算法分为两阶段检测算法和单阶段检测算法,虽然两阶段检测算法的精度比较高,应用也比较广泛,但是由于检测速度相对于单阶段检测算法来说比较慢一些,而YOLO系列算法作为单阶段算法的代表算法之一,是一种高效的目标检测算法,广泛被应用于工业领域、安防领域等多个领域。YOLOv5模型主要基于深度学习技术,即基于卷积神经网络(CNN)的目标检测算法。这种算法通过学习大量带标注的图像数据,构建出一个深度学习模型,从而实现对图像中目标的检测任务。目标检测算法的核心是对输入的图像进行有效的特征提取,因此图像处理技术在目标检测中也扮演着重要角色。YOLOv5模型是一种高效的目标检测算法,其采用了轻量化的卷积神经网络结构,能够在较小的运算量和内存消耗下实现较高的检测精度,因此被广泛应用于各个领域。改进YOLOv5模型的检测行人车辆的方法基于YOLOv5算法,通过对算法进行改进,提高了其对行人车辆的检测精度和减少了错误识别的可能性。当自动驾驶车辆行驶在道路上时,YOLOv5模型可以实时地检测图像或摄像头中出现的行人和车辆,帮助车辆做出相应的决策,比如避让或者变道,此模型可以应用在自动驾驶领域帮助自动驾驶车辆更加准确的感知道路交通的情况从而更好地完成自动驾驶的任务。

技术实现思路

[0003]本专利技术针对在无人驾驶或自动驾驶过程中车辆能否对行人车辆进行准确有效的避让并完成驾驶任务的问题,提供了一种基于改进YOLOv5模型的检测行人车辆的方法。本专利技术可以针对环境状况不同、天气状况不同和光线强度不同的情况下对道路上的行人和车辆进行检测。一种基于改进YOLOv5模型的检测行人车辆的方法,技术方案如下:
[0004](1)自制数据集,在城市道路上乘坐出租车或私家车在副驾驶位固定机位拍摄道路上行人车辆的图片;
[0005](2)处理数据集,并对准备好的数据集使用标注工具进行标注;
[0006](3)划分数据集,将数据集分为训练集、测试集、验证集;
[0007](4)改进网络,使用k

means聚类方法对已经标注完毕的数据集中的目标框进行聚类分析得到适合该数据集的先验框尺寸,给网络添加CBAM注意力机制,更换模型的损失函数,将主干网络中C3模块全部替换为C3Ghost模块;
[0008](5)训练网络,将步骤(4)改进好的网络进行训练,并保存训练好的结果。用训练好的模型对城市道路的车辆和行人进行检测;
[0009]进一步的所述,步骤(1)包括以下步骤:
[0010]在公开的城市道路上乘坐出租车或者乘坐私家车在固定机位拍摄道路上行人和车辆的照片来模仿自动驾驶过程中拍摄车辆或者行人。拍摄完毕后检查数据集,将不清晰的图片和图片里不含有行人或车辆的数据集进行剔除。
[0011]进一步的所述,步骤(2)中包括以下步骤:
[0012]将拍摄好的数据集取一部分进行图像的模糊处理,以此来模仿天气状况差时拍摄到的道路上的行人和车辆的状况。图片处理完毕后给图片进行编号,方便在处理数据集的时候进行增删改查。将处理好并编好号的数据集使用LabelImg标注工具进行图片的标注,如果标注目标为汽车则标注为car,如果标注目标为行人则标注为people。标注完成后会生成xml文件,最后使用python脚本再将xml文件转为YOLOv5模型可以识别的txt文件。
[0013]进一步的所述,步骤(3)中包括以下步骤:
[0014]使用python脚本将数据集划分为训练集、测试集和验证集,比例为8:1:1。
[0015]进一步的所述,步骤(4)中包括以下步骤:
[0016](4

1)使用k

means聚类算法计算出适合该模型的anchor boxes,并将新得到的anchor boxes替换掉原来的anchor boxes。
[0017](4

2)将CBAM注意力机制添加到YOLOv5模型中,CBAM是一种轻量级的注意力机制,具有很强的通用性,CBAM包括两个独立的子模块,有通道注意力模块和空间注意力模块(Channel Attention Module和Spatial Attention Module),这样可以节约参数和计算力,能够直接应用到现有的网络架构中,CBAM注意力机制的步骤主要有:
[0018](4
‑2‑
1)通道注意力模块:首先维度为C*H*W的特征图分别从基于宽和高的全局最大池化和全局平均池化得到维度为C*1*1的特征图,再将它们分别送入一个神经网络(MLP),这个神经网络有两层,第一层神经元个数为其中r为减少率,激活函数为ReLU激活函数,第二层的神经元个数为C,然后将MLP输出的特征基于element

wise进行加和操作(其中element

wise是各向量或矩阵之间对应元素相计算的操作,包括加减乘除),然后再经过sigmoid激活操作,生成通道注意力特征即,最后将和前面输入的特征图进行element

wise乘法操作就可以生成空间注意力模块所需要的输入特征。通道注意力特征的公式如下:
[0019]M
C
(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F)))
[0020](4
‑2‑
2)空间注意力模块:将通道注意力模块中输出特征作为空间注意力模块的输入特征图,基于channel对输入特征图做一个全局最大池化和全局平均池化,得到两个维度为1*H*W的特征图,然后基于channel将这两个特征图做concat操作,随后通过一个维度为7*7的卷积操作将concat得到的特征图维度降为1*H*W,再通过sigmoid激活函数生成空间注意力特征即,最后将此模块的输入特征与通过该模块最后生成的空间注意力特征进行element

wise乘法操作生成最后的特征。空间注意力特征公式如下:
[0021]M
s
(F)=σ(f7×7([AvgPool(F);(MaxPool(F)]))
[0022](4

3)本模型采用EIOU Loss代替原模型的CIOU Loss,加速了收敛,提高了回归的精度。EIOU Loss的计算公式为:
[0023][0024]其中,b和b
gt
分别为预测边界框和真实边界框中心点的坐标,w和w
gt
分别为预测边界框的宽度和真实边界框的宽度,h和h
gt
分别为预测边界框的高度和真实边界框的高度,w
c<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5模型的检测行人车辆的方法,其特征在于,包括以下步骤:步骤1、在城市道路上乘坐出租车或私家车在副驾驶位固定机位拍摄道路上行人车辆的图片形成本次模型要训练和检测的数据集;步骤2、处理数据集,并对准备好的数据集使用标注工具进行标注;步骤3、划分数据集,将数据集分为训练集、测试集、验证集;步骤4、改进网络,使用k

means聚类方法对已经标注完毕的数据集中的目标框进行聚类分析得到适合该数据集的先验框尺寸,给网络添加CBAM注意力机制,更换模型的损失函数,将主干网络中C3模块全部替换为C3Ghost模块;步骤5、训练网络,将步骤4改进好的网络进行训练,并保存训练好的结果,将训练好的模型部署到车上对城市道路的车辆和行人进行检测。2.根据权利要求书1所述的一种基于改进YOLOv5模型的检测行人车辆的方法,其特征在于,在步骤1中,在公开的城市道路上乘坐出租车或者乘坐私家车在固定机位拍摄道路上行人和车辆的照片来模仿自动驾驶过程中拍摄车辆或者行人,拍摄完毕后检查数据集,将不清晰的图片和图片里不含有行人或车辆的数据集进行剔除。3.根据权利要求书1所述的一种基于改进YOLOv5模型的检测行人车辆的方法,其特征在于,在步骤2中,将拍摄好的数据集取一部分进行图像的模糊处理,以此来模仿天气状况差时拍摄到的道路上的行人和车辆的状况,图片处理完毕后给图片进行编号,方便在处理数据集的时候进行增删改查,将处理好并编好号的数据集使用LabelImg标注工具进行图片的标注完成数据集的处理。4.根据权利要求书1所述的一种基于改进YOLOv5模型的检测行人车辆的方法,其特征在于,在步骤3中,使用python脚本将数据集划分为训练集、测试集和验证集。5.根据权利要求书1所述的一种基于改进YOLOv5模型的检测行人车辆的方法,其特征在于,在步骤4中,改进网络,改进网络包括:(1)使用k

means聚类算法计算出适合该模型的anchor boxes,并将新得到的anchor boxes替换掉原来的anchor boxes;(2)将CBAM注意力机制添加到YOLOv5模型中,CBAM是一种轻量级的注意力机制,具有很强的通用性,CBAM包括两个独立的子模块,有通道注意力模块和空间注意力模块(ChannelAttention Module和SpatialAttention Module),这样可以节约参数和计算力,能够直接应用到现有的网络架构中,CBAM注意力机制的步骤主要有:(2

1)通道注意力模块:首先维度为C*H*W的特征图分别从基于宽和高的全局最大池化和全局平均池化得到维度为C*1*1的特征图,再将它们分别送入一个神经网络(MLP),这个神经网络有两层,第一层神经元个数为其中r为减少率,激活函数为ReLU激活函数,第二层的神经元个数为C,然后将MLP输出的特征基于element

wise进行加和操作(其中element

wise是各向量或矩阵之间对应元素相计算的操作,包括加减乘除),然...

【专利技术属性】
技术研发人员:郭浩宇赵环宇刘伟赵延波华尚
申请(专利权)人:淮阴工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1