一种基于改进YOLOv5模型的检测行人车辆的方法技术

技术编号：38647179 阅读：12 留言：0更新日期：2023-09-02 22:38

本发明专利技术公开了一种基于改进YOLOv5模型的检测行人车辆的方法，包括以下步骤：在城市道路上乘坐出租车或私家车在副驾驶位固定机位拍摄道路上行人车辆的图片，选择白天和黑夜分别对城市道路上的行人和车辆数据进行拍摄。将部分不包含行人和车辆的图片以及模糊不清的图片进行剔除。将拍摄完并处理好的图片放入文件夹中用图片标注工具进行图片的标注。将标注的数据集分类为训练集、检测集、测试集。对已经标注完毕的数据集中的目标框使用k

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进YOLOv5模型的检测行人车辆的方法

[0001]本专利技术属于目标检测领域，涉及一种基于改进YOLOv5模型的检测行人车辆的方法。

技术介绍

[0002]目前，计算机视觉领域的目标检测算法已经不断取得了较大的进展，其中，基于深度学习的目标检测方法已经成为了当前较流行的技术之一。目前主要的检测算法分为两阶段检测算法和单阶段检测算法，虽然两阶段检测算法的精度比较高，应用也比较广泛，但是由于检测速度相对于单阶段检测算法来说比较慢一些，而YOLO系列算法作为单阶段算法的代表算法之一，是一种高效的目标检测算法，广泛被应用于工业领域、安防领域等多个领域。YOLOv5模型主要基于深度学习技术，即基于卷积神经网络(CNN)的目标检测算法。这种算法通过学习大量带标注的图像数据，构建出一个深度学习模型，从而实现对图像中目标的检测任务。目标检测算法的核心是对输入的图像进行有效的特征提取，因此图像处理技术在目标检测中也扮演着重要角色。YOLOv5模型是一种高效的目标检测算法，其采用了轻量化的卷积神经网络结构，能够在较小的运算量和内存消耗下实现较高的检测精度，因此被广泛应用于各个领域。改进YOLOv5模型的检测行人车辆的方法基于YOLOv5算法，通过对算法进行改进，提高了其对行人车辆的检测精度和减少了错误识别的可能性。当自动驾驶车辆行驶在道路上时，YOLOv5模型可以实时地检测图像或摄像头中出现的行人和车辆，帮助车辆做出相应的决策，比如避让或者变道，此模型可以应用在自动驾驶领域帮助自动驾驶车辆更加准确的感知道路交通的情况从而更好...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5模型的检测行人车辆的方法，其特征在于，包括以下步骤：步骤1、在城市道路上乘坐出租车或私家车在副驾驶位固定机位拍摄道路上行人车辆的图片形成本次模型要训练和检测的数据集；步骤2、处理数据集，并对准备好的数据集使用标注工具进行标注；步骤3、划分数据集，将数据集分为训练集、测试集、验证集；步骤4、改进网络，使用k
‑
means聚类方法对已经标注完毕的数据集中的目标框进行聚类分析得到适合该数据集的先验框尺寸，给网络添加CBAM注意力机制，更换模型的损失函数，将主干网络中C3模块全部替换为C3Ghost模块；步骤5、训练网络，将步骤4改进好的网络进行训练，并保存训练好的结果，将训练好的模型部署到车上对城市道路的车辆和行人进行检测。2.根据权利要求书1所述的一种基于改进YOLOv5模型的检测行人车辆的方法，其特征在于，在步骤1中，在公开的城市道路上乘坐出租车或者乘坐私家车在固定机位拍摄道路上行人和车辆的照片来模仿自动驾驶过程中拍摄车辆或者行人，拍摄完毕后检查数据集，将不清晰的图片和图片里不含有行人或车辆的数据集进行剔除。3.根据权利要求书1所述的一种基于改进YOLOv5模型的检测行人车辆的方法，其特征在于，在步骤2中，将拍摄好的数据集取一部分进行图像的模糊处理，以此来模仿天气状况差时拍摄到的道路上的行人和车辆的状况，图片处理完毕后给图片进行编号，方便在处理数据集的时候进行增删改查，将处理好并编好号的数据集使用LabelImg标注工具进行图片的标注完成数据集的处理。4.根据权利要求书1所述的一种基于改进YOLOv5模型的检测行人车辆的方法，其特征在于，在步骤3中，使用python脚本将数据集划分为训练集、测试集和验证集。5.根据权利要求书1所述的一种基于改进YOLOv5模型的检测行人车辆的方法，其特征在于，在步骤4中，改进网络，改进网络包括：(1)使用k
‑
means聚类算法计算出适合该模型的anchor boxes，并将新得到的anchor boxes替换掉原来的anchor boxes；(2)将CBAM注意力机制添加到YOLOv5模型中，CBAM是一种轻量级的注意力机制，具有很强的通用性，CBAM包括两个独立的子模块，有通道注意力模块和空间注意力模块(ChannelAttention Module和SpatialAttention Module)，这样可以节约参数和计算力，能够直接应用到现有的网络架构中，CBAM注意力机制的步骤主要有：(2
‑
1)通道注意力模块：首先维度为C*H*W的特征图分别从基于宽和高的全局最大池化和全局平均池化得到维度为C*1*1的特征图，再将它们分别送入一个神经网络(MLP)，这个神经网络有两层，第一层神经元个数为其中r为减少率，激活函数为ReLU激活函数，第二层的神经元个数为C，然后将MLP输出的特征基于element
‑
wise进行加和操作(其中element
‑
wise是各向量或矩阵之间对应元素相计算的操作，包括加减乘除)，然...

【专利技术属性】
技术研发人员：郭浩宇，赵环宇，刘伟，赵延波，华尚，
申请(专利权)人：淮阴工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人