基于GSConv+VOV-GSCSP的改进YOLOv8密集行人检测方法技术

技术编号：41310449 阅读：4 留言：0更新日期：2024-05-13 14:54

本发明专利技术公开了基于GSConv+VOV‑GSCSP的改进YOLOv8密集行人检测方法，步骤如下：首先使用公开数据集WiderPerson，对WiderPerson数据集划分成训练集，测试集和验证集；然后将原YOLOv8算法进行改进和优化为GSConv+VOVG‑SCSP的检测方法；再然后搭建改进的YOLOv8检测方法网络模型，利用数据集训练目标检测模型，获得密集行人检测模型；最后选取人流密集的实时视频流接入模型进行检测，根据检测结果分析和处理结果，引用注意力机制和dropout正则化技术对网络模型进行优化，降低过拟合和网络复杂度，提高行人检测的准确性和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉，具体为基于gsconv+vov-gscsp的改进yolov8密集行人检测方法。

技术介绍

1、行人检测是计算机视觉(computervision，cv)领域中一个极为重要的研究方向之一，用视觉模型去检测物体。随着计算机视觉技术的迅猛发展和深度学习算法的广泛应用，行人检测作为一项重要的计算机视觉任务受到了广泛的关注和研究。行人检测在众多领域中扮演着重要的角色，例如智能交通、视频监控和自动驾驶等，不仅能够实时提供行人的位置信息，还能为交通安全、行为分析和环境感知等应用提供基础数据。

2、1.在深度学习方法兴起之前，传统的行人检测方法主要基于计算机视觉中的图像处理和机器学习技术。其中包括：基于特征提取和分类器的方法：这种方法首先从图像中提取行人的特征，例如颜色、纹理、形状等。然后使用分类器，如支持向量机(svm)、adaboost等，对提取到的特征进行分类，判断其是否为行人。

3、2.histogram of oriented gradients(hog):hog是一种基于局部梯度方向统计的特征描述子。它通过计算图像局部区域的梯度方向直方图来表示行人的特征。通常结合支持向量机(svm)分类器进行行人检测。

4、3.sift是一种基于尺度不变特征的算法，它通过检测图像中的关键点，并提取描述这些关键点的局部特征描述子。sift可以用于行人检测中的关键点检测和特征匹配。

5、4.基于统计形状模型的行人检测方法通常通过建立行人形状的统计模型来实现检测。这些模型可以是基于

6、然而，传统的统计模型方法在复杂场景、遮挡和姿态变化等方面存在一定的局限性。这些方法通常需要手工提取特征，并且对于复杂场景和遮挡情况的处理有限。随着深度学习的兴起，基于深度学习的方法通过学习大量数据的特征表示和模式，能够自动提取图像中的高级语义信息，从而提高行人检测的准确性和鲁棒性。深度学习方法如卷积神经网络(convolutional neural networks，cnn)、目标检测网络(如ssd、yolo)等已成为行人检测领域的主流方法。它们能够端到端地学习图像特征和进行行人分类，具有更好的性能和适应性。

7、在目标检测方法中，通常可以划分为两大类：单阶段(one-stage)和双阶段(two-stage)方法。单阶段目标检测方法将目标检测任务视为一个回归问题，直接从输入图像中预测目标的类别和位置。其中，代表性的方法是yolo(you only look once)。yolo将图像划分为网格，并在每个网格单元中预测目标的类别和位置。这种方法具有较快的检测速度，但可能在目标小尺寸或密集场景下精度稍低。双阶段目标检测方法将目标检测任务划分为两个独立的阶段：候选区域生成和目标分类与精确定位。代表性的方法包括rcnn(region-based convolutional neural networks)和faster r-cnn。这些方法首先生成候选区域，然后对这些候选区域进行目标分类和位置精确定位。相比于单阶段方法，双阶段方法通常具有更高的检测精度，但速度稍慢。随着深度学习方法的发展和卷积神经网络的广泛应用，出现了许多不同的行人检测技术和模型，如faster r-cnn、yolo、ssd等。这些方法在行人检测任务中具有各自的优势和特点，例如准确性、速度和适应性。研究人员根据具体应用场景和需求，可以选择合适的方法来实现行人检测任务。

技术实现思路

1、为解决上述技术问题，本专利技术提出了基于gsconv+vovgscsp的改进yolov8密集行人检测方法，能够有效提高检测的速度、精确度和适应性。

2、为实现上述目的，本专利技术采取的技术方案是：

3、基于gsconv+vovgscsp的改进yolov8密集行人检测方法，其特征在于：包括如下步骤

4、s1：使用公开数据集widerperson，对widerperson数据集划分成训练集、测试集和验证集；

5、s2：所述yolov8包括主干网络、c2f模块、检测头以及颈部模块，

6、改进yolov8，具体为：在yolov8中c2f模块的backbone层用gsconv替代两个标准卷积,在颈部模块层用vov-gscsp去代替颈部模块层的所有c2f模块；

7、s3：在backbone层的sppf模块最后增加cbam注意力机制；

8、s4：引入dropout正则化，dropout正则化的数学公式如下：

9、r＝bernoulli(p,n)(1)

10、h＝r⊙a(2)

11、其中：r是一个大小为n的二值随机向量，表示从伯努利分布中以概率p进行采样得到的二值向量，a是原始输入向量，表示从上一层传递过来的激活值；

12、s5：搭建改进yolov8检测方法网络模型，利用数据集训练目标检测模型，获得密集行人检测模型，选取人流密集的实时视频流接入模型进行检测，根据检测结果分析和处理结果，引用cbam注意力机制和dropout正则化对网络模型进行优化；

13、s6：获取指标数据，进行实验对比。

14、作为本专利技术的优选技术方案：在步骤s1中，widerperson数据集包含13382张图片，有1000个验证集，4380个测试集，8000个训练集组成。

15、作为本专利技术的优选技术方案：在步骤s2中，

16、主干网络：yolov8使用darknet-53作为主干网络，darknet-53是一个包含53个卷积层的网络，用于提取图像特征，

17、检测头：yolov8的检测头使用组合的损失函数，包括分类的二元交叉熵和回归的ciou，用于物体类别分类和边界框回归，

18、颈部模块：yolov8使用pan-fpn作为颈部模块，用于特征融合和利用不同尺度上的特征层信息，颈部模块包括了多个c2f模块和最终的解耦头部结构。

19、作为本专利技术的优选技术方案：在步骤s2中，

20、首先，使用轻量级卷积方法gsconv来代替standard conv，然后，在gsconv的基础上继续引入gsbottleneck，同样，使用一次性聚合方法来设计跨级部分网络模块vov-gscsp，最后，使用vov-gscsp代替颈部模块层的所有c2f模块。

21、作为本专利技术的优选技术方案：在步本文档来自技高网...

【技术保护点】

1.基于GSConv+VOV-GSCSP的改进YOLOv8密集行人检测方法，其特征在于：包括如下步骤S1：使用公开数据集WiderPerson，对WiderPerson数据集划分成训练集、测试集和验证集；

2.根据权利要求1所述的基于GSConv+VOV-GSCSP的改进YOLOv8密集行人检测方法，其特征在于：在步骤S1中，widerperson数据集包含13382张图片，有1000个验证集，4380个测试集，8000个训练集组成。

3.根据权利要求1所述的基于GSConv+VOV-GSCSP的改进YOLOv8密集行人检测方法，其特征在于：在步骤S2中，

4.根据权利要求1所述的基于GSConv+VOV-GSCSP的改进YOLOv8密集行人检测方法，其特征在于：在步骤S2中，

5.根据权利要求1所述的基于GSConv+VOV-GSCSP的改进YOLOv8密集行人检测方法，其特征在于：在步骤S3中，所述CBAM注意力机制由两个子模块组成分别为通道注意力模块和空间注意力模块，

6.根据权利要求1所述的基于GSConv+VO

...

【技术特征摘要】

1.基于gsconv+vov-gscsp的改进yolov8密集行人检测方法，其特征在于：包括如下步骤s1：使用公开数据集widerperson，对widerperson数据集划分成训练集、测试集和验证集；

2.根据权利要求1所述的基于gsconv+vov-gscsp的改进yolov8密集行人检测方法，其特征在于：在步骤s1中，widerperson数据集包含13382张图片，有1000个验证集，4380个测试集，8000个训练集组成。

3.根据权利要求1所述的基于gsconv+vov-gscsp的改进yolov8密集行人检测方法，其特征在于：在步骤s2中，

4.根据权利要求1所...

【专利技术属性】
技术研发人员：曾岳，张千龙，
申请(专利权)人：金陵科技学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人