一种基于改进YOLOv4的遮挡行人实时检测方法技术

技术编号：33020208 阅读：7 留言：0更新日期：2022-04-15 08:53

本发明专利技术涉及一种基于改进YOLOv4的遮挡行人实时检测方法，属于计算机视觉领域。该方法包括：获取数据集并对其处理；使用K_means++算法进行聚类，生成最终的先验框；利用主干特征网络融合通道注意力机制进行特征提取；利用空间金字塔SPP模块对主干特征网络提取的特征图进行最大池化并合并；将主干特征网络中大残差块获取的后四层特征图进行特征融合处理；将特征融合后的特征图通过YOLO检测头进行结果预测，对目标位置和类别进行预测，利用损失函数训练模型；将模型训练生成的最优权重用于模型中，将测试集图片放入模型中进行测试。本发明专利技术实现了实时对遮挡行人的高精度检测，使用参数少，检测速度快。检测速度快。检测速度快。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进YOLOv4的遮挡行人实时检测方法

[0001]本专利技术属于计算机视觉
，涉及一种针对复杂场景下对遮挡行人的检测方法。

技术介绍

[0002]随着深度学习的不断发展，引领着目标检测领域快速地发展。行人检测作为目标检测领域的一个重要方向，随着智能监控、智能交通等应用领域的发展，使得行人检测也逐渐成为计算机领域中一个具有重要研究价值和研究意义的课题。由于应用领域场景的需求，准确、实时的行人检测中是非常有必要的。
[0003]传统行人检测方法是建立在手工制作特征和浅层可训练架构上的，采用从目标检测器和场景分类器中结合量低水平图像特征和高水平语义信息来构建成复杂的系统。传统目标检测方法取得了一定的成果，但也暴露了其固有的弊端。传统的目标检测算法由于鲁棒性不好，泛化性差，繁杂的算法步骤导致检测效率慢、精度不高的检测方法已经难以满足人们对目标检测高性能效果的需求。随着深度学习在目标检测领域的发展，基于深度学习的目标检测已成为主流检测算法。主流的目标检测算法主要分为双阶段检测算法和单阶段检测算法。双阶段检测算法是以R
‑
CNN为代表的基于候选区域的目标检测算法，主要包括R
‑
CNN、Fast R
‑
CNN、Faster R
‑
CNN。该检测算法通常分为两步：第一步是从图像中提取建议框，并剔除一部分背景建议框，同时做一次位置修正；第二步是对每个建议框进行检测分类和位置修正。该类算法在一定程度上提升了目标检测的准确率，但在检测速度上不能...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv4的遮挡行人实时检测方法，其特征在于，该方法具体包括以下步骤：S1：获取数据集，并将其划分为训练集、验证集和测试集，同时使用数据增强手段和图片拼接技术对数据集进行处理；S2：对数据集中标记的真实框使用K_means++算法进行聚类，获得12个聚类中心作为模型先验框中心点使用，生成最终的先验框；S3：利用主干特征网络融合通道注意力机制进行特征提取；S4：利用空间金字塔SPP模块对主干特征网络提取的特征图进行最大池化，并将池化后的结果进行合并；S5：将主干特征网络中大残差块获取的后四层特征图进行特征融合处理；S6：将步骤S5特征融合后的四层特征图通过四个不同尺寸大小的YOLO检测头进行结果预测，对目标位置和类别进行预测，利用损失函数训练模型；S7：将模型训练生成的最优权重用于模型中，将测试集图片放入模型中进行测试，获得最终的检测结果。2.根据权利要求1所述的基于改进YOLOv4的遮挡行人实时检测方法，其特征在于，步骤S3具体包括：利用CSPdarkNet53主干特征提取网络对输入图片进行特征提取；其中，CSPdarknet53由5个CSPNet结构的大残差块即CSP块堆叠而成，在每个CSP块中加入通道注意力模块；进行特征提取：从第二个CSP块到第四个CSP块获得的特征图对应为P2、P3、P4、P5。3.根据权利要求2所述的基于改进YOLOv4的遮挡行人实时检测方法，其特征在于，步骤S5具体包括：将步骤S4获得的特征图与P2、P3、P4，通过改进的PANet网络进行特征的融合处理；其中，改进的PANet网络是将PANet中的五层堆叠卷积替换为Res_C模块，Res_C模块中引入CBAM注意力机制和基本残差网络，同时将模块中3
×
3标准卷积替换为深度可分离卷积。4.根据权利要求1所述的基于改进YOLOv4的遮挡行人实时检测方法，其特征在于，步骤S6中，四个不同尺寸大小的YOLO检测头具体为：设输入图片尺寸N*N，通道数为3，各分支分别输出(M*M*(4+1+C))，N为输入图片尺寸，M为不同尺度的特征层预测的结果，...

【专利技术属性】
技术研发人员：梁燕，朱清，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人