当前位置: 首页 > 专利查询>扬州大学专利>正文

一种基于yolov5的行人检测方法技术

技术编号:32888971 阅读:78 留言:0更新日期:2022-04-02 12:27
本发明专利技术公开了一种基于yolov5的行人检测方法,包括,利用主干特征提取网络对输入端输入的数据进行特征提取;将提取的所述特征输入特征加强网络进行加强;结合预测层预测目标框,输出得到检测结果;本发明专利技术通过更改网络结构,减少参数,提升运行速度,达到更好的实时性。性。性。

【技术实现步骤摘要】
一种基于yolov5的行人检测方法


[0001]本专利技术涉及行人检测
,尤其是一种基于yolov5的行人检测方法。

技术介绍

[0002]YOLO(You OnlyLook Once)是Joseph Redmon,Ali Farhadi等人在2015年提出的一种高速目标检测方法,至今已经发展出了YOLOv1,YOLO9000,以及YOLOv3,YOLOv4,YOLOv5等几个版本,而在保持高精度的情况下YOLOv5的检测速度仍可以达到140fps,是相对目前所有方法来说,速度最快的。在YOLO被提出之前,就已经有较成熟的R

CNN系列算法了,这些算法都是基于区域提议和位置回归两个步骤完成的,虽然Faster R

CNN提出使用RPN进行区域提议后,检测的速度提升了不少(可达到5fps),但仍然无法应用到视频实时检测中。为了提升速度,减少计算量,YOLO使用单步检测法(one stage预测ion),抛弃了区域提议步骤,将目标检测问题看作是一个回归问题,直接从图像像素信息得到边界框的位置和类别概率。因为没有了区域提议,所以YOLO只需要将原始图片或中间的特征层处理一次即可。

技术实现思路

[0003]本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例,在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围。
[0004]鉴于上述和/或现有技术中所存在的问题,提出了本专利技术。
[0005]因此,本专利技术所要解决的技术问题是现有检测算法存在误检漏检的问题。
[0006]为解决上述技术问题,本专利技术提供如下技术方案:一种基于yolov5的行人检测方法,包括,
[0007]利用主干特征提取网络对输入端输入的数据进行特征提取;
[0008]将提取的所述特征输入特征加强网络进行加强;
[0009]结合预测层预测目标框,输出得到检测结果。
[0010]作为本专利技术所述基于yolov5的行人检测方法的一种优选方案,其中:在特征提取之前需要对数据进行预处理,包括:
[0011]利用马赛克数据增强处理图片;
[0012]通过Focus对图片进行切片操作;
[0013]通道数量乘4。
[0014]作为本专利技术所述基于yolov5的行人检测方法的一种优选方案,其中:所述马赛克数据增强包括,
[0015]将四张图片进行随机裁剪;
[0016]将裁剪后的图片拼接到一张图上作为训练数据。
[0017]作为本专利技术所述基于yolov5的行人检测方法的一种优选方案,其中:所述切片操作包括,
[0018]在一张图片中每隔一个像素拿到一个值,类似于邻近下采样,得到四张图片;
[0019]四张图片互补,将W、H信息集中到通道空间;
[0020]输入通道扩充了4倍,即拼接起来的图片相对于原先的RGB三通道模式变成了12个通道;
[0021]将得到的新图片再经过卷积操作,得到没有信息丢失情况下的二倍下采样特征图。
[0022]作为本专利技术所述基于yolov5的行人检测方法的一种优选方案,其中:所述特征提取包括,
[0023]将1
×
1输出后的特征图按照通道均分n块,每一部分是x
i
,i∈{1,2,3,...,n},每一个x
i
对应一个3
×
3的卷积,由k
i
()表示,y
i
表示k
i
()的输出;
[0024]特征子集x
i
与k
i
‑1()的输出相加,送入k
i
();
[0025]对特征的重复利用,得到不同数量以及不同感受野大小的输出;
[0026]将所有输出进行融合并进行1
×
1的卷积;
[0027][0028]作为本专利技术所述基于yolov5的行人检测方法的一种优选方案,其中:对所述特征进行加强包括,
[0029]FPN高维度向低维度传递语义信息;
[0030]PAN低维度向高维度再传递一次语义信息;
[0031]深层的特征图携带有更强的语义特征,较弱的定位信息;
[0032]浅层的特征图携带有较强的位置信息,和较弱的语义特征。
[0033]作为本专利技术所述基于yolov5的行人检测方法的一种优选方案,其中:还包括,
[0034]所述FPN把深层的语义特征传到浅层,增强多个尺度上的语义表达;
[0035]所述PAN把浅层的定位信息传导到深层,增强多个尺度上的定位能力。
[0036]作为本专利技术所述基于yolov5的行人检测方法的一种优选方案,其中:所述预测目标框包括,
[0037]曼哈顿距离,为两个点之间垂直和水平距离的总和,表示为:
[0038]MH
(u,v)
=|(x1‑
x2)|+|y1‑
y2|
[0039]其中:(x1,y1)为第一个点的坐标值,(x2,y2)为第二个点的坐标值。
[0040]作为本专利技术所述基于yolov5的行人检测方法的一种优选方案,其中:还包括,
[0041]在图像中感兴趣的位置周围形成边界框簇;
[0042]在Confluence中,以任意两个边界框的左上角和右下角坐标的曼哈顿距离作为边界框是否为同一簇的判定标准。
[0043]作为本专利技术所述基于yolov5的行人检测方法的一种优选方案,其中:具体包括:
[0044]进行归一化操作,将坐标缩小到0到1之间,使图像内通过任意两个大的目标边框和任意小的目标边框的关系相比较来区分内边界框和目标间边界框。
[0045]本专利技术的有益效果:本专利技术通过更改网络结构,减少参数,提升运行速度,达到更
好的实时性。
附图说明
[0046]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
[0047]图1为人物模型不全且存在遮挡的情况下的检测结果对比。
[0048]图2为人物模型完全但互相遮挡的情况下的检测结果对比。
[0049]图3为人群拥挤的场景下的检测结果对比。
[0050]图4为Yolov5原模型与yolov5

r2c训练时mAP值的对比图。
具体实施方式
[0051]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本专利技术的具体实施方式做详细的说明。
[0052]在下面的描述中阐述了很多具体细节以便于充分理解本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于yolov5的行人检测方法,其特征在于:包括,利用主干特征提取网络对输入端输入的数据进行特征提取;将提取的所述特征输入特征加强网络进行加强;结合预测层预测目标框,输出得到检测结果。2.根据权利要求1所述的基于yolov5的行人检测方法,其特征在于:在特征提取之前需要对数据进行预处理,包括:利用马赛克数据增强处理图片;通过Focus对图片进行切片操作;通道数量乘4。3.根据权利要求1或2所述的基于yolov5的行人检测方法,其特征在于:所述马赛克数据增强包括,将四张图片进行随机裁剪;将裁剪后的图片拼接到一张图上作为训练数据。4.根据权利要求3所述的基于yolov5的行人检测方法,其特征在于:所述切片操作包括,在一张图片中每隔一个像素拿到一个值,类似于邻近下采样,得到四张图片;四张图片互补,将W、H信息集中到通道空间;输入通道扩充了4倍,即拼接起来的图片相对于原先的RGB三通道模式变成了12个通道;将得到的新图片再经过卷积操作,得到没有信息丢失情况下的二倍下采样特征图。5.根据权利要求4所述的基于yolov5的行人检测方法,其特征在于:所述特征提取包括,将1
×
1输出后的特征图按照通道均分n块,每一部分是x
i
,i∈{1,2,3,...,n},每一个x
i
对应一个3
×
3的卷积,由k
i
()表示,y
i
表示k
i
()的输出;特征子集x
i
与k
i
‑1()的输出相加,送入k
i
...

【专利技术属性】
技术研发人员:朱金荣曹海涛邓小颖张梦侯伍岳张剑云夏长权
申请(专利权)人:扬州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1