一种改进的Yolov5行人检测方法、系统及存储介质技术方案

技术编号:40393985 阅读:43 留言:0更新日期:2024-02-20 22:23
本发明专利技术涉及一种改进的Yolov5行人检测方法、系统及存储介质,所述方法包括:L1.车辆行驶在道路上,基于车载摄像头实时获取道路的图像数据信息,并对目标行人进行标注,输出标注后的行人图像数据集;L2.将所述标注后的行人图像数据集输入改进的Yolov5目标检测模型进行训练和学习,得到训练好的改进的Yolov5目标检测模型;L3.基于所述训练好的改进的Yolov5目标检测模型,输入实时获取的道路图像数据信息,对目标行人进行检测和识别,输出目标行人的检测数据信息。本发明专利技术不仅使网络将注意力重点放到目标区域,提高目标检测精度,而且将不同尺度的浅层特征和深层特征进行融合,使融合后的特征层在拥有丰富的语义信息的同时增强定位信息。

【技术实现步骤摘要】

本专利技术涉及图像处理,尤其是涉及一种改进的yolov5行人检测方法、系统及存储介质。


技术介绍

1、当前,随着深度学习、神经网络和卷积神经网络技术的发展,机器视觉领域取得了突破性进展。它们被广泛应用于图像处理、视频监控和自动驾驶等领域。行人目标识别是机器视觉领域中的一个重要应用,它可以用来检测或跟踪行人,为无人驾驶系统提供准确的位置信息,以及为安全监控系统提供报警信息等。

2、卷积神经网络(cnn)是目前应用最广泛的深度学习模型,如vgg、goolenet、resnet、mobilenet以及fcn、u-net等都是经典的cnn模型,用于目标检测或图像分割。目前主流的目标检测算法主要分为两类:一阶段检测算法和二阶段检测算法。前者以rcnn系列为代表,主要包括fast r-cnn、faster r-cnn、r-fcn和libra r-cnn,后者以yolo系列算法和ssd等算法为代表。一阶段算法具有速度快,易于部署等优点,故本文研究对象为一阶段算法。

3、同时,最初用于为自然语言处理的transformer模型也开始应用到图像领域来本文档来自技高网...

【技术保护点】

1.一种改进的Yolov5行人检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的改进的Yolov5行人检测方法,其特征在于,在步骤L2中,所述改进的Yolov5目标检测模型包括Backbone数据处理层、Neck数据处理层和Head数据处理层,所述Backbone数据处理层包括Conv模块、C3-Transformer模块和SPPF模块,所述Conv模块由Convolution、Batch Normalization和SiLu激活函数组成,所述C3-Transformer模块包括C3单元和Transformer单元,所述SPPF模块用于行人图像数据集的局部特征和全...

【技术特征摘要】

1.一种改进的yolov5行人检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的改进的yolov5行人检测方法,其特征在于,在步骤l2中,所述改进的yolov5目标检测模型包括backbone数据处理层、neck数据处理层和head数据处理层,所述backbone数据处理层包括conv模块、c3-transformer模块和sppf模块,所述conv模块由convolution、batch normalization和silu激活函数组成,所述c3-transformer模块包括c3单元和transformer单元,所述sppf模块用于行人图像数据集的局部特征和全局特征的融合。

3.根据权利要求2所述的改进的yolov5行人检测方法,其特征在于,所述transformer单元包括输入子单元、encoder子单元、decoder子单元和输出子单元,所述输入子单元通过input embedding layer转化为vector,再将生成的vector加上一个positional encoding进入encoder子单元,所述encoder子单元包括self-attention网络和前馈神经网络。

4.根据权利要求3所述的改进的yolov5行人检测方法,其特征在于:所述self-atttention网络为根据当前节点获取全文的语义信息,建立注意力函数q,

5.根据权利要求4所述的改进的...

【专利技术属性】
技术研发人员:胡谦王科未吴云龙熊迹杨文娟朱晓明储希凯石志奇甘浩林王丽佳
申请(专利权)人:东风悦享科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1