【技术实现步骤摘要】
本专利技术涉及图像处理,尤其是涉及一种改进的yolov5行人检测方法、系统及存储介质。
技术介绍
1、当前,随着深度学习、神经网络和卷积神经网络技术的发展,机器视觉领域取得了突破性进展。它们被广泛应用于图像处理、视频监控和自动驾驶等领域。行人目标识别是机器视觉领域中的一个重要应用,它可以用来检测或跟踪行人,为无人驾驶系统提供准确的位置信息,以及为安全监控系统提供报警信息等。
2、卷积神经网络(cnn)是目前应用最广泛的深度学习模型,如vgg、goolenet、resnet、mobilenet以及fcn、u-net等都是经典的cnn模型,用于目标检测或图像分割。目前主流的目标检测算法主要分为两类:一阶段检测算法和二阶段检测算法。前者以rcnn系列为代表,主要包括fast r-cnn、faster r-cnn、r-fcn和libra r-cnn,后者以yolo系列算法和ssd等算法为代表。一阶段算法具有速度快,易于部署等优点,故本文研究对象为一阶段算法。
3、同时,最初用于为自然语言处理的transformer模型也
...【技术保护点】
1.一种改进的Yolov5行人检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的改进的Yolov5行人检测方法,其特征在于,在步骤L2中,所述改进的Yolov5目标检测模型包括Backbone数据处理层、Neck数据处理层和Head数据处理层,所述Backbone数据处理层包括Conv模块、C3-Transformer模块和SPPF模块,所述Conv模块由Convolution、Batch Normalization和SiLu激活函数组成,所述C3-Transformer模块包括C3单元和Transformer单元,所述SPPF模块用于行人图像
...【技术特征摘要】
1.一种改进的yolov5行人检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的改进的yolov5行人检测方法,其特征在于,在步骤l2中,所述改进的yolov5目标检测模型包括backbone数据处理层、neck数据处理层和head数据处理层,所述backbone数据处理层包括conv模块、c3-transformer模块和sppf模块,所述conv模块由convolution、batch normalization和silu激活函数组成,所述c3-transformer模块包括c3单元和transformer单元,所述sppf模块用于行人图像数据集的局部特征和全局特征的融合。
3.根据权利要求2所述的改进的yolov5行人检测方法,其特征在于,所述transformer单元包括输入子单元、encoder子单元、decoder子单元和输出子单元,所述输入子单元通过input embedding layer转化为vector,再将生成的vector加上一个positional encoding进入encoder子单元,所述encoder子单元包括self-attention网络和前馈神经网络。
4.根据权利要求3所述的改进的yolov5行人检测方法,其特征在于:所述self-atttention网络为根据当前节点获取全文的语义信息,建立注意力函数q,
5.根据权利要求4所述的改进的...
【专利技术属性】
技术研发人员:胡谦,王科未,吴云龙,熊迹,杨文娟,朱晓明,储希凯,石志奇,甘浩林,王丽佳,
申请(专利权)人:东风悦享科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。