【技术实现步骤摘要】
基于注意力机制和GSConv的YOLOv5行人检测方法
[0001]本专利技术涉及目标检测
,特别涉及基于注意力机制和GSConv的YOLOv5行人检测方法。
技术介绍
[0002]行人检测可定义为判断输入图片或视频帧是否包含行人,如果有将其检测出来,一般用矩形框做出标记。行人检测的性能受到光照变化,遮挡,背景复杂以及行人姿态,尺度多变等因素的影响,一直是计算机视觉研究中的热点和难点。现如今,被广泛应用在智能交通系统、医疗、自动驾驶技术等生活中的各个领域。
[0003]传统的行人检测方法是利用手工提取特征并通过分类器进行训练,最经典的传统行人检测算法为,2005年Da l a l等提出的提取方向梯度直方图(H i stogram of or i ented grad i ent,HOG)特征送入支持向量机(support vector mach i nes,SVM)进行分类的方法。但该类方法太过依赖人为提取特征,计算量巨大,并且会产生冗余的标记窗口,因此检测精度和速度都无法满足要求。
[0004]基于深 ...
【技术保护点】
【技术特征摘要】
1.一种基于注意力机制和GSConv的YOLOv5行人检测方法,其特征在于:采用YOLOv5网络,YOLOv5主要由输入端(Input)、主干网络(Backbone)、颈部网络(Neck)、检测端(Head)四个部分组成,Input为图像预处理阶段,Backbone为提取特征阶段,Neck为特征融合阶段,Head对图像特征进行预测,生成边界框和并预测类别;在YOLOv5中依次引入CA注意力机制、GSConv模块和CoT模块。2.根据权利要求1所述的基于注意力机制和GSConv的YOLOv5行人检测方法,其特征在于:将Backbone中的C3模块替换为改进的C3CA2模块,并将CA注意力机制加入Neck网络23层后,将Neck中的Conv替换为改进的GSConv,将CoT模块融合C3模块形成CoT3模块,再将Neck网络最后一层的C3模块替换为CoT3模块。3.根据权利要求2所述的基于注意力机制和GSConv的YOLOv5行人检测方法,其特征在于:CA注意力机制的实现过程为将输入特征图分为宽度(W)和高度(H)两个方向沿着X轴和Y轴进行全局平均池化(AvgPool),分别获得在宽度和高度两个方向的特征图z
h
和z
w
,接着将这两个特征图拼接(Concat)在一起,之后将它们送入Conv2d的卷积模块,将其维度降低为原来的C/r,然后将经过批量归一化处理的特征图F1送入Sigmoid激活函数得到形如1
×
(W+H)
×
C/r的特征图f,接着将特征图f按照原来的H和W进行卷积核为Conv2d的卷积,分别得到通特征图F
h
和F
w
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。