行人检测方法技术

技术编号:23446462 阅读:128 留言:0更新日期:2020-02-28 20:28
本发明专利技术提供了一种行人检测方法,本发明专利技术用以解决现有用以解决现有技术中实时性低、多尺度问题检测性能相对较差的问题。特征融合模块的应用使特征图在语义上具有较强的鲁棒性;预测模块中空间注意力机制的应用增强了模型对行人目标的位置检测能力。本发明专利技术提供的基于自上而下语义聚合注意力机制的行人检测方法,能在在提高检测准确度的同时提高模型对多尺度目标的检测能力。

Pedestrian detection method

【技术实现步骤摘要】
行人检测方法
本专利技术涉及一种行人检测方法。
技术介绍
在智能监控、车辆辅助驾驶、智能机器等方面,行人检测具有广泛的应用。行人检测在公共安全监管中起到了重要作用。行人检测技术是利用计算机视觉技术判断静态图像或动态视频中是否存在行人并定位行人的位置信息。其中行人检测主要分为两大方式:一种是基于滑动窗口的传统的行人检测方法,一种是基于深度学习提取特征的行人检测方法。传统的行人计算方法具有较大的计算量并且没有使用GPU加速。基于深度学习特征提取的行人检测方法学到的特征具有很强层次表达能力和很好的鲁棒性,可以更好的解决一些视觉问题。然而现有的行人检测方法在解决多尺度问题中表现欠佳。
技术实现思路
本专利技术的目的在于提供一种行人检测方法。为解决上述问题,本专利技术提供一种行人检测方法,包括:步骤S1,将利用多种尺度行人数据集中的训练图像X输入至行人检测模型的特征提取模块,提取出训练图像的特征图Y;步骤S2,将所述训练图像的特征图Y输入至人检测模型的特征融合模块,使人检测模型的较高层的抽象特征反馈至较本文档来自技高网...

【技术保护点】
1.一种行人检测方法,其特征在于,包括:/n步骤S1,将利用多种尺度行人数据集中的训练图像X输入至行人检测模型的特征提取模块,提取出训练图像的特征图Y;/n步骤S2,将所述训练图像的特征图Y输入至人检测模型的特征融合模块,使人检测模型的较高层的抽象特征反馈至较低层,并使较高层与较低层的特征图进行融合,以得到特征图Z;/n步骤S3,将特征融合模块获得的特征信息输入至人检测模型的转移模块,以得到分类特征信息W;/n步骤S4,将所述特征信息W输入至具有空间注意力机制的残差预测模块,以输出行人检测结果;/n步骤S5,基于人检测结果调整所述人检测模型的参数,以得到训练完成的人检测模型;/n步骤S6,将待...

【技术特征摘要】
1.一种行人检测方法,其特征在于,包括:
步骤S1,将利用多种尺度行人数据集中的训练图像X输入至行人检测模型的特征提取模块,提取出训练图像的特征图Y;
步骤S2,将所述训练图像的特征图Y输入至人检测模型的特征融合模块,使人检测模型的较高层的抽象特征反馈至较低层,并使较高层与较低层的特征图进行融合,以得到特征图Z;
步骤S3,将特征融合模块获得的特征信息输入至人检测模型的转移模块,以得到分类特征信息W;
步骤S4,将所述特征信息W输入至具有空间注意力机制的残差预测模块,以输出行人检测结果;
步骤S5,基于人检测结果调整所述人检测模型的参数,以得到训练完成的人检测模型;
步骤S6,将待检测图片输入至训练完成的人检测模型,经过训练完成的人检测模型输出分类特征信息W,将所述特征信息W输入至具有空间注意力机制的残差预测模块,以输出行人检测结果。


2.如权利要求1所述的行人检测方法,其特征在于,将利用多种尺度行人数据集中的训练图像X输入至行人检测模型的特征提取模块,提取出训练图像的特征图Y,包括:
对于给定的训练图像χ∈H′×W′×C′,首先执行训练图像的转换和其中,H、W、C分别表示特征图的高度、宽度、通道数,和由有效的卷积组成,设Wc=[w1,w2,...,wc]和Oc=[o1,o2,...,oc]表示学习的大小分别为3×3和5×5的卷积核集合,其中,Wc和Oc指的是相应的第c个卷积核的参数;
然后,将转换和的输出写为和Uc=[u1,u2,...,uc],其中,



其中,*表示卷积,和χ=[x1,x2,...,xC′].和分别表示wc和oc的单通道的二维空间核;
之后,将转换和的输出结果相加,得到如下结果:



式中,U表示转换和的输出结果相加等到的特征图;
将得到的特征图U输入至特征选择性注意力模块,特征选择性注意力模块使用全局平均池来生成通道统计信息,特征选择性注意力模块输出特征统计量的第c个元素通过以下公式计算:通过将U缩小到其空间维度为H×W来生成特征统计量使得特征统计量的第c个元素通过以下公式计算:



其中,Fga(uc)表示全局平均池操作符;
使用具有参数T1和缩减率r的维度降低层,ReLU层和具有参数T2的维度增加层,完全连接的层用于降维层和维度增加层,通道的平均注意力计算为:



其中,s∈C,δ为ReLU函数,
然后,将特征图U输入至空间注意力模块,首先进行两个变换Hmean:和Hmax:U→V∈H×W×1,其中,Hmean和Hmax指的分别是沿相应通道轴的全局平均池化和全局最大池化操作;
将两个变换获得的特征图和v连接在一起以创建空间注意力图M′∈H×W×2:



其中,cat表示拼接函数;
然后,通过大小为7×7的卷积核对空间注意力图M′进行卷积以产生2D空间注意力图M″∈H×W:
M″=F7×7(cat(Hmean(U),Hmax(U)))(1.6),
其中,F7×7表示卷积核大小为7×7的卷积运算;
在生成的2D空间注意力图M″基础上,生成多维空间注意图M∈H×W×C:
M=F1×1(F7×7(cat(Hmean(U),Hmax(U))))(1.7)...

【专利技术属性】
技术研发人员:杨振坤马向华方爽赵阳
申请(专利权)人:上海应用技术大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1