【技术实现步骤摘要】
一种基于多尺度注意力机制的行人检测方法及装置
本专利技术涉及计算机图像处理中的行人检测
,特别涉及一种基于多尺度注意力机制的行人检测方法及装置。
技术介绍
行人检测技术是指通过图像处理及模式识别等算法从给定的图像数据中检测出行人坐标位置并给予此检测结果的置信度。行人检测是计算机视觉中一个重要的研究热点,是众多实际应用中核心技术之一,例如,人类行为分析,行人姿态估计,行人属性分析,智能监控,自动驾驶等。因此行人检测技术具有极高的科研价值和商业价值,并有大量的学者从事行人检测算法的研究,众多有效的行人检测的算法被提出来。尽管近几年计算机视觉研究者致力于行人检测的研究中,但是行人检测问题依旧挑战性很大。这主要是因为有两个原因:其一,由于行人与摄像机的距离是不固定的,行人的尺度有很大的变动,距离摄像机近的行人为大尺度行人,反之则称为小尺度行人;其次,在实际环境中,大部分的行人距离摄像机较远,这些小目标的特征不明显,容易被误认为是背景,从而导致大量的漏检和误检。为了获取给定图片中所有行人的坐标,检测器通常有以下三步:第一,对整张图片进行一系列的操作(梯度计算,卷积等) ...
【技术保护点】
1.一种基于多尺度注意力机制的行人检测方法,其特征在于,包括以下步骤:获取输入图像,并将所述输入图像送到深度卷积网络中;通过所述深度卷积网络的行人注意力模块生成小尺度行人解析图和大尺度行人解析图,其中,所述小尺度行人解析图用于凸显小尺度目标,大尺度行人解析图用于凸显大尺度目标;将所述小尺度行人解析图和达到预设辨率的特征图进行元积,以显著化小尺度行人的特征且降低大尺度行人和背景的干扰,并将所述大尺度行人解析图和达到预设语义能力的特征层进行元积,以显著化大尺度行人的特征且平滑背景区域的特征;合并相邻且拥有不同感受野大小的特征图,以获得小目标更丰富的局部和背景信息,且加强检测器对 ...
【技术特征摘要】
1.一种基于多尺度注意力机制的行人检测方法,其特征在于,包括以下步骤:获取输入图像,并将所述输入图像送到深度卷积网络中;通过所述深度卷积网络的行人注意力模块生成小尺度行人解析图和大尺度行人解析图,其中,所述小尺度行人解析图用于凸显小尺度目标,大尺度行人解析图用于凸显大尺度目标;将所述小尺度行人解析图和达到预设辨率的特征图进行元积,以显著化小尺度行人的特征且降低大尺度行人和背景的干扰,并将所述大尺度行人解析图和达到预设语义能力的特征层进行元积,以显著化大尺度行人的特征且平滑背景区域的特征;合并相邻且拥有不同感受野大小的特征图,以获得小目标更丰富的局部和背景信息,且加强检测器对小目标的鲁棒性;以及通过经过注意力机制以及特征合并模块得到的最终特征图进行行人检测,并获取行人检测结果。2.根据权利要求1所述的基于多尺度注意力机制的行人检测方法,其特征在于,所述小尺度目标为高度小于120像素的行人。3.根据权利要求1所述的基于多尺度注意力机制的行人检测方法,其特征在于,还包括:去除所有全连接层以及分类层,并在卷积神经网络后面增加卷积层,其中,神经网络由所述卷积层和池化层组成,使得其特征层的感受野随着网络深度逐渐变大而分辨率逐渐下降,以运用不同感受野与分辨率的特征层去检测不同尺度的行人。4.根据权利要求3所述的基于多尺度注意力机制的行人检测方法,其特征在于,还包括:在所述卷积层增加所述行人注意力模块,所述行人注意力模块由一个池化层和三个稠密卷积层组成,并且使用反卷积操作以获得同输入图片同样大小的两张行人解析图。5.根据权利要求1-4任一项所述的基于多尺度注意力机制的行人检测方法,其特征在于,还包括:采用以下多任务目标函数来训练所述深度卷积神经网络:L=Lconf+λlLloc+λmLmask,其中其中,N为检测框的数目,xij表示第i个检测框是否与第j个真实行人框位置相符,{x,y,w,h}代表框的中心坐标、宽度和高度,d为检测结果,g是标注信息,为行人置信度的预测,为背景置信度的预测,Ns为行人解析图种的像素数量,Sc=2为尺度的数量,yj为真实像素标签,ls为尺度类别,为每一个像素的训练权重,其中hi是由第ith像素表示的行人的高度,I{.}为指示函数,为第i个像素的分类结果。6.一种基于多尺度注意力机制的行人检...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。