一种结合密度估计的拥挤场景行人检测方法技术

技术编号:26792446 阅读:33 留言:0更新日期:2020-12-22 17:08
本发明专利技术涉及一种结合密度估计的拥挤场景行人检测方法,包括:采集图像,点标注图像中行人头部位置,框标注图像中行人区域形成边界框;搭建卷积神经网络行人检测模型,模型包括骨干网络模块、密度估计模块、行人检测模块,通过骨干网络模块提取所述图像的特征图F,将骨干网络模块提取的特征图F与密度估计模块输出的预测密度图D

【技术实现步骤摘要】
一种结合密度估计的拥挤场景行人检测方法
本专利技术涉及一种行人检测方法,具体涉及一种结合密度估计的拥挤场景行人检测方法。
技术介绍
行人检测在智能驾驶、监控安保、运动分析、客流分析等方面有着非常广泛的应用。在现实生活中,行人拥挤的场景较为常见,如地铁候车区、机场候机大厅、马路行人道等。拥挤场景下,行人会相互交叠,这会使得行人目标检测器难以准确区分每个行人实例的边界,增加了神经网络提取行人特征的难度。同时,行人检测会有非极大值抑制后处理环节,在拥挤的场景下较难确定合适的非极大值抑制阈值,过大的阈值会导致误检测增多,降低了准确率,而过小的阈值则会导致正确的行人检测框被抑制,降低了回归率。解决拥挤场景下的行人检测问题能为后续的下游任务提供更为准确的信息,具有重要的应用价值。目前在拥挤场景下进行行人检测的方法基本有两种:(1)基于部分检测的方法分别检测行人的各个部分,最后通过组合同一个行人的各个检测框得到最后的行人检测结果,这种方法将行人检测拆分成多个子检测模块,使得网络无法学习到整体的行人特征,且这种方法通常需要复杂的后处理步骤;...

【技术保护点】
1.一种结合密度估计的拥挤场景行人检测方法,其特征在于,包括:/n采集图像,点标注图像中行人头部位置,框标注图像中行人区域形成边界框;/n搭建卷积神经网络行人检测模型,所搭建的行人检测模型包括用于提取图像特征的骨干网络模块、用于估计人群密度的密度估计模块、用于得出行人分类结果S和回归结果B的行人检测模块,通过骨干网络模块提取所述图像的特征图F,将骨干网络模块提取的特征图F与密度估计模块输出的预测密度图D

【技术特征摘要】
1.一种结合密度估计的拥挤场景行人检测方法,其特征在于,包括:
采集图像,点标注图像中行人头部位置,框标注图像中行人区域形成边界框;
搭建卷积神经网络行人检测模型,所搭建的行人检测模型包括用于提取图像特征的骨干网络模块、用于估计人群密度的密度估计模块、用于得出行人分类结果S和回归结果B的行人检测模块,通过骨干网络模块提取所述图像的特征图F,将骨干网络模块提取的特征图F与密度估计模块输出的预测密度图D1/8进行软连接从而得到新的特征图I作为行人检测模块的输入,通过行人检测模块得到分类结果S和回归结果B;
用预测密度图D1/8经过双线性插值获得人群密度图D,基于所述人群密度图D及所述回归结果B,动态计算非极大值抑制阈值;
将边界框基于所述非极大值抑制阈值进行非极大值抑制,得到行人检测结果。


2.如权利要求1所述的方法,其特征在于:所述骨干网络模块使用VGG16模型,VGG16模型在ImageNet数据集上进行预训练,之后去除网络最后的softmax分类层以及全连接层,作为骨干网络,且分别在stage3、stage4、stage5输出尺寸大小为原图1/8、1/16、1/32的特征图。


3.如权利要求2所述的方法,其特征在于,所述密度估计模块输出预测密度图D1/8的方式进一步包括:将stage4的特征图经过卷积核3*3,步长为2的反卷积得到大小为原图1/8的特征图,将stage5的特征图经过两次卷积核为2,步长为2的反卷积得到大小为原图1/8的特征图,并与stage3输出的特征图进行拼接,得到新的特征图之后经过两层3*3卷积,得到预测密度图D1/8。


4.如权利要求2或3所述的方法,其特征在于,所述软连接的方式进一步包括:将预测密度图D1/8与大小为原图1/8、1/16、1/32的特征图进行软连接,软连接公式为In=fn((1+Rn(D1/8))×Fn),从而得到特征图I1、I2、I3作为行人检测模块输入,其中,n为自然数,fn是步长为2n-1的3*3卷积,Rn作用是使得D1/8与Fn尺寸一致。


5.如权利要求1所述...

【专利技术属性】
技术研发人员:牟松
申请(专利权)人:广东机场白云信息科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1