一种适用于拥挤场景下的行人检测方法及系统技术方案

技术编号:32646031 阅读:22 留言:0更新日期:2022-03-12 18:28
本发明专利技术公开了一种适用于拥挤场景下的行人检测方法,所述方法包括:获取拥挤场景下的待检测图像;将获取到的待检测图像输入预先训练的改进模型进行检测,得到行人预测框、实例分割图和每个行人的人体关键点数量;根据每个行人的人体关键点数量计算待检测图像的行人可见度,可见度小于预设阈值的图像存在行人间彼此遮挡的现象,根据实例分割图在待检测图像上构造掩膜;将构造了掩膜的待检测图像输入预先训练的改进模型进行检测,得到被遮挡行人的预测框;合并行人预测框和被遮挡行人的预测框,输出行人检测结果。本发明专利技术能够解决拥挤场景下行人特征提取困难以及NMS阈值设置困难的问题,有效降低了拥挤场景下行人检测的漏检率。率。率。

【技术实现步骤摘要】
一种适用于拥挤场景下的行人检测方法及系统


[0001]本专利技术涉及一种适用于拥挤场景下的行人检测方法及系统,属于图像检测


技术介绍

[0002]行人检测是计算机视觉领域的一个经典问题,其特点是应用范围广泛如无人驾驶,机器人,智能监控,人体行为分析,弱视辅助技术等。传统的行人检测方法主要是应用HOG(Histogram of Oriented Gradient)提取行人特征再用SVM(Support Vector Machine)进行分类,但HOG只能从梯度或者纹理来描述行人特征,判别力较差,同时SVM也不适应规模越来越大的行人检测数据集。近年来,随着深度卷积神经网络的发展,行人检测的精度有了很大提高,但在拥挤场景下的行人检测仍存在困难。
[0003]拥挤场景下的行人检测主要有两个难点,一是行人之间的相似度高,而目前基于深度学习的目标检测模型注重提取整体特征,这样会导致模型很难区分高度重叠的行人。二是对预测框的后处理方式存在限制,如Faster R

CNN,YOLOv3,SSD等目标检测框架都是在特征图上进本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种适用于拥挤场景下的行人检测方法,其特征在于,包括:获取拥挤场景下的待检测图像;将获取到的待检测图像输入预先训练的改进模型进行检测,得到行人预测框、实例分割图和每个行人的人体关键点数量;根据每个行人的人体关键点数量计算待检测图像的行人可见度,可见度小于预设阈值的图像存在行人间彼此遮挡的现象,根据实例分割图在待检测图像上构造掩膜;将构造了掩膜的待检测图像输入预先训练的改进模型进行检测,得到被遮挡行人的预测框;合并行人预测框和被遮挡行人的预测框,输出行人检测结果。2.根据权利要求1所述的适用于拥挤场景下的行人检测方法,其特征在于,所述改进模型,通过以下步骤进行训练:获取已标注的拥挤场景下行人数据集,根据行人数据集中的头部标注框信息和行人可见部位标注框信息构造伪实例分割标注;将已标注的拥挤场景下的图像输入预先构建的改进模型,得到预测训练结果;计算预测训练结果与伪实例分割标注之间的损失函数,利用反向传播算法计算梯度,更新预先构建的改进模型的参数;当损失函数值不再继续下降时训练完成,得到预先训练的改进模型。3.根据权利要求2所述的适用于拥挤场景下的行人检测方法,其特征在于,还包括:训练所述改进模型前,使用COCO人体关键点数据集对所述改进模型进行预训练,使得所述改进模型具备检测人体关键点的能力。4.根据权利要求2所述的适用于拥挤场景下的行人检测方法,其特征在于,所述预先构建的改进模型包括:在Mask R

CNN模型中添加SFPN模块和MKFRCNN模块;所述SFPN模块的用于得到待测图像的特征图和语义分割图;所述MKFRCNN模块用于根据建议框,得到行人预测框和对应的实例分割图、每个行人的人体关键点。5.根据权利要求3所述的适用于拥挤场景下的行人检测方法,其特征在于,所述MKFRCNN模块在训练改进模型时不输出每个行人的人体关键点。6.根据权利要求4所述的适用于拥挤场景下的行人检测方法,其特征在于,所述损失函数为多任务损失函数,通过下式表示:数为多任务损失函数,通过下式表示:数为多任务损失函数,通过下式表示:式(1)~(3)中,Loss多任务损失函数,由四部分构成;...

【专利技术属性】
技术研发人员:朱川刘丛强张华
申请(专利权)人:宽泛科技江苏有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1