【技术实现步骤摘要】
一种基于深度学习的人群计数算法
本专利技术涉及一种计数算法,尤其涉及一种基于深度学习的人群计数算法,属于机器视觉
技术介绍
在公共场所的监控视频中进行人群计数具有重要的研究价值。例如,在车站候车大厅中进行人群计数,可以优化公共交通的调度;特定区域中人群数目的迅速变化可能会导致意外事件等。目前人群计数的主要方法有:1)行人检测法:在人群稀疏分布的场景中,通过检测视频中的每一个行人来计数。这种方法相对直接,但是在人群拥挤遮挡时会受到影响。2)轨迹聚类法:对于监控视频,通常使用KLT(Kanade-Lucas-Tomasi)跟踪器与聚类的方法,用轨迹聚类去估计人数。但这种方法会被人之间的严重遮挡所限制。3)特征回归法:首先得到图像特征与人数的回归模型,然后借助图像特征来估计图像中的人数。这种方法考虑到了人群的整体特征,可以进行大规模的人群计数,但是会忽略行人的空间信息,导致计数精度不够。4)人群密度图回归法:通过像素级的目标密度图回归计数,后又改进了随机森林使目标密度回归的方法,提高了训练效率。该法除了考虑到了空间信息,另一个优势是它们能估计图像任意位置的目标 ...
【技术保护点】
一种基于深度学习的人群计数算法,其特征在于:所述算法的整体步骤如下:S1、数据准备阶段:S11、对于跨场景人群计数集中的人群图片,根据人体的高度,估计不同视角下的透视图,生成数据库中不同场景下图像的透视图;S12、根据步骤S11获得的透视图和数据库中所标注的行人头部位置得到密度图的真值,计算方法如公式一所示;
【技术特征摘要】
1.一种基于深度学习的人群计数算法,其特征在于:所述算法的整体步骤如下:S1、数据准备阶段:S11、对于跨场景人群计数集中的人群图片,根据人体的高度,估计不同视角下的透视图,生成数据库中不同场景下图像的透视图;S12、根据步骤S11获得的透视图和数据库中所标注的行人头部位置得到密度图的真值,计算方法如公式一所示;其中,Di(p)是计算得到的密度图;p是原图上任意一点;Pi是原图上所有的点;Nh是归一化的高斯核;Ph是行人的头部位置;σh是高斯核函数的宽度参数;Nb是二维正态分布;Pb是行人的身体位置,它是由头部位置和透视图的值所估计的,此处假设所有成年人的身高为175cm;∑代表二维正态分布中的协方差矩阵;把Nh与Nb相加,||Z||为p点所在的密度图上单个人的密度图值的总和,除以||Z||归一化后每个人在密度图上的值求和都为1,整张密度图求和后的值即为图中人数;S13、按照数据库中给定的透视图随机在原图上切块,图像块的大小根据图像块左上角的点在透视图对应位置的值确定;选取图像块左上角的点在透视图中对应位置的值取整后乘以5作为切出的正方形图像的边长,进而在原图和计算所得到的密度图中按近大远小的方法切块;S2、模型设计与训练阶段:S21、因为原数据集包含训练集和测试集,把通过S13步骤在训练集切下来的图像块和密度图块分为训练集,把通过S13步骤在测试集切下来的图像块和密度图块分为测试集;S22、在深度学习框架caffe下,用FCN全卷积网络学习到人群密度图,具体为:把FCN的损失改为欧式损失,网络输入为原图上切下来的小块,把它们都缩放到128*128像素大小,要学习到的密度图的真值是通过计算得到的密度图上对应位置上切下来的密度图块上的值,同样把...
【专利技术属性】
技术研发人员:樊婷玉,张杰,山世光,
申请(专利权)人:中科视拓北京科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。