The invention discloses a crowd counting method based on convolution neural network, which includes the following steps: (1) real crowd density map is obtained by convolution operation with Gauss kernel after labeling training pictures, and is used as label for model training; (2) training pictures and corresponding real crowd density map are input into convolution neural network model. Training, optimize the parameters iteratively until the model converges; (3) make a new scene data set, fine-tune the model using model migration method, and the model is trained; (4) evaluate and test the performance of the trained model. The invention reduces the number of parameters needed to be trained in the model, simplifies the model structure, improves the real-time performance of the model and meets the practical application requirements on the premise of guaranteeing the accuracy.
【技术实现步骤摘要】
一种基于卷积神经网络的人群计数方法
本专利技术涉及计算机视觉
,尤其是涉及一种基于卷积神经网络的人群计数方法。
技术介绍
公共场景中的人数统计问题是机器视觉领域一个重要的分支,也是一个具有挑战性的问题。在公共场所的监控视频中进行人群计数具有重要的研究价值,例如在公共运输系统可以利用人数计数系统可以保证道路的畅通;大量人群聚集时,对人群进行合理分析,能够降低人群中的不安全因素并防止发生踩踏事件发生。目前人群计数的主要方法有:基于行人检测器的计数方法、基于特征回归的计数方法以及基于深度学习的计数方法。基于行人检测器的计数方法:该方法相对最直观,直接检测图像中行人来计数,当在很密集时出现大量遮挡时会受到很大影响。基于特征回归的计数方法:该方法将人群看作纹理进行处理,并对场景中的人群做了一定的先验假设,通过建立图像特征与人数之间回归模型来估计人数,该方法忽略了行人的空间信息,计数精度不高。基于深度学习的计数方法:利用卷积神经网络可以自动提取不同层级特征,无需人工设计,结合密度图可实现端到端的模型。但是由于模型复杂程度较大,实际应用中很有很多不足。公开号为CN104992223A的中国专利文献公开了一种基于深度学习的密集人数估计方法,包括以下步骤:选择一幅密集场景的图像作为测试图像,然后对测试图像进行分块操作,分块的比例要保证与原图像的宽高比近似相同;将分得的图像块进行归一化操作,归一化成32×32的像素块,作为我们的测试样本,并附上对应的真实人数标签;将像素块批量送入已经训练好的深度网络中,对于每个像素块,网络都会反馈一个预测结果;将每个像素块的预测结果求和 ...
【技术保护点】
1.一种基于卷积神经网络的人群计数方法,其特征在于,包括以下步骤:(1)将训练图片标注后与高斯核进行卷积操作得到真实人群密度图,作为模型训练的标签;(2)将训练图片与对应的真实人群密度图输入卷积神经网络模型进行训练,每次优化迭代更新参数,直至模型收敛;(3)制作新的场景数据集,利用模型迁移方法对得到的模型进行微调,模型训练完毕;(4)对训练完毕的模型进行性能评估与测试。
【技术特征摘要】
1.一种基于卷积神经网络的人群计数方法,其特征在于,包括以下步骤:(1)将训练图片标注后与高斯核进行卷积操作得到真实人群密度图,作为模型训练的标签;(2)将训练图片与对应的真实人群密度图输入卷积神经网络模型进行训练,每次优化迭代更新参数,直至模型收敛;(3)制作新的场景数据集,利用模型迁移方法对得到的模型进行微调,模型训练完毕;(4)对训练完毕的模型进行性能评估与测试。2.根据权利要求1所述的基于卷积神经网络的人群计数方法,其特征在于,步骤(1)的具体步骤为:(1-1)将训练图片标注人头位置,得到0、1分布的标注图像;(1-2)将标注图像与带有扩展参数的高斯核进行卷积,得到真实人群密度图,具体公式如下:其中,M表示标注图像中的人数,x表示图像中每个像素的位置,xi表示第i个人的标注的位置,表示标准差为σi的高斯核,代表第i个人的标注位置和它周围最近的3个人的标注位置的平均距离,即在此记第i个人的标注位置到距它最近的3个人的距离为3.根据权利要求1所述的基于卷积神经网络的人群计数方法,其特征在于,步骤(2)中,所述卷积神经网络模型的结构不含有全连接层,具体包括:5个卷积层、3个池化层以及4个修正线性单元激活层。4.根据权利要求3所述基于卷积神经网络的人群计数方法,其特征在于,所述的5个卷积层具有不同的尺寸,卷积核的大小依次为9×9、9×9、7×7、5×5、9×9,卷积核输入输出通道尺寸分别为3×24、24×32、32×24、24×12、12×1,除最后一个卷积层外,其余...
【专利技术属性】
技术研发人员:王曰海,仝飞飞,张肇阳,欧岳枫,王欢,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。