一种基于深度学习的人群计数模型及其实现方法技术

技术编号：23149986 阅读：14 留言：0更新日期：2020-01-18 13:49

本发明专利技术公开了一种基于深度学习的人群计数模型及其实现方法，所述方法包括：步骤S1，获取人群图像，对获取的人群图像进行预处理并利用标注信息产生对应的人群密度图；步骤S2，将输入的人群图像缩放成多个尺度版本，通过多个子网络提取各个尺度的特征，并利用特征增强模块增强各个尺度的特征；步骤S3，将多个子网络产生的特征结合，生成估计的人群密度图；步骤S4，利用估计的人群密度图与真实的人群密度图计算损失，更新模型参数；步骤S5，利用不同人群图像多次迭代式地进行步骤S1‑S4的训练过程，直到符合停止的条件。

A population counting model based on deep learning and its implementation

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的人群计数模型及其实现方法
本专利技术涉及基于深度学习的计算机视觉
，特别是涉及一种基于深度学习的人群计数模型及其实现方法。
技术介绍
人群计数是计算机视觉中的一个重要研究课题，其目标是根据人群图像自动生成人群密度图并估计场景中的人数。最近，由于其广泛的实际应用，例如视频监控、交通管理和人群流量预测，这项任务在学术界和工业界都受到越来越多的关注。传统的人群计数算法一般需要对图像进行复杂的预处理，并且需要人工设计和提取特征，在跨场景的情况下往往需要重新提取特征，适应性较差。近几年，卷积神经网络的成功运用为人群计数技术带来了重大突破，C.Zhang等人在2015年的研究工作“Cross-sceneCrowdCountingviaDeepConvolutionalNeuralNetworks”(IEEEConferenceonComputerVisionandPatternRecognition(CVPR),June2015)提出一个适用人群计数的卷积神经网络模型，其实现了端对端训练，无需进行前景分割以及人为地设计和提取特征，经过多层卷积之后得到高层特征，提高在跨场景人群计数的性能。然而，在不同的拥挤场景中，人群规模差异很大，同一图象中因距离摄像头距离不同人群的密度和分布也存在差异，该类方法无法捕捉如此巨大的规模变化。为了解决人群规模变化的问题，一些研究工作的关注点放在了提取多个不同尺度的特征以减少规模变化的影响，例如Y.Zhang等人在2016年的研究工作“Single-ImageC...

【技术保护点】
1.一种基于深度学习的人群计数模型，包括：/n预处理单元，用于获取人群图像，对获取的人群图像进行预处理后输出至特征提取单元，并利用标注信息产生对应的人群密度图；/n特征提取单元，用于将输入的人群图像缩放成多个尺度版本，通过多个子网络提取各个尺度的特征，并利用特征增强模块增强各个尺度的特征；/n估计人群密度图生成单元，用于将多个子网络产生的特征结合，生成估计的人群密度图；/n更新单元，用于根据所述估计人群密度图生成单元生成的估计的人群密度图与所述预处理单元生成的真实人群密度图计算损失，更新模型参数；/n迭代训练单元，用于多次迭代式地对不同人群图像进行所述预处理单元、特征提取单元、估计人群密度图生成单元以及更新单元的训练过程，直到满足设定的停止条件时停止训练。/n

【技术特征摘要】
1.一种基于深度学习的人群计数模型，包括：
预处理单元，用于获取人群图像，对获取的人群图像进行预处理后输出至特征提取单元，并利用标注信息产生对应的人群密度图；
特征提取单元，用于将输入的人群图像缩放成多个尺度版本，通过多个子网络提取各个尺度的特征，并利用特征增强模块增强各个尺度的特征；
估计人群密度图生成单元，用于将多个子网络产生的特征结合，生成估计的人群密度图；
更新单元，用于根据所述估计人群密度图生成单元生成的估计的人群密度图与所述预处理单元生成的真实人群密度图计算损失，更新模型参数；
迭代训练单元，用于多次迭代式地对不同人群图像进行所述预处理单元、特征提取单元、估计人群密度图生成单元以及更新单元的训练过程，直到满足设定的停止条件时停止训练。

2.如权利要求1所述的一种基于深度学习的人群计数模型，其特征在于，所述预处理单元进一步包括：
图像裁剪模块，用于对获取的人群图像随机裁剪成固定大小的图像；
人群密度图生成模块，用于利用标注的人头位置信息通过高斯核生成对应的人群密度图，将其作为标签图像。

3.如权利要求2所述的一种基于深度学习的人群计数模型，其特征在于，所述人群密度图生成模块通过如下公式生成人群密度图：

其中，M代表所述人群图像中的人数，x代表图像中每个像素的位置，xi代表第i个人的标注位置，δ(x-xi)表示激活函数，表示标准差为σi的高斯核，β为一常数，代表第i个人的标注位置与其周边的m个人的标注位置的平均距离，

4.如权利要求1所述的一种基于深度学习的人群计数模型，其特征在于，所述特征提取单元进一步包括：
子网络构建模块，用于构建多个并行的子网络，对输入的人群图像提取多个尺度的图像的特征；
特征增强模块，用于在子网络各个下采样层前结合不同尺度的特征，增强各个尺度的特征。

5.如权利要求4所述的一种基于深度学习的人群...

【专利技术属性】
技术研发人员：林倞，甄家杰，刘凌波，李冠彬，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人