一种密集人群计数的方法、装置、设备以及存储介质制造方法及图纸

技术编号：21300632 阅读：27 留言：0更新日期：2019-06-12 08:11

本发明专利技术公开了一种密集人群计数的方法、装置、设备及计算机可读存储介质，包括：将待测试图像输入包括多列平行的卷积神经网络的目标多尺度多列卷积神经网络模型中；每列卷积神经网络中包括多个卷积核大小和个数不同的卷积层。利用所述每列卷积神经网络中各个卷积层对待测试图像进行处理，并将所述每列卷积神经网络中预选卷积层输出的特征图进行融合，以便得到所述每列卷积神经网络输出的估计密度图；将所述每列卷积神经网络输出的估计密度图进行融合后，得到待测试图像的目标估计密度图；依据所述目标估计密度图，计算得到待测试图像中的人数。本发明专利技术所提供的方法、装置、设备及计算机可读存储介质，提高了密集人群图像预测结果的准确性。

A Method, Device, Equipment and Storage Medium for Dense Crowd Counting

The invention discloses a method, device, device and computer readable storage medium for dense crowd counting, which includes: input the image to be tested into a target multi-scale multi-column convolution neural network model including multi-column parallel convolution neural network; and each column of convolution neural network includes convolution layers with different convolution core sizes and numbers. The test image is processed by using the convolution layers in each column of the convolution neural network, and the feature maps of the pre-selected convolution layer output in each column of the convolution neural network are fused to obtain the estimated density maps of the output of each column of the convolution neural network. After fusing the estimated density maps of the output of each column of the convolution neural network, the target of the image to be tested is obtained. Estimate density map; according to the target estimation density map, the number of people in the image to be tested is calculated. The method, device, equipment and computer readable storage medium provided by the invention improve the accuracy of image prediction results of dense crowd.

全部详细技术资料下载

【技术实现步骤摘要】
一种密集人群计数的方法、装置、设备以及存储介质
本专利技术涉及计算机视觉
，特别是涉及一种密集人群计数的方法、装置、设备以及计算机可读存储介质。
技术介绍
为了人群控制和公众安全，准确地估计来自图像或视频的人群已经成为计算机视觉技术越来越重要的应用。计算机视觉中的人群计数任务是自动计算图像或视频中的人数。为了在诸如公众集会和体育赛事等许多场景中帮助控制人群和公共安全，需要准确的人群计数。传统的密集人群计数方法包括两种：基于检测的方法和基于回归的方法。基于检测的方法将人群视为一组检测到的个体实体。但是，行人经常被密集的人群遮挡，这在静止图像中估计人群时尤其具有挑战性。基于回归的方法对从人群图像中提取的各种特征的标量值(如人数)或密度图进行回归。它们基本上有两个步骤：首先，从人群图像中提取有效特征；第二，利用各种回归函数来估计人群数量。但是，通过回归进行的人群计数容易受到视角和尺度的急剧变化的影响，而这种变化通常存在于人群图像中。与此同时，深度学习已经被成功地应用在密集人群图像的估计中。主流的估计方法采用密度图的思想，即设计一个神经网络，网络的输入为原始图像，而输出为人群的密度图。这类方法对密集人群图像处理的第一步，就是要通过一个高斯滤波器，根据图像的真实值ground-truth得到图像对应的密度图。Zhang等人在“Single-ImageCrowdCountingviaMulti-ColumnConvolutionalNeuralNetwork”中提出了一个多列卷积神经网络。该网络由三列平行的卷积神经网络组成，每一列使用感受野大小不同的卷积核，分别...

【技术保护点】
1.一种密集人群计数的方法，其特征在于，包括：将待测试图像输入至预先完成训练的目标多尺度多列卷积神经网络模型中；其中，所述目标多尺度多列卷积神经网络模型包括多列平行的卷积神经网络，每列卷积神经网络中包括多个卷积核大小和个数不同的卷积层；将所述待测试图像分别输入至所述每列卷积神经网络中，利用所述每列卷积神经网络中各个卷积层对所述待测试图像进行处理，并将所述每列卷积神经网络中预选卷积层输出的特征图进行融合，以便于分别得到所述每列卷积神经网络输出的估计密度图；将所述每列卷积神经网络输出的估计密度图进行融合后，得到所述待测试图像的目标估计密度图；依据所述待测试图像的目标估计密度图，计算得到所述待测试图像中的人数。

【技术特征摘要】
1.一种密集人群计数的方法，其特征在于，包括：将待测试图像输入至预先完成训练的目标多尺度多列卷积神经网络模型中；其中，所述目标多尺度多列卷积神经网络模型包括多列平行的卷积神经网络，每列卷积神经网络中包括多个卷积核大小和个数不同的卷积层；将所述待测试图像分别输入至所述每列卷积神经网络中，利用所述每列卷积神经网络中各个卷积层对所述待测试图像进行处理，并将所述每列卷积神经网络中预选卷积层输出的特征图进行融合，以便于分别得到所述每列卷积神经网络输出的估计密度图；将所述每列卷积神经网络输出的估计密度图进行融合后，得到所述待测试图像的目标估计密度图；依据所述待测试图像的目标估计密度图，计算得到所述待测试图像中的人数。2.如权利要求1所述的方法，其特征在于，所述将待测试图像输入至预先完成训练的目标多尺度多列卷积神经网络模型中前包括：利用高斯滤波器对预先创建的人群图像数据集进行滤波处理后，获取所述人群图像数据集中每幅图像的密度图，从而构建目标训练集；采用所述目标训练集对多尺度多列卷积神经网络模型进行训练，得到完成训练后的目标多尺度多列卷积神经网络模型。3.如权利要求2所述的方法，其特征在于，所述利用高斯滤波器对预先创建的人群图像数据集进行滤波处理后，获取所述人群图像数据集中每幅图像的密度图，从而构建目标训练集包括：获取预先采集的人群图像数据集其中，Xi为所述人群图像数据集第i张图像，大小为m*n；Yi为所述第i张图像对应的人头坐标点图，大小为m*n，N为所述人群图像数据集中图像总数；利用高斯滤波器对所述人群图像数据集中的每幅图像Xi进行滤波处理后，得到所述每幅图像Xi的密度图Mi，利用所述每幅图像Xi的密度图Mi构建目标训练集4.如权利要求2所述的方法，其特征在于，所述采用所述目标训练集对多尺度多列卷积神经网络模型进行训练包括：将所述目标训练集中的当前人群图像分别输入至所述多尺度多列卷积神经网络模型的每列卷积神经网络中；其中，所述多尺度多列卷积神经网络模型中的每列卷积神经网络相互平行，所述每列卷积神经网络除卷积核大小和个数外，其他网络结构相同；将所述每列卷积神经网络输出的所述当前人群图像的估计密度图在通道数上串联后，经过一个卷积核大小为1*1的总卷积层，并将所述总卷积层输出的特征图映射为所述当前人群图像的目标估计密度图，以便于将所述当前人群图像的目标估计密度图作为所述多尺度多列卷积神经网络模型的网络输出。5.如权利要求4所述的方法，其特征在于，所述多尺度多列卷积神经网络模型的每列卷积神经网络包括：第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、反卷积层、第六卷积层和第七卷积层；其中，所述第一卷积层和其他卷积层的卷积核大小不同，所述第二卷积层、所述第三卷积层、所述第...

【专利技术属性】
技术研发人员：张莉，陆金刚，王邦军，周伟达，
申请(专利权)人：苏州大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人