本发明专利技术提供了一种分层多尺度人群计数的方法,该方法具体步骤如下:S1:获取数据集;S2:构建层次化多尺度神经网络;S3:训练层次化多尺度神经网络并测试;S4:获取摄像头图像,输入训练好的神经网络进行测试,得到该图片的预测人数。通过上述方式,本发明专利技术能够适用于大规模场景时的人群数量检测,有效的提高检测结果准确性。
【技术实现步骤摘要】
分层多尺度人群计数的方法
本专利技术涉及一种分层多尺度人群计数的方法。
技术介绍
随着国家城市化步伐的加快和城市经济的迅猛发展,旅游事业和人群集会场景增多,但同时伴随而来的还有安全隐患。2014年上海外滩就因人数众多,发生踩踏事件。因此通过设计一种人群计数方法,预测人群数量,对高度拥挤的场景进行预警,可以帮助相关人员进行突发事件事前预警和事后决策,人们的生命和财产安全就可得到保障。目前已有的人群计数主要分为两种:1)基于传统方法的方法,例如支持向量机、决策树等;2)基于深度学习的方法,如MCNN、CSRNet等网神经络方法。以上基于深度学习的人群计数方法均存在一定的局限性。方法1)使用传统方法,复杂度高,精度差;方法2)使用现有神经网络,精度较低等问题。
技术实现思路
本专利技术的目的在于提供一种分层多尺度人群计数的方法。为解决上述问题,本专利技术提供一种分层多尺度人群计数的方法,包括:S1:获取数据集并进行预处理,以得到预处理后的数据集;S2:构建层次化多尺度神经网络;S3:基于所述预处理后的数据集,训练层次化多尺度神经网络并测试层次化多尺度神经网络有效性;S4:获取摄像头图像,输入训练好的层次化多尺度神经网络进行测试,得到所述摄像头图像中的预测人数。进一步的,在上述方法中,步骤S1包括:S11:下载公开数据集;S12:将所述公开数据集分为测试集和训练集;S13:将图像数据的宽高像素补充为8的倍数,并按比例调整定位图的位置;S14:利用高斯核大小为25的高斯核函数将定位图处理为密度图。进一步的,在上述方法中,步骤S2包括:S21:前端网络提取特征:以VGG16的feature层作为特征提取层,kernel=3,采用Conv2d卷积,每个卷积层后都加上Relu激活函数,层数为64、64、128、128,maxpooling(kernel=2),256、256、256,maxpooling(kernel=2),512、512、512,用此结构提取到特征feature;S22:加载VGG16预训练参数;S23:后端主干网络设计。进一步的,在上述方法中,步骤S23包括:S231:后端主干网络为二维卷积,kernel为3,输入网络层数为512,输出网络层数为128,后接Relu激活函数;自定义的注意力模块AT1;最近邻插值上采样,上采样倍数为原数图像两倍;二维卷积,kernel为3,输入网络层数为128,输出网络层数为64,后接Relu激活函数;自定义的注意力模块AT2;最近邻插值上采样,上采样倍数为原数图像两倍;二维卷积,kernel为3,输入网络层数为64,输出网络层数为16,后接Relu激活函数;自定义的注意力模块AT2;最近邻插值上采样,上采样倍数为原数图像两倍;最后一层为输入网络层数为16,输出网络层数为1,kernel为1的全卷积网络,后接Relu激活函数。输出预测密度图;S232:构建像素注意力模块:将输入图像in二维卷积,输入通道等于输出通道,kernel为1,后接sigmoid函数处理得到out,最后输出为in和out的点乘加in;S233:构建自定义层次化多尺度模块前端:输入为x,复制x通道数c。输入并行的四个不同方式提取特征,第一层卷积核大小为3,空洞卷积dilation为1,得到f1;第二层设置不同的卷积核和空洞卷积,得到f2;第三层设置不同的卷积核和空洞卷积,得到f3;第四层设置不同的卷积核和空洞卷积,得到f4;S234:构建自定义层次化多尺度模块后端:截取f1,f2,f3前c/2通道为hf1、hf2、hf3,将hf1输入像素注意力模块,得到y1,将y1的前半数通道与下一层f2连接,二维卷积后通道数为c/2,输入像素注意力模块,得到y2,将y2的前半数通道与下一层f3连接,二维卷积后通道数为c/2,输入像素注意力模块,得到y3,将y3的前半数通道与下一层f4连接,二维卷积后通道数为c/4,输入像素注意力模块,得到y4;y1的后半通道、y2的后半通道、y3的后半通道、y4按通道连接后,得到输出y。进一步的,在上述方法中,步骤S3包括:S31:损失函数及参数设定:损失函数使用mse均方误差,使用Adam优化器,bitchsize设为1,学习率0.00001,epoch设为800;S32:将处理后的高斯图输入层次化多尺度神经网络进行训练;S33:加载训练出的网络参数,用测试集测试评价函数mae、mse大小,估算网络性能。进一步的,在上述方法中,步骤S4包括以下步骤:S41:将摄像头图像处理为小于1024乘1024像素;S42:将处理后的摄像头图像输入层次化多尺度神经网络,得到预测人数y。与现有技术相比,本专利技术的有益效果是:1:本专利技术可以对大规模人群进行更加准确的人群数量估计;2:本专利技术改进了经典卷积神经网络的结构,通过特征提取模块和自定义分层多尺度模块代替了简单的卷积网络层,使用Adam优化器对神经网络的初始权值阈值进行优化,加快了网络的收敛速度,贴近网络最优参数,增强了网络对不同特征的提取;3:本专利技术在VGG16feature层提取特征的基础上,通过自定义分层多尺度模块,进一步提取了不同空间的特征信息,并提高网络对密集人群的注意力,克服了单一尺度特征提取不够全面的问题。附图说明图1是本专利技术一实施例的基于多尺度特征融合的人群计数检测方法的流程结构示意图;图2是本专利技术一实施例的分层多尺度神经网络结构示意图;图3是本专利技术一实施例的分层注意力模块结构示意图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。如图1所示,本专利技术提供一种分层多尺度人群计数的方法,包括:S1:获取数据集并进行预处理,以得到预处理后的数据集;S2:构建层次化多尺度神经网络;S3:基于所述预处理后的数据集,训练层次化多尺度神经网络并测试层次化多尺度神经网络有效性;S4:获取摄像头图像,输入训练好的层次化多尺度神经网络进行测试,得到所述摄像头图像中的预测人数。本专利技术能够适用于大规模场景时的人群数量检测,有效的提高检测结果准确性。本专利技术可用于大型集会及人群密集的旅游场所、商场等的人流量检测系统,利用单图片对当前图片人数进行预测,尤其在人数数量密集的情况下,本专利技术更加准确。本专利技术的分层多尺度人群计数的方法一实施例中,步骤S1包括:S11:下载公开数据集;S12:将所述公开数据集分为测试集和训练集;S13:将图像数据的宽高像素补充为8的倍数,并按比例调整定位图的位置;S14:利用高斯核大小为25的高斯函数将定位图处理为密度图。如图2所示,本专利技术的分层多尺度人群计数的方法一实施例中,本文档来自技高网...
【技术保护点】
1.一种分层多尺度人群计数的方法,其特征在于,包括:/nS1:获取数据集并进行预处理,以得到预处理后的数据集;/nS2:构建层次化多尺度神经网络;/nS3:基于所述预处理后的数据集,训练层次化多尺度神经网络并测试层次化多尺度神经网络有效性;/nS4:获取摄像头图像,输入训练好的层次化多尺度神经网络进行测试,得到所述摄像头图像中的预测人数。/n
【技术特征摘要】
1.一种分层多尺度人群计数的方法,其特征在于,包括:
S1:获取数据集并进行预处理,以得到预处理后的数据集;
S2:构建层次化多尺度神经网络;
S3:基于所述预处理后的数据集,训练层次化多尺度神经网络并测试层次化多尺度神经网络有效性;
S4:获取摄像头图像,输入训练好的层次化多尺度神经网络进行测试,得到所述摄像头图像中的预测人数。
2.如权利要求1所述的分层多尺度人群计数的方法,其特征在于,步骤S1包括:
S11:下载公开数据集;
S12:将所述公开数据集分为测试集和训练集;
S13:将图像数据的宽高像素补充为8的倍数,并按比例调整定位图的位置;
S14:利用高斯核大小为25的高斯函数将定位图处理为密度图。
3.如权利要求1所述的分层多尺度人群计数的方法,其特征在于,步骤S2包括:
S21:前端网络提取特征:以VGG16的feature层作为特征提取层,kernel=3,采用Conv2d卷积,每个卷积层后都加上Relu激活函数,层数为64、64、128、128,maxpooling(kernel=2),256、256、256,maxpooling(kernel=2),512、512、512,用此结构提取到特征feature;
S22:加载VGG16预训练参数;
S23:后端主干网络设计。
4.如权利要求3所述的分层多尺度人群计数的方法,其特征在于,步骤S23包括:
S231:后端主干网络为二维卷积,kernel为3,输入网络层数为512,输出网络层数为128,后接Relu激活函数;自定义的注意力模块AT1;最近邻插值上采样,上采样倍数为原数图像两倍;二维卷积,kernel为3,输入网络层数为128,输出网络层数为64,后接Relu激活函数;自定义的注意力模块AT2;最近邻插值上采样,上采样倍数为原数图像两倍;二维卷积,kernel为3,输入网络层数为64,输出网络层数为16,后接Relu激活函数;自定义的注意力模块AT2;最...
【专利技术属性】
技术研发人员:黄良军,祝鲁宁,沈世晖,张亚妮,
申请(专利权)人:上海应用技术大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。