【技术实现步骤摘要】
一种基于改进型VGG16网络的人群计数方法、系统及存储介质
[0001]本专利技术属于图像处理
,具体涉及基于改进型VGG16网络的人群计数方法、系统及存储介质。
技术介绍
[0002]人群计数是公共安防行业中非常需要的一种技术。对于给定的一幅图像或一段视频,通过计算机自动处理,分析出其中的人数。
[0003]现有的技术中关于人群计数的方法存在大量漏检、拥挤环境下人头较小不易检测以及无法直观的看到人群分布的缺陷。
技术实现思路
[0004]本专利技术的目的在于提供一种基于改进型VGG16网络的人群计数方法、系统及存储介质,对于人群较多的拥挤场景进行人群计数具有鲁棒性,避免了产生漏检现象,同时可以直观的看到人群在图片中所在的位置。
[0005]为达到上述目的,本专利技术所采用的技术方案是:本专利技术第一方面提供了一种基于改进型VGG16网络的人群计数方法,包括:采集监控场景的实时人群图像;将实时人群图像输入预训练后的人群计数网络模型,获得对实时人群图像的计数结果;所述人群计数网络模型包括: ...
【技术保护点】
【技术特征摘要】
1.一种基于改进型VGG16网络的人群计数方法,其特征在于,包括:采集监控场景的实时人群图像;将实时人群图像输入预训练后的人群计数网络模型,获得对实时人群图像的计数结果;所述人群计数网络模型包括:特征提取层、多层语义融合模块、多尺度膨胀卷积模块、分类分支模块和生成人群密度图像的后端网络;所述特征提取层为VGG16网络的前十三层;特征提取层用于提取特征图P1、特征图P2和特征图P3;所述多层语义融合模块用于利用注意力机制分别对所述特征图P1、特征图P2和特征图P3进行初次特征提取,将初次特征提取后的特征融合形成特征图R;所述多尺度膨胀卷积模块用于对特征图R进行特征以及上下文信息提取形成特征图Z;所述分类分支模块对特征图Z进行处理后,经过Sigmoid激活函数处理获得人群数量区间;所述生成人群密度图像的后端网络用于对特征图Z进行处理获得设定尺寸的人群密度图,再对人群密度图进行积分运算得到人群数量;所述人群计数网络模型的训练过程包括:由监控数据库中获取含有标注信息的人群图像,对人群图像进行预处理构建训练集、验证集及测试集;其中,标注信息为人群图像数据中的人群数量区间;通过训练集和验证集对人群计数网络模型进行训练;利用L2范数损失和交叉熵损失构建损失函数;根据损失函数计算梯度并采用Adam优化器更新人群计数网络模型的权重以及偏置;通过测试集对更新的人群计数网络模型进行测试,采用平均绝对误差MAE或均方误差MSE对人群计数网络模型进行评估并获得评估值,根据评估值保存人群计数网络模型的网络参数,重复迭代直至设定的训练轮数全部完成,输出最终的人群计数网络模型。2.根据权利要求1所述的基于改进型VGG16网络的人群计数方法,其特征在于,构建训练集、验证集及测试集的方法包括:对人群图像缩放至设定尺寸,根据人群数量将人群图像划分为C个类别;将每个类别中的人群图像按照设定比例依次划分至训练集、验证集及测试集。3.根据权利要求1所述的基于改进型VGG16网络的人群计数方法,其特征在于,所述特征提取层依次包括Conv1_1卷积层、Conv1_2卷积层、Pool1最大池化层、Conv2_1卷积层、Conv2_2卷积层、Pool2最大池化层、Conv3_1卷积层、Conv3_2卷积层、Conv3_3卷积层、Pool3最大池化层、Conv4_1卷积层、Conv4_2卷积层、Conv4_3卷积层、Pool4最大池化层、Conv5_1卷积层、Conv5_2卷积层、Conv5_3卷积层;Conv1_1卷积层、Conv1_2卷积层、Conv2_1卷积层、Conv2_2卷积层、Conv3_1卷积层、Conv3_2卷积层、Conv3_3卷积层、Conv4_1卷积层、Conv4_2卷积层、Conv4_3卷积层、Conv5_1卷积层、Conv5_2卷积层、Conv5_3卷积层的卷积核都为3,其通道数分别为64、64、128、128、256、256、256、512、512、512、512、512、512;Pool1最大池化层、Pool2最大池化层、Pool3最大池化层和Pool4最大池化层的步长为2以及池化区域为2,特征图P1表示为经过Conv3_3卷积层和Pool3最大池化层的特征图,特征图P2表示经过Conv4_3卷积层和Pool4最大池化层的特征图,特征图P3表示经过Conv5_3卷
积层的特征图。4.根据权利要求1所述的基于改进型VGG16网络的人群计数方法,其特征在于,所述多层语义融合模块包括注意力机制;所述特征图P1通过注意力机制进行特征提取后形成特征图Y1;所述特征图P2通过注意力机制进行特征提取后,使用双线性插值的方式上采样2倍获得特征图Y2;所述特征图P3通过注意力机制进行特征提取后,使用双线性插值的方式上采样4倍获得特征图Y3;所述特征图Y1、特征图Y2和特征图Y3在通道维度上拼接形成特征图R。5.根据权利要求4所述的基于改进型VGG16网络的人群计数方法,其特征在于,所述多层语义融合模块对所述特征图P1、特征图P2和特征图P3分别经过注意力机制的初次特征提取的方法包括:将所述特征图P1、特征图P2和特征图P3作为输入特...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。