当前位置: 首页 > 专利查询>之江实验室专利>正文

一种基于密度等级感知的人群计数方法技术

技术编号:30317081 阅读:21 留言:0更新日期:2021-10-09 23:17
本发明专利技术公开了一种基于密度等级感知的人群计数方法,该方法首先根据密度图将图片划分为多个不同密度等级的区域,每个区域采用分而治之的思想融合不同阶段的卷积神经网络特征进行分别预测,最后将不同区域预测结果进行融合后得到最终的人群密度图。本发明专利技术提出的基于密度等级分区域预测融合的方法缓解了人群计数中不同图片或区域的人头尺度不一致问题,使得预测输出的密度图更加准确,预测人数误差更小。小。小。

【技术实现步骤摘要】
一种基于密度等级感知的人群计数方法


[0001]本专利技术属于计算机视觉领域,尤其涉及一种基于密度等级感知的人群计数方法。

技术介绍

[0002]人群计数(Crowd Counting)领域最近的研究趋势是使用卷积神经网络进行密度图预测,再对密度图进行求和得到预测人数。然而大多数方法直接对密度图进行预测,没有考虑到由于尺度不一致问题导致的预测密度图准确性较差。

技术实现思路

[0003]本专利技术的目的在于针对现有技术的不足,提供一种基于密度等级感知的人群计数方法。
[0004]本专利技术的目的是通过以下技术方案来实现的:一种基于密度等级感知的人群计数方法,包括以下步骤:
[0005]步骤一:输入图片为RGB三通道图片,进行减均值除方差归一化操作。
[0006]步骤二:使用基于密度等级感知的人群计数网络预测得到密度图。
[0007]步骤三:对密度图中感兴趣区域进行求和操作,得到感兴趣区域内的人数预测结果。
[0008]进一步地,所述步骤二通过以下子步骤来实现:
[0009](2.1)将输入图片根据密度图划分为4个区域:低密度、中低密度、中高密度、高密度等。训练阶段使用groundtruth密度图进行划分,预测阶段使用初步预测的高密度区域密度图进行划分;
[0010](2.2)使用VGG

16模型作为基础的特征提取网络来为输入图片提取特征,共包含4个网络不同阶段的特征集合。训练阶段特征提取网络使用ImageNet预训练模型进行初始化。
[0011](2.3)根据区域划分结果使用多输出解码器融合不同阶段的特征进行分别预测。低密度区域仅使用高层语义特征进行预测。中低密度区域融合高层语义特征与中高层语义特征进行预测。类似地,融合更加浅层的特征后进行中低密度和低密度区域的密度图预测。最终得到4个区域的密度图预测结果,根据区域划分将其融合为最终的密度图结果。在训练阶段,首先对解码器的卷积层参数进行随机初始化操作,对初步预测的4个密度图均与groundtruth密度图计算均方误差,同时对最终的密度图额外再计算均方误差作为损失函数进行监督模型的训练。在测试阶段,使用训练好的模型进行预测得到最终的密度图输出。
[0012]本专利技术的有益效果是:本专利技术使用的基于密度等级分区域预测融合的方法缓解了人群计数中不同图片或区域的人头尺度不一致问题,使得预测输出的密度图更加准确,预测人数误差更小。
附图说明
[0013]图1是基于密度等级感知的人群计数方法模型框架示意图;
[0014]图2是基于密度等级感知的人群计数方法根据密度图划分区域示意图。
具体实施方式
[0015]下面根据附图详细说明本专利技术。
[0016]如图1所示,本专利技术基于密度等级感知的人群计数方法,包括以下步骤:
[0017]步骤一:输入图片为RGB三通道图片,进行减均值除方差归一化操作。
[0018]步骤二:使用基于密度等级感知的人群计数网络预测得到密度图。
[0019]该步骤是本专利技术的核心,分为以下子步骤:
[0020]1)如图2所示,密度图区域划分:
[0021]将输入图片根据密度图划分为4个区域:低密度、中低密度、中高密度、高密度。训练阶段使用groundtruth密度图进行划分,预测阶段使用初步预测的高密度区域密度图进行划分。
[0022]2)多阶段特征提取:
[0023]使用VGG

16模型作为基础的特征提取网络来为输入图片提取特征,共包含4个网络不同阶段的特征集合。训练阶段特征提取网络使用ImageNet预训练模型进行初始化。
[0024]3)分区域密度图预测与融合
[0025]根据区域划分结果使用多输出解码器融合不同阶段的特征进行分别预测。低密度区域仅使用高层语义特征进行预测。中低密度区域融合高层语义特征与中高层语义特征进行预测。类似地,融合更加浅层的特征后进行中低密度和低密度区域的密度图预测。最终得到4个区域的密度图预测结果,根据区域划分将其融合为最终的密度图结果。在训练阶段,首先对解码器的卷积层参数进行随机初始化操作,对初步预测的4个密度图均与groundtruth密度图计算均方误差,同时对最终的密度图额外再计算均方误差作为损失函数进行监督模型的训练。在测试阶段,使用训练好的模型进行预测得到最终的密度图输出。
[0026]步骤三:对密度图中感兴趣区域进行求和操作,得到感兴趣区域内的人数预测结果。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于密度等级感知的人群计数方法,其特征在于,包括以下步骤:步骤一:输入图片为RGB三通道图片,进行减均值除方差归一化操作。步骤二:使用基于密度等级感知的人群计数网络预测得到密度图。步骤三:对密度图中感兴趣区域进行求和操作,得到感兴趣区域内的人数预测结果。2.根据权利要求1所述的基于密度等级感知的人群计数方法,其特征在于,所述步骤二通过以下子步骤来实现:(2.1)将输入图片根据密度图划分为4个区域:低密度、中低密度、中高密度、高密度等。训练阶段使用groundtruth密度图进行划分,预测阶段使用初步预测的高密度区域密度图进行划分;(2.2)使用VGG

16模型作为基础的特征提取网络来为输入图片提取特征,共包含4个...

【专利技术属性】
技术研发人员:朱世强钟文才秦宇王健卢宏涛李特
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1