当前位置: 首页 > 专利查询>燕山大学专利>正文

一种人群密度估计方法技术

技术编号:20867662 阅读:35 留言:0更新日期:2019-04-17 09:34
本发明专利技术公开一种人群密度估计方法。包括:将待估计图像进行预处理,得到低层特征图;输入深度神经网络模型中的第一子网络,得到高层语义特征图;输入深度神经网络模型中的全连接层,得到人群密集等级;确定第二子网络的对应子列;将低层特征图输入对应子列中,得到主要特征图;将高层语义特征图输入人群位置掩膜模块,得到人群位置信息掩膜;将主要特征图与人群位置信息掩膜加权,并与主要特征图进行通道上的链接,得到添加人群位置信息的特征图;输入维度变换层,得到人群密度估计图和人数估计结果。本发明专利技术可以有效解决人群密度估计任务中由于不同场景存在多尺度和人群分布不均导致人群密度估计性能不佳的问题,具有较高的准确性和较好的鲁棒性。

【技术实现步骤摘要】
一种人群密度估计方法
本专利技术涉及图像处理领域,特别是涉及一种人群密度估计方法。
技术介绍
随着智能监控技术的发展,人群密度估计,作为人群异常检测、人群分析和场景理解最为基础且困难的任务之一,受到了学术界和工业界的广泛关注。人群密度估计是指对场景中的人群进行密度估计进而得到行人数目。目前人群密度估计方法主要分为三类:基于检测的方法,基于回归的方法和基于密度图的方法。基于检测的方法和基于回归的方法在一定程度上由于人群严重遮挡和多尺度等现象性能受到限制,同时忽略了图像上关键的空间信息。因此近些年人群密度估计任务大多采用基于密度图的方法。同基于检测和回归的方法相比,基于密度图的人群密度估计方法一定程度上能够降低高密度人群带来的一系列问题,还能获取图像上关键的空间信息,这为异常检测、人群管理等一系列任务提供更多线索。现有的人群密度估计方法大多采用基于密度图方式的深度神经网络模型,但这些已有的用于人群密度估计的深度神经网络模型存在无法抑制图像多尺度和人群分布不均导致人群密度估计准确率下降的影响等问题。
技术实现思路
本专利技术的目的是提供一种人群密度估计方法,以提高人群密度估计的准确率。为实现上本文档来自技高网...

【技术保护点】
1.一种人群密度估计方法,其特征在于,包括:将灰度化处理后的待估计图像输入深度神经网络模型中进行预处理,得到低层特征图;将所述低层特征图输入所述深度神经网络模型中的第一子网络,得到高层语义特征图;所述第一子网络包括多个卷积层和多个池化层;将所述高层语义特征图输入所述深度神经网络模型中的全连接层,得到人群密集等级;所述全连接层的最后一层的不同神经元对应不同的人群密集等级;根据所述人群密集等级确定所述深度神经网络模型中的第二子网络的对应子列;所述第二子网络包括多个具有不同卷积核尺寸的子列,所述子列的数量与所述全连接层最后一层的神经元数量相同;多个所述子列与多个人群密度等级一一对应;将所述低层特征图...

【技术特征摘要】
1.一种人群密度估计方法,其特征在于,包括:将灰度化处理后的待估计图像输入深度神经网络模型中进行预处理,得到低层特征图;将所述低层特征图输入所述深度神经网络模型中的第一子网络,得到高层语义特征图;所述第一子网络包括多个卷积层和多个池化层;将所述高层语义特征图输入所述深度神经网络模型中的全连接层,得到人群密集等级;所述全连接层的最后一层的不同神经元对应不同的人群密集等级;根据所述人群密集等级确定所述深度神经网络模型中的第二子网络的对应子列;所述第二子网络包括多个具有不同卷积核尺寸的子列,所述子列的数量与所述全连接层最后一层的神经元数量相同;多个所述子列与多个人群密度等级一一对应;将所述低层特征图输入所述第二子网络的对应子列中,得到用于人群密度估计的主要特征图;将所述高层语义特征图输入人群位置掩膜模块,得到人群位置信息掩膜;将所述用于人群密度估计的主要特征图与所述人群位置信息掩膜加权,并与所述用于人群密度估计的主要特征图进行通道上的链接,得到添加人群位置信息的特征图;将所述添加人群位置信息的特征图输入所述深度神经网络模型中的维度变换层,得到所述待估计图像对应的人群密度估计图和人数估计结果。2.根据权利要求1所述的人群密度估计方法,其特征在于,所述将灰度化处理后的待估计图像输入深度神经网络模型中进行预处理,具体包括:将所述灰度化处理后的待估计图像输入所述深度神经网络模型中的第一卷积层,得到第一图像;将所述第一图像输入所述深度神经网络模型中的第二卷积层,得到所述低层特征图;所述第一卷积层与所述第二卷积层的尺寸均为11*11。3.根据权利要求1所述的人群密度估计方法,其特征在于,所述将所述低层特征图输入所述深度神经网络模型中的第一子网络,得到高层语义特征图,具体包括:将所述低层特征图输入所述深度神经网络模型中的第一子网络,依次经过所述第一子网络中的三个卷积层、一个池化层、一个卷积层、一个池化层和三个卷积层,得到所述高层语义特征图;所述第一子网络中的所有卷积层的卷积尺寸均为3*3,每个卷积层生成的特征图的通道数由输入至输出方向依次为24、32、16、32、16、24和8;所述第一子网络中的所有池化层的步长均为2。4.根据权利要求1所述的人群密度估计方法,其特征在于,将所述高层语义特征图输入所述深度神经网络模型中的全连接层,得到人群密集等级,具体包括:将所述高层语义特征图输入所述深度神经网络模型中的三个全连接层,得到人群密集等级;三个全连接层的神经元数量由输入至输出方向依次为512、256和5,对应5个不同的人群密集等级。5.根据权利要求4所述的人群密度估计方法,其特征在于,所述第二子网络包括5个具有不同卷积核尺寸的子列,依次为第一子列、第二子列、第三子列、第四子列和第五子列;每个子列均依次包括一个卷积层、一个池化层、一个卷积层、一个池化层和三个卷积层。6.根据权利要求5所述的人群密度估计方法,其特征在于,所述第一子列中的每个卷积层的卷积核尺寸由输入至输出方向依次为11*11、9*9、9*9、9*9和3*3,每个卷积层生成的特征图通道数由输入至输出方向依次为24、32、16、8和8;所述第一子列的两个池化层的步长均为...

【专利技术属性】
技术研发人员:张世辉李贺任卫东
申请(专利权)人:燕山大学
类型:发明
国别省市:河北,13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1