基于峰值置信图的人群检测方法技术

技术编号:27470298 阅读:37 留言:0更新日期:2021-03-02 17:35
本发明专利技术提供了一种基于峰值置信图的人群检测方法。所述基于峰值置信图的人群检测方法包括以下步骤:步骤S1、提取图像中的特征信息:步骤S2、将提取到的特征信息映射为峰值置信图;步骤S3、在峰值置信图中寻找峰值来计算人群的数目和位置。本发明专利技术利用峰值置信图进行人群检测,具有很好的人群计数性能,同时还能获取准确的位置信息。取准确的位置信息。取准确的位置信息。

【技术实现步骤摘要】
基于峰值置信图的人群检测方法


[0001]本专利技术涉及人群计数
,特别涉及基于峰值置信图的人群检测方法。

技术介绍

[0002]在城市中,这样的现象随处可见:在一公交车站有一群人在等车,而另一公交站几乎无人问津。根据车站人数合理安排车辆是人群计数问题中一个重要的应用,而这样的应用还有许多。因此,人群计数问题有着重要的应用前景。人群计数问题旨在估计图像或视频中的人群数量。该问题在其他方面也有着重要的应用,如交通管理,商场管理等。同时,在其它领域也存在一些相似的工作,如车辆计数,显微镜下的细胞计数等。这一系列问题的研究与应用,能极大的降低人力,物力和财力。和其他计算机视觉任务一样,在遮挡、背景干扰、图像失真等方面人群计数也面临着巨大的挑战。目前有很多研究者关注人群计数问题,并提出很多优秀的模型和算法来解决该问题。
[0003]在基于深度学习的框架下,人群计数方法包括密度图计数法。由于密度图方法是根据输入图像,通过网络回归的密度图进行求和而导致了如下问题:(1)假阳性的比例更高。(2)人群位置信息的丢失。如图2所示,采用密度图计数法,以左侧曲线和右侧曲线表示将不同人的位置信息转化成的高斯核函数,易知x1,x3表示不同人的头部位置,而进行相加后可得到中间的虚线曲线,由于此时产生了假峰值x2,则无法判断哪些峰值是人的头部位置。

技术实现思路

[0004]本专利技术提供了一种基于峰值置信图的人群检测方法,其目的是为了解决
技术介绍
中人群计数精度不高的技术问题。
[0005]为了达到上述目的,本专利技术的实施例提供的基于峰值置信图的人群检测方法,包括以下步骤:
[0006]步骤S1、提取图像中的特征信息:
[0007]步骤S2、将提取到的特征信息映射为峰值置信图;
[0008]步骤S3、在峰值置信图中寻找峰值来计算人群的数目和位置。
[0009]优选地,所述步骤S1具体为采用残差网络提取图像中的特征信息,获得特征图。
[0010]优选地,所述步骤S1具体包括如下步骤:
[0011]步骤S11、将残差网络的layer3以及之前的层作为外部后端,以提取图像中的特征信息;
[0012]步骤S12、更改layer3的步长,获得残差块;
[0013]步骤S13、对图像中的特征信息进行提取,并进行下采样,得到缩小了8倍的特征图。
[0014]优选地,所述步骤S1中,所述残差网络训练过程中,使用残差网络在Image Net上预训练模型前三层的参数;将数据集划分为交叉集,验证集和训练集;使用Adam优化算法,
由交叉集得出学习率为5e-5和权重衰退率为1e-4;输入图像进行正则化,然后在训练集上进行训练,得到预测的峰值置信图;将预测的峰值置信图经过求取极值点,统计预测的人数;同时,每在训练集上迭代一次,便在验证集上进行一次验证,保留验证集中最佳的模型。
[0015]优选地,所述步骤S2具体为:采用反卷积层和/或卷积层进行上采样,将特征图恢复成原图的大小,以获取峰值置信图:采用两个卷积层及四个反卷积层进行上采样,四个反卷积层依次设置于两个卷积层之间,其中,第一个卷积层负责编码特征图信息,中间四个反卷积层负责将特征图上采样成原图尺寸,最后一个卷积层负责将特征图映射成峰值置信图。
[0016]优选地,所述步骤S2中,所述峰值置信图函数为:
[0017][0018][0019]F(x,y)=M(x
M
,y
M
)
[0020]其中,表示第i个头部位置对应的高斯核,M(x
i
,y
i
)表示已包含i个头部位置的置信函数,M表示图像中的人数,σ
i
为第i个头部对应高斯核的方差,ksize为像素大小,(x
i
,y
i
)表示包含i个头部位置的图像坐标,F(x,y)表示头部位置峰值置信函数。
[0021]优选地,将峰值置信图乘一个放大因子factor。
[0022]优选地,所述步骤S2中,使用均方损失评估真实峰值置信图与预测峰值置信图的误差,真实峰值置信图为预测峰值置信图与峰值置信图函数表征图的差值,均方损失函数为:
[0023][0024]其中θ表示需要学习的参数,N表示图片总数,F(I
i
;θ)表示第i幅输入图像I预测的峰值置信图,G
i
表示第i幅输入图像I真实的峰值置信图。
[0025]优选地,所述步骤S2中,采用计算相邻像素点之间的差异及均方损失,共同评估真实峰值置信图与预测峰值置信图的误差,具体包括:
[0026]步骤A、使用大小为3*3的卷积核kernel=[[-1,-1,-1],[-1,9,-1],[-1,-1,-1]][0027]分别与真实峰值置信图函数表征图和预测峰值置信图进行卷积,得到相邻像素点之间的关系;
[0028]步骤B、采用上述卷积后的结果,取绝对值,获得相邻像素点之间的损失:
[0029][0030]步骤C、采用均方损失评估真实峰值置信图和预测峰值置信图之间的误差:
[0031][0032]步骤D、计算总损失:
[0033]L(θ)=L
mse
(θ)+L
ker
(θ)。
[0034]优选地,所述步骤S3中,所述在峰值置信图中寻找峰值中,采用非极大抑制方法对图像的峰值置信图F(x,y)寻找峰值,峰值极值点位置集合P为:
[0035][0036]其中,F(x
i
,y
j
)表示大小为(W,H)的峰值密度图像中第(i,j)个像素点,arg max表示求取最大值的下标,W和H分别表示峰值密度图的宽度和高度,δ4表示该峰值密度图每个像素点的四邻域,为阈值。
[0037]采用本专利技术能达到的技术效果有:本专利技术采用峰值置信图方法进行人群检测。与密度图不同,峰值置信图表示人群头部位置的置信程度。峰值置信图中的每一个峰值都对应了每一个人的头部位置,且保留人群的空间分布信息。在峰值置信图下,由于其良好特性,它不仅适用于密集场景,更能对人群进行追踪等活动。峰值置信图具有与密度图相当的人群计数性能,同时它还能获取准确的位置信息。
[0038]采用残差网络进行训练及特征提取。残差网络的特点在于其“捷径连接(Shortcut Connections)性”,使得深层次的网络参数得以训练,图片分类效果好。
附图说明
[0039]图1为本专利技术的基于峰值置信图的人群检测方法的流程图;
[0040]图2为本专利技术的基于峰值置信图的人群检测方法的对比方法中,基于密度图获得极值点的效果图;
[0041]图3为本专利技术的基于峰值置信图的人群检测方法中基于峰值置信图获得极值点的效果图;
[0042]图4为本专利技术的基于峰值置信图的人群检测方法与对比方法基于密度图获得人群密度的对比示意图;
[0043]图5为本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于峰值置信图的人群检测方法,其特征在于,包括以下步骤:步骤S1、提取图像中的特征信息:步骤S2、将提取到的特征信息映射为峰值置信图;步骤S3、在峰值置信图中寻找峰值来计算人群的数目和位置。2.根据权利要求1所述的基于峰值置信图的人群检测方法,其特征在于,所述步骤S1具体为采用残差网络提取图像中的特征信息,获得特征图。3.根据权利要求2所述的基于峰值置信图的人群检测方法,其特征在于,所述步骤S1具体包括如下步骤:步骤S11、将残差网络的layer3以及之前的层作为外部后端,以提取图像中的特征信息;步骤S12、更改layer3的步长,获得残差块;步骤S13、对图像中的特征信息进行提取,并进行下采样,得到缩小了8倍的特征图。4.根据权利要求3所述的基于峰值置信图的人群检测方法,其特征在于,所述步骤S1中,所述残差网络训练过程中,使用残差网络在Image Net上预训练模型前三层的参数;将数据集划分为交叉集,验证集和训练集;使用Adam优化算法,由交叉集得出学习率为5e-5和权重衰退率为1e-4;输入图像进行正则化,然后在训练集上进行训练,得到预测的峰值置信图;将预测的峰值置信图经过求取极值点,统计预测的人数;同时,每在训练集上迭代一次,便在验证集上进行一次验证,保留验证集中最佳的模型。5.根据权利要求2所述的基于峰值置信图的人群检测方法,其特征在于,所述步骤S2具体为:采用反卷积层和/或卷积层进行上采样,将特征图恢复成原图的大小,以获取峰值置信图:采用两个卷积层及四个反卷积层进行上采样,四个反卷积层依次设置于两个卷积层之间,其中,第一个卷积层负责编码特征图信息,中间四个反卷积层负责将特征图上采样成原图尺寸,最后一个卷积层负责将特征图映射成峰值置信图。6.根据权利要求1所述的基于峰值置信图的人群检测方法,其特征在于,所述步骤S2中,所述峰值置信图函数为:F(x,y)=M(x
M
,y
M
)其中,表示第i个头部位置对应的高斯核,M(x
i
,y
i
)表示已包含i个头部位置的置信函数,M表示图像中的人数,σ<...

【专利技术属性】
技术研发人员:张锦陈胜刘宏王磊胡娟龚文安
申请(专利权)人:湖南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1