一种双重注意力引导的人群计数方法、装置及计算机存储介质制造方法及图纸

技术编号:40122739 阅读:25 留言:0更新日期:2024-01-23 20:54
本发明专利技术公开了一种双重注意力引导的人群计数方法,包括步骤对获取的人群图像预处理,并利用标注信息产生对应的真值分割图、向量化二值图,构建双重注意力引导的人群计数网络并初始化;将预处理后的人群图像、真值分割图和向量化二值图输入双重注意力引导的人群计数网络,完成前向传播;由注意力图与真值分割图计算损失,预估人群密度图与向量化二值图计算损失,并迭代更新网络的参数;基于人群图像通过迭代更新后的双重注意力引导的人群计数网络获取人群密度图,根据所述人群密度图得到预估人数。本发明专利技术还公开了基于该方法的装置。本发明专利技术使用注意力引导特征聚合恢复细粒度信息,采用分割注意力图过滤背景噪声,提高准确率。

【技术实现步骤摘要】

本专利技术涉及图像识别,特别是涉及一种双重注意力引导的人群计数方法、装置及计算机存储介质


技术介绍

1、人群计数采用机器学习算法来自动分析图像或视频中的人群并提供其数量的估计。现有的人群计数方法可以分为三类:基于检测的方法、基于回归的方法和基于深度学习的方法。早期的人群统计是通过检测行人数量来进行的。然而,在行人相互遮挡的复杂场景中,手动方法无法准确提取身体特征,阻碍了检测方法的进一步应用。为了解决基于检测的方法的缺点,后续研究提出了基于回归的计数方法,以建立从手动提取的身体特征到图像计数的映射。尽管基于回归的方法可以减轻对检测器的依赖,但它们仍然受到手工特征的限制。近年来,随着深度学习的发展,研究人员尝试将卷积神经网络应用于人群计数,并使用伪密度图作为主要回归目标。然而,卷积神经网络并不擅长对全局环境进行建模。

2、基于自注意力的transformer具有较强的全局特征的捕获能力,但应用于人群计数任务时,使用纯transformer生成特征可能会导致生成的特征主要关注全局上下文。另外准确估计高密度区域的人群数量并充分缓解背景噪声的干扰仍然具本文档来自技高网...

【技术保护点】

1.一种双重注意力引导的人群计数方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的双重注意力引导的人群计数方法,其特征在于,所述双重注意力引导的人群计数网络在所述多阶段细化模块输出后依次进行3×3卷积、1×1卷积和ReLU激活得到人群密度图。

3.根据权利要求1所述的双重注意力引导的人群计数方法,其特征在于,所述注意力引导上采样模块包括第一分支和第二分支,所述第一分支将输入特征进行多个1×1卷积后由softmax激活转置得到注意力图再与多个1×1卷积后的特征进行相乘得到语义聚合描述符,所述第二分支将输入特征进行上采样得到上采样特征图,上采样特征图经过多个1...

【技术特征摘要】

1.一种双重注意力引导的人群计数方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的双重注意力引导的人群计数方法,其特征在于,所述双重注意力引导的人群计数网络在所述多阶段细化模块输出后依次进行3×3卷积、1×1卷积和relu激活得到人群密度图。

3.根据权利要求1所述的双重注意力引导的人群计数方法,其特征在于,所述注意力引导上采样模块包括第一分支和第二分支,所述第一分支将输入特征进行多个1×1卷积后由softmax激活转置得到注意力图再与多个1×1卷积后的特征进行相乘得到语义聚合描述符,所述第二分支将输入特征进行上采样得到上采样特征图,上采样特征图经过多个1×1卷积后沿通道维度进行归一化得到通道权重向量,所述通道权重向量对语义聚合描述符进行加权得到具有全局语义信息的特征图,对全局语义信息的特征图进行1×1卷积,然后与上采样特征图融合作为注意力引导上采样模块的输出。

4.根据权利要求3所述的双重注意力引导的人群计数方法,其特征在于,所述注意力引导上采样模块中所述第二分支的上采样的倍率为2或4。

5.根据权利要求1所述的双重注意力引导的人群计数方法,其特征在于,所述t...

【专利技术属性】
技术研发人员:龚声蓉常舒涵应文豪闫海英王朝晖钟珊
申请(专利权)人:常熟理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1