【技术实现步骤摘要】
本专利技术涉及图像识别,特别是涉及一种双重注意力引导的人群计数方法、装置及计算机存储介质。
技术介绍
1、人群计数采用机器学习算法来自动分析图像或视频中的人群并提供其数量的估计。现有的人群计数方法可以分为三类:基于检测的方法、基于回归的方法和基于深度学习的方法。早期的人群统计是通过检测行人数量来进行的。然而,在行人相互遮挡的复杂场景中,手动方法无法准确提取身体特征,阻碍了检测方法的进一步应用。为了解决基于检测的方法的缺点,后续研究提出了基于回归的计数方法,以建立从手动提取的身体特征到图像计数的映射。尽管基于回归的方法可以减轻对检测器的依赖,但它们仍然受到手工特征的限制。近年来,随着深度学习的发展,研究人员尝试将卷积神经网络应用于人群计数,并使用伪密度图作为主要回归目标。然而,卷积神经网络并不擅长对全局环境进行建模。
2、基于自注意力的transformer具有较强的全局特征的捕获能力,但应用于人群计数任务时,使用纯transformer生成特征可能会导致生成的特征主要关注全局上下文。另外准确估计高密度区域的人群数量并充分缓解
...【技术保护点】
1.一种双重注意力引导的人群计数方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的双重注意力引导的人群计数方法,其特征在于,所述双重注意力引导的人群计数网络在所述多阶段细化模块输出后依次进行3×3卷积、1×1卷积和ReLU激活得到人群密度图。
3.根据权利要求1所述的双重注意力引导的人群计数方法,其特征在于,所述注意力引导上采样模块包括第一分支和第二分支,所述第一分支将输入特征进行多个1×1卷积后由softmax激活转置得到注意力图再与多个1×1卷积后的特征进行相乘得到语义聚合描述符,所述第二分支将输入特征进行上采样得到上采样特征图,上
...【技术特征摘要】
1.一种双重注意力引导的人群计数方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的双重注意力引导的人群计数方法,其特征在于,所述双重注意力引导的人群计数网络在所述多阶段细化模块输出后依次进行3×3卷积、1×1卷积和relu激活得到人群密度图。
3.根据权利要求1所述的双重注意力引导的人群计数方法,其特征在于,所述注意力引导上采样模块包括第一分支和第二分支,所述第一分支将输入特征进行多个1×1卷积后由softmax激活转置得到注意力图再与多个1×1卷积后的特征进行相乘得到语义聚合描述符,所述第二分支将输入特征进行上采样得到上采样特征图,上采样特征图经过多个1×1卷积后沿通道维度进行归一化得到通道权重向量,所述通道权重向量对语义聚合描述符进行加权得到具有全局语义信息的特征图,对全局语义信息的特征图进行1×1卷积,然后与上采样特征图融合作为注意力引导上采样模块的输出。
4.根据权利要求3所述的双重注意力引导的人群计数方法,其特征在于,所述注意力引导上采样模块中所述第二分支的上采样的倍率为2或4。
5.根据权利要求1所述的双重注意力引导的人群计数方法,其特征在于,所述t...
【专利技术属性】
技术研发人员:龚声蓉,常舒涵,应文豪,闫海英,王朝晖,钟珊,
申请(专利权)人:常熟理工学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。