多尺度注意力机制的双路人群计数方法技术

技术编号：37715997 阅读：14 留言：0更新日期：2023-06-02 00:12

本发明专利技术公开了一种多尺度注意力机制的双路人群计数方法，为了解决人群尺度变化大的问题，提出了一种多尺度特征提取方法，将多尺度模块、扩张卷积、特征金字塔有机结合；为了抑制背景干扰问题，设计了一种注意力掩膜网络和新的密度图生成方式；为了进一步提高预测密度图的质量，结合背景注意力掩膜损失，给出了自适应的多重损失函数。通过生成高质量的密度图，对生成的密度图进行积分来精确计数。对生成的密度图进行积分来精确计数。对生成的密度图进行积分来精确计数。

全部详细技术资料下载

【技术实现步骤摘要】
多尺度注意力机制的双路人群计数方法

[0001]本专利技术公开涉及计算机视觉的
，尤其涉及一种多尺度注意力机制的双路人群计数方法及其网络模型。

技术介绍

[0002]密集人群计数的任务是估计图像或视频中包含的人物数量。随着全球人口数量的持续增长和人类社会活动的增加，各地公共场所经常会出现人群大量聚集的情况，如交通枢纽和娱乐场所等，这给公共安全带来了巨大的隐患。密集人群计数任务在视频监视、交通控制和大都市安全方面应用广泛，各国研究人员均进行了大量研究。
[0003]一些早期的方法是通过检测人群中的每个行人来解决人群计数问题，取得了一定的效果；但是在人群密集场景和严重遮挡场景下该方法的效果会急剧下降。因此，基于特征回归的方法被用来解决此问题。回归方法通常学习一种从特征到人数的映射关系，通过提取前景特征学习一个线性回归或高斯过程回归来计数。然而，这种回归方法学习到的是低级特征映射，当场景尺度和视角急剧变化时效果不佳。
[0004]近年来，卷积神经网络在计算机视觉领域的成功应用，为解决上述问题开拓了新的方法。基于卷积神经网络的人群计数算法能够自动提取特征，避免手工设计特征的局限性和复杂性，已成为人群计数的主流算法。文献(Single
‑
image crowd counting via multi
‑
column convolutional neural network)提出用多列卷积神经网络进行人群计数，不同的列使用不同大小的卷积核，分别处理大、中、小3种不同尺度的人

【技术保护点】

【技术特征摘要】
1.一种多尺度注意力机制的双路人群计数方法，其特征在于，所述方法包括如下步骤：获取待估计人群数量的图像，并采用VGG特征提取器进行特征提取，获得Conv5
‑
3、Conv4
‑
3、Conv3
‑
3以及Conv2
‑
2这些不同尺度的特征图；将所述不同尺度的特征图进行多尺度融合，获得人群密度特征图；将所述人群密度特征图中各像素点进行阈值筛选，获得背景密度特征图；将所述Conv5
‑
3特征图通过注意力掩膜模块处理后，获得人群注意力掩膜图；将所述人群注意力掩膜图中各像素点进行阈值筛选，获得背景注意力掩膜图；将所述人群注意力掩膜图与所述人群密度特征图按位相乘，获得精确密度特征图；将所述背景注意力掩膜图与所述背景密度特征图按位相乘，获得精确背景密度特征图；依据所述精确密度特征图与所述精确背景密度特征图，获得最终密度特征图；依据所述最终密度特征图，获得人群计数。2.根据权利要求1所述多尺度注意力机制的双路人群计数方法，其特征在于，所述VGG特征提取器为VGG16网络结构中的前13层。3.根据权利要求1所述多尺度注意力机制的双路人群计数方法，其特征在于，所述将所述不同尺度的特征图进行多尺度融合，获得人群密度特征图，具体为：1)将Conv5
‑
3的特征图进行因子为2的上采样，并将结果与Conv4
‑
3的特征图进行Concat操作后，获得第一结果，将所述第一结果经过多尺度模块的处理，在不改变特征图通道数，尺寸的情况下，提取特征图的多尺度特征并级联获得全局上下文信息；2)将步骤1)结果进行1
×
1的卷积处理，减少特征图的通道数后，再进行3
×
3的卷积处理，提取特征信息；3)将步骤2)提取的特征信息进行因子为2的上采样，并将结果与Conv3
‑
3的特征图进行Concat操作，获得第二结果，将所述第二结果经过多尺度模块的处理，在不...

【专利技术属性】
技术研发人员：石祥滨，吕浩杰，刘翠微，刘芳，张德园，蒋有志，杨丹，刘家鸣，黄盛，
申请(专利权)人：沈阳航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人