【技术实现步骤摘要】
一种基于多尺度注意力机制的人群密度估计方法及系统
[0001]本专利技术涉及计算机视觉、人工智能
,具体涉及一种基于多尺度注意力机制的人群密度估计方法及系统。
技术介绍
[0002]在当前机器学习技术及计算机硬件性能高速提升的情况下,近年来计算机视觉、自然语言处理和语音检测等应用领域取得了突破性进展。人群密度估计作为计算机视觉领域一项基础的任务,其精度也得到了大幅提升。
[0003]人群密度估计任务可具体描述如下:
[0004]对于拍摄的图片或者录制的视频以及摄像头下的人群场景,生成密度图用以表示单位面积内人群的密度,再以该密度图为基础,将密度图中单位面积人群密度加和,得到最终整体场景的人群密度,或者是整个视频的人群密度变化。
[0005]人群密度估计对计算机视觉领域和实际应用具有重要意义,在过去几十年里激励大批研究人员密切关注并投入研究。随着强劲的机器学习理论和特征分析技术的发展,近十几年人群密度估计课题相关的研究活动有增无减,每年都有最新的研究成果和实际应用发表和公布。不仅如此,人群密度估计 ...
【技术保护点】
【技术特征摘要】
1.一种基于多尺度注意力机制的人群密度估计方法,其特征在于,采用基于多尺度注意力机制的卷积神经网络模型从待测图像中检测出人群密度,包括以下步骤:步骤1,对待测图像进行预处理获得预处理图像;步骤2,搭建基于多尺度注意力机制的卷积神经网络模型;步骤3,把包含多张训练图像的训练集输入所述基于多尺度注意力机制的卷积神经网络模型进行模型训练,得到训练完成的基于多尺度注意力机制的卷积神经网络模型;步骤4,将所述预处理图像输入所述训练完成的基于多尺度注意力机制的卷积神经网络模型,从而得出各个所述预处理图像中的人群密度结果并进行输出,其中,所述卷积神经网络模型包括密度图预测模块、局部计数图预测模块以及注意力图预测模块。2.根据权利要求1所述的基于多尺度注意力机制的人群密度估计方法,其特征在于:其中,步骤2中,在所述基于多尺度注意力机制的卷积神经网络模型中,加入了多尺度的注意力机制。3.根据权利要求1所述的基于多尺度注意力机制的人群密度估计方法,其特征在于:其中,所述密度图预测模块使用图片中每个像素点的信息,所述信息包括位置信息。4.根据权利要求1所述的基于多尺度注意力机制的人群密度估计方法,其特征在于:其中,所述局部计数图预测模块将图片以32
×
32像素的方式进行分割并计数。5.根据权利要求1所述的基于多尺度注意力机制的人群密度估计方法,其特征在于:其中,步骤3包括以下步骤:步骤3
‑
1,将输入网络的所述预处理图像进行特征提取,获得特征图;步骤3
‑
2,利用卷积网络从所述特征图中得到多尺度的注意力图、密度图预测模块的多尺度特征以及局部计数图...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。