【技术实现步骤摘要】
一种基于视觉转化器的人群密度估计方法及系统
[0001]本专利技术涉及计算机视觉、人工智能
,具体涉及一种基于视觉转化器的人群密度估计方法及系统。
技术介绍
[0002]在当前机器学习技术及计算机硬件性能高速提升的情况下,近年来计算机视觉、自然语言处理和语音检测等应用领域取得了突破性进展。人群密度估计作为计算机视觉领域一项基础的任务,其精度也得到了大幅提升。
[0003]人群密度估计任务可具体描述如下:
[0004]对于拍摄的图片或者录制的视频以及摄像头下的人群场景,生成密度图用以表示单位面积内人群的密度,再以该密度图为基础,将密度图中单位面积人群密度加和,得到最终整体场景的人群密度,或者是整个视频的人群密度变化。
[0005]人群密度估计对计算机视觉领域和实际应用具有重要意义,在过去几十年里激励大批研究人员密切关注并投入研究。随着强劲的机器学习理论和特征分析技术的发展,近十几年人群密度估计课题相关的研究活动有增无减,每年都有最新的研究成果和实际应用发表和公布。不仅如此,人群密度估计也被应用到很 ...
【技术保护点】
【技术特征摘要】
1.一种基于视觉转化器的人群密度估计方法,其特征在于,采用基于视觉转化器和多级卷积结合神经网络模型从待测图像中检测出人群密度,包括以下步骤:步骤1,对待测图像进行预处理获得预处理图像,然后搭建编码解码层;步骤2,搭建基于视觉转化器的神经网络模型;步骤3,把训练数据输入所述基于视觉转化器的神经网络模型进行模型训练,得到训练完成的基于视觉转化器机制神经网络模型;步骤4,将所述预处理图像输入所述训练完成的基于视觉转化器机制神经网络模型,分别得出各个所述预处理图像中的人群密度结果并进行输出,其中,所述基于视觉转化器的神经网络模型包括前端以卷积神经网络为基础的局部信息提取模块和后端以视觉转化器为基础的全局信息提取模块。2.根据权利要求1所述的基于视觉转化器的人群密度估计方法,其特征在于:其中,所述基于视觉转化器的神经网络模型还引入多级卷积机制,每级卷积操作之后都跟着一个visual transformer提取全局联系。3.根据权利要求1所述的基于视觉转化器的人群密度估计方法,其特征在于:其中,所述待测图像为高密度人群图像。4.根据权利要求1所述的基于视觉转化器的人群密度估计方法,其特征在于:其中,步骤1中,所述预处理的步骤为:步骤1
‑
1,从所述待测图像中进行图像分割;步骤1
‑
2,将分割得到的图像进行正则化,所述图像分割的方法为将所述待测图像按照一定规模,随机选取所述待测图像中一点作为中心点,以一定比例切割所述待测图像。5.根据权利要求1所述的基于视觉转化器的人群密度估计方法,其特征在于:其中,步骤1中,所述编码解码层以VGG
‑
16网络和visual transforme...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。