基于对抗学习的上下文注意力卷积神经网络的人群密度检测算法制造技术

技术编号：28500218 阅读：26 留言：0更新日期：2021-05-19 22:42

本发明专利技术属于人群密度检测方面的技术领域，具体为基于对抗学习的上下文注意力卷积神经网络的人群密度检测算法，该基于对抗学习的上下文注意力卷积神经网络的人群密度检测算法包括以下步骤：S1：选取训练集，读取人群密度数据集中的图片，并设置卷积神经网络模型的训练参数；S2：根据卷积神经网络模型以及其训练参数，以损失函数最小化为目标来训练卷积神经网络模型。通过深度学习的手段采用更为密集的方式连接一组扩张卷积，在没有显著增加模型大小的情况下提升了人群密度检测的效果，并且也利用注意力机制提高了模型的效率。用注意力机制提高了模型的效率。用注意力机制提高了模型的效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于对抗学习的上下文注意力卷积神经网络的人群密度检测算法

[0001]本专利技术涉及人群密度检测方面的
，具体为基于对抗学习的上下文注意力卷积神经网络的人群密度检测算法。

技术介绍

[0002]近年来随着经济水平发展,人口快速增长,由于人群聚集引起的骚乱已经不止一次的发生,人群监控也变得越来越重要,但是靠人力来实现人群监控容易产生疲劳并且容易受到个人主观因素影响,与此同时,计算机视觉技术日趋成熟,它在工程中的应用范围已经扩展到车牌识别、人脸检测、指纹识别等生活的方方面面,由此更加促进了人群密度自动估计方法的研究。人群密度等级估计和人群流量统计是人群监控的2个重要研究方向。人群密度等级估计将人群按照密集程度划分为不同等级,通过特征分析及分类手段估计人群密度,常应用于人群密度的预警。而人群流量统计侧重于统计人数,要求结果能精确到人数。人群密度估计主要分为特征提取和人群密度分类两步。
[0003]人群密度估计与密集人群计数是当前计算机视觉领域的研究热点之一,具有非常广泛的应用。随着国家经济的持续高速发展,城镇化不断推进,城市人口规模越来越大,人群密集行为越来越多,由此带来的恐怖事件、踩踏事件也日趋增多。目前通过监控视频实现人群密度估计和准确人群计数是一个至关重要的任务,其结果对人群检测、人群异常行为分析等有重要的参考作用。深度学习是一种由多个处理层组成的计算模型,它不需要人工标注各种特征,可以通过学习获得数据的多抽象层表示。近年来,深度学习方法的广泛应用显著提高了语音识别、视觉目标识别和检测结果。卷积神经网络...

【技术保护点】

【技术特征摘要】
1.基于对抗学习的上下文注意力卷积神经网络的人群密度检测算法，其特征在于：该基于对抗学习的上下文注意力卷积神经网络的人群密度检测算法包括以下步骤：S1：选取训练集，读取人群密度数据集中的图片，并设置卷积神经网络模型的训练参数；S2：根据卷积神经网络模型以及其训练参数，以损失函数最小化为目标来训练卷积神经网络模型；S3：将待处理的图像输入到卷积神经网络模型中进行训练和测试，用Ci表示图像中的人群数量，并输出最终的人群密度图，记作Mi；S4：以ShTech数据集图片为例，输入原始图像I之后，可以对原始图像I进行多尺度的缩放以及旋转或镜像操作，得到新的图像，由此来进行制定的特征提取，将这些新的图像集合记作Ii，并对新的图像集合Ii中的图像的人头位置进行标注，得到新的人群集合C；S5：训练图像集合Ii的图片时，由图像集合Ii中标注文件生成真实密度图样本；S6：首先利用VGG
‑
16的前十层来构建卷积神经网络前端；S7：经过上下文卷积模块，将提取出来的VGG特征值，针对不同的卷积特征图，采用不同的池化尺度来对此进行池化；S8：接着对生成对抗网络进行训练，生成对抗网络网络包含生成器G和鉴别器D以及回归网络R，生成器G提取图片的语义信息，生成器G解码网络生成人群密度分布图，而鉴别器D则用于判别得到的人群密度分布图是属于S5得到的真实密度图样本还是属于生成器G生成，在不断逼近中得到更真实的人群密度图；S9：对于整个结构的Loss计算使用的公式如下：其中，Loss表示损失函数的值，λ1表示鉴别器产生的误差所占的比重，G(I)表示图像I经过生成器G的输出，λ2表示生成器所产生的误差所占的比重，D(G(I))表示G(I)经过鉴别器D的输出，m表示训练集样本数量，I表示输入原始图像，c
i
表示图像中人群数量，M
i
表示图像对应的人群密度图，为了使Loss尽可能的小，当数据集图片尺寸不固定的时候，选择batch size为1的SGD作为优化器，而当尺寸固定时，则选择batch size为32的Adam作为优化器；S10：将测试图像作为网...

【专利技术属性】
技术研发人员：朱艾春，黄耀影，李义丰，胡方强，段国秀，
申请(专利权)人：南京工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人