一种基于VGG网络的自动人群计数图像识别方法技术

技术编号：28296448 阅读：25 留言：0更新日期：2021-04-30 16:21

本发明专利技术公布了一种基于VGG网络的自动人群计数图像识别方法，利用VGG网络模型对图像进行嵌入式层归一化处理，基于VGG网络嵌入式层归一化进行人群计数图像识别，所述自动人群计数图像识别方法命名为VadaLN；包括：建立基于VGG网络模型的嵌入式层归一化网络模型VadaLNet；采用尺度重组网络模块SSM用于进行人群计数，使用散度马尔可夫随机场损失函数DivMRF对人群计数任务建模，并通过对抗式上下文损失函数ACL建立非对齐优化方法，实现密度图估计的非一致训练，优化VadaLNet的参数。本发明专利技术方法对输入的包含人群的图像进行识别和人群计数，过滤与计数任务无关的图像特征，即得到VadaLN值，实现基于VGG网络的自动人群计数图像识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于VGG网络的自动人群计数图像识别方法
本专利技术属于图像处理与识别
，涉及自动人群计数图像识别方法，尤其涉及一种基于VGG网络嵌入式层归一化进行人群计数的图像识别方法。
技术介绍
人群计数是一种以图像或视频为输入、对拍摄到的人群进行识别和自动人数统计的技术，可用于人流控制、安防、公共安全等多种应用领域。现有的基于深度学习的人群计数方法主要采用两种基本模型。一种是文献[1](YingyingZhang,DesenZhou,SiqinChen,ShenghuaGao,YiMa.Single-ImageCrowdCountingviaMulti-ColumnConvolutionalNeuralNetwork.CVPR2016.)中采用的基于图像处理方法进行图像中的人群计数，在人群实时监测和治安管理中有着广泛的应用。但由于数据量有限，现有方法大多没有考虑到特征域之间的差异，适用性差，因而难以推广应用。另一种是文献[2](YuhongLi,XiaofanZhang,DemingChen.CSRNet:DilatedConvolutionalNeuralNetworksforUnderstandingtheHighlyCongestedScenes.CVPR2018.)提出的基于神经网络的解决方案，主要是将数据集中的人群图像和人群标注进行端到端的深度学习，即给定一张人群图像，通过网络模型拟合出其对应的人群密度图，并将密度图中的所有像素值进行累加得到最终的计数结果。但是由于图像中存在颜色、光照、拍摄...

【技术保护点】
1.一种基于VGG网络的自动人群计数图像识别方法，利用VGG网络模型对图像进行嵌入式层归一化处理，基于VGG网络嵌入式层归一化进行人群计数图像识别，所述自动人群计数图像识别方法命名为VadaLN；包括：建立基于VGG网络模型的嵌入式层归一化网络模型VadaLNet；采用尺度重组网络模块SSM用于进行人群计数，使用散度马尔可夫随机场损失函数DivMRF对人群计数任务建模，并通过对抗式上下文损失函数ACL建立非对齐优化方法，实现密度图估计的非一致训练，优化VadaLNet的参数；/n所述自动人群计数图像识别方法VadaLN对输入的包含人群的图像进行识别和人群计数，过滤与计数任务无关的图像特征，即得到VadaLN值；包括如下步骤：/n1)建立基于VGG网络模型的嵌入式层归一化网络模型VadaLNet，包括VGG网络的后端和新创建的尺度重组网络模块SSM，SSM包括像素重组模块；/n2)预训练基于VGG网络模型的嵌入式层归一化网络模型VadaLNet，采用提出散度马尔可夫随机场损失函数DivMRF和对抗式上下文损失函数ACL优化VadaLNet的参数；训练过程中，将图像分割成小块，并进行标准化...

【技术特征摘要】
1.一种基于VGG网络的自动人群计数图像识别方法，利用VGG网络模型对图像进行嵌入式层归一化处理，基于VGG网络嵌入式层归一化进行人群计数图像识别，所述自动人群计数图像识别方法命名为VadaLN；包括：建立基于VGG网络模型的嵌入式层归一化网络模型VadaLNet；采用尺度重组网络模块SSM用于进行人群计数，使用散度马尔可夫随机场损失函数DivMRF对人群计数任务建模，并通过对抗式上下文损失函数ACL建立非对齐优化方法，实现密度图估计的非一致训练，优化VadaLNet的参数；
所述自动人群计数图像识别方法VadaLN对输入的包含人群的图像进行识别和人群计数，过滤与计数任务无关的图像特征，即得到VadaLN值；包括如下步骤：
1)建立基于VGG网络模型的嵌入式层归一化网络模型VadaLNet，包括VGG网络的后端和新创建的尺度重组网络模块SSM，SSM包括像素重组模块；
2)预训练基于VGG网络模型的嵌入式层归一化网络模型VadaLNet，采用提出散度马尔可夫随机场损失函数DivMRF和对抗式上下文损失函数ACL优化VadaLNet的参数；训练过程中，将图像分割成小块，并进行标准化处理，计算损失函数；具体实现包括如下过程：
21)尺度归一化处理：将所有的图像数据归一化到统一的分辨率和长宽比；
22)图像标准化处理：对图像的像素点的强度分别依照正态分布进行调整；
23)进行像素重组：
图像经过神经网络之后得到N层的张量，将张量的N层合并到同一层；层中的特征图与下采样得到的特征图通过尺度重组网络模块SSM进行拼接，得到重组后的张量；
24)将重组后的张量进行空洞卷积操作，得到新的特征图，进行像素叠加后计算最终的计数结果；
25)训练的损失函数采用逐像素的L1范数进行计算；包括：
251)散度马尔可夫随机场损失函数DivMRF的计算；
将图像分割成小块，并作标准化处理，使其服从高斯分布；
PatchX＝{x0，0，x0，1，…，xM-1，N-1}，
PatchY＝{y0，0，y0，1，…，yM-1，N-1}.

其中，PatchX，PatchY表示由输入图像X，Y分割的小块组成的集合，N表示标准化操作，μ和σ分别为均值和标准差；
计算KL散度，再利用KL散度计算损失函数：

其中，Nk表示集合由PatchX，PatchY中标准化后的元素；
252)对抗式上下文损失函...

【专利技术属性】
技术研发人员：周秉锋，郭德闻，冯洁，
申请(专利权)人：北京大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人