一种基于伸缩卷积神经网络的引导区域密集人群计数方法技术

技术编号:26479330 阅读:41 留言:0更新日期:2020-11-25 19:23
本发明专利技术涉及一种基于伸缩卷积神经网络的引导区域密集人群计数方法。本发明专利技术首先进行人群计数数据集等级划分;其次进行引导区域选取;然后调整引导区域尺度一致;最后通过伸缩卷积神经网络得到最终的人群数目预测。本发明专利技术有效的提取了人群计数数据集的密集人群区域,提高了图片的抗干扰能力,且对网络模型深度进行了加强,有效的解决了尺度不均匀、遮挡严重等场景,加入了自适应分块损失函数与感知损失、欧式损失融合来优化模型,提高了密度图的分辨率质量,提升密集人群计数的准确性。

【技术实现步骤摘要】
一种基于伸缩卷积神经网络的引导区域密集人群计数方法
本专利技术涉及伸缩卷积神经网络,引导区域选取,图像分割,人群计数
,具体涉及一种基于伸缩卷积神经网络的引导区域密集人群计数方法。
技术介绍
目前人群计数随着计算机网络的发展在安防和公共安全方面得到广泛的应用,传统基于滑动窗口的检测和通过回归方法计数只适用稀疏场景,而对于密集场景或者遮挡情况严重场景效果很差,所以目前多采用卷积神经网络来预测人群数量,许多基于卷积神经网络的框架结构可以捕获低分辨率的特征,也会有不错的人群统计效果,但是抗干扰能力较差,还有些方法受限于图片局部尺度不一致,人群分布的差异性较大,背景噪声影响严重、整幅图像透视失真,遮挡严重等问题,直接导致难以生成可靠的密度图或生成的人群密度图分辨率质量下降,由此严重影响密集人群计数的准确性和可靠性。
技术实现思路
本专利技术针对现有技术的不足,提出一种基于伸缩卷积神经网络的引导区域密集人群计数方法。具体包括以下步骤:步骤一、人群计数数据集等级划分本方法图像熵被定义为随机量的度量,对人群计本文档来自技高网...

【技术保护点】
1.一种基于伸缩卷积神经网络的引导区域密集人群计数方法,其特征在于该方法包括以下步骤:/n步骤一、人群计数数据集等级划分/n将图像熵定义为随机量的度量,对人群计数数据集中图片进行熵滤波处理,具体如下:/n从人群计数数据集任意选取一张图片,假定选取的图片尺寸大小为M*N,图片记为A,A所对应的直方图是一种离散的频率分布,直方图中每个矩形框的数值描述为相应灰度值的频率,直方图中所有矩形框代表的数值之和为图片中的像素总数量,即h(j):/n

【技术特征摘要】
1.一种基于伸缩卷积神经网络的引导区域密集人群计数方法,其特征在于该方法包括以下步骤:
步骤一、人群计数数据集等级划分
将图像熵定义为随机量的度量,对人群计数数据集中图片进行熵滤波处理,具体如下:
从人群计数数据集任意选取一张图片,假定选取的图片尺寸大小为M*N,图片记为A,A所对应的直方图是一种离散的频率分布,直方图中每个矩形框的数值描述为相应灰度值的频率,直方图中所有矩形框代表的数值之和为图片中的像素总数量,即h(j):



E为矩形框的个数,j表示为随机变量的概率分布,归一化直方图p(j)表示为:



则图像熵表示为:



对人群计数数据集中所有图片都进行图像熵运算,统计得到所有的图片的熵值,按熵值对相应的人群计数数据集图片进行排序,由于图像熵值反映图片内部信息的均匀程度,根据先验设置图像熵的阈值,对人群计数数据集进行等级划分,收集人群计数数据集中图像熵大于阈值的图片,生成新的密集人群数据集,即分布极其不均匀、遮挡严重、尺度差异较大的区域图片,也是在人群计数数据集中预测误差比较大的场景;
步骤二、引导区域选取
针对步骤一处理后的密集人群数据集,需获取重要区域信息,抑制干扰信息,得到适用于密集人群数据集的引导区域,这里提出一种算法来提取密集人群数据集中引导区域和保留更多的密集人群数据集上下文结构信息,具体如下:
2.1特征提取
针对密集人群数据集中每张训练图片,此处图片尺寸为512*512*3,分别依次通过卷积操作和池化模块,首先,将当前的训练图片输入到两个3*3的卷积核中,通道为64,得到512*512*64的特征图,512*512*64的特征图经过池化得到256*256*64的特征图;
然后,将256*256*64的特征图输入到两个3*3的卷积核中,通道为128,得到256*256*128的特征图,256*256*128的特征图经过池化得到128*128*128的特征图,将128*128*128的特征图C0按通道划分为两个128*128*64的特征图C1、C2;
对于密集人群数据集中512*512*3的训练图片,缩小一倍为256*256*3训练图片,将当前图片输入到三个3*3的卷积核中,通道为64,得到256*256*64的特征图,256*256*64的特征图经过池化得到128*128*64的特征图C3;
最后,特征图C2与特征图C3结合得到一个新的128*128*128的特征图C4,将C0和C4输入到1*1的卷积核中得到特征图O和引导图I;
上述所有卷积核的步距为1,补丁为1;池化的尺寸为2,步距为2;
2.2构造引导规则
使用1*1*1的卷积核对特征图O和引导图I做线性变换得到O1和I1,对O1和I1进行按像素累加结合,再经过RELU激活函数,再输入到1*1*1卷积核中做线性变换,最后通过Sigmoid激活函数得到关注图G;则Ii是对I进行下采样得到的与O相同尺寸的低分辨率特征图,在特征图O中对每个位置h,构造一个半径为r...

【专利技术属性】
技术研发人员:张硕孔亚广陈张平郑小青张帆赵晓东陈云
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1