适于大景深的人群特征识别网络构建及训练方法技术

技术编号:28037630 阅读:74 留言:0更新日期:2021-04-09 23:20
一种适于大景深的人群特征识别网络构建及训练方法,网络包括:前端网络采用剔除了全连接层的VGG‑16网络,并且采用3×3的卷积核;前端的VGG‑16网络中,进行了三次最大池化,用以降低特征图的分辨率;后端网络为三层分支网络,它们分别采用空洞率为2和3的空洞卷积。网络的训练步骤包括:1)生成密度图,2)损失函数,3)评估标准。本方案中,加入先验信息的loss:在网络训练时,使用L2距离作为损失函数,传统L2距离作为损失函数存在高估低密度区人群、低估高密度去人群的问题,使用分块计算损失函数的方法,大大减小了这个问题带来的误差,有效的提升了计数准确率。

【技术实现步骤摘要】
适于大景深的人群特征识别网络构建及训练方法
本专利技术涉及计算机视觉中的人群计数领域,具体是一种基于卷积神经网络、针对大景深人群特征的模型构建及训练方法。
技术介绍
人群计数的主要任务是从图像中识别人群特征,准确的计算出图像中的人群数量。早期的人群计数分为基于检测和基于回归的方法。在基于检测的方法中,使用一个滑动窗口检测器来检测场景中人群,并统计相应的人数。基于检测的方法主要分为两大类,一种是基于整体的检测,另一种是基于部分身体的检测。基于整体的检测方法,例如,典型的传统方法,主要训练一个分类器,利用从行人全身提取的小波,HOG,边缘等特征去检测行人。学习算法主要有SVM,boosting和随机森林等方法。基于整体的检测方法主要适用于稀疏的人群计数,但是随着人群密度的提升,人与人之间的遮挡变得越来越严重。所以基于部分身体检测的方法,被用来处理人群计数问题,它主要通过检测身体的部分结构,例如头,肩膀等去统计人群的数量。这种方法比之基于整体的检测,在效果上有略微的提升。基于回归的方法,主要思想是通过学习一种特征到人群数量的映射,这类方法步骤本文档来自技高网...

【技术保护点】
1.一种适于大景深的人群特征识别网络构建及训练方法,其特征是/n所述人群特征识别网络包括:/n网络前端:前端网络采用剔除了全连接层的VGG-16网络,并且采用3×3的卷积核;/n上采样层:前端的VGG-16网络中,进行了三次最大池化,用以降低特征图的分辨率;/n网络后端:后端网络为三层分支网络,它们分别采用空洞率为2和3的空洞卷积,空洞卷积的定义如下:/n

【技术特征摘要】
1.一种适于大景深的人群特征识别网络构建及训练方法,其特征是
所述人群特征识别网络包括:
网络前端:前端网络采用剔除了全连接层的VGG-16网络,并且采用3×3的卷积核;
上采样层:前端的VGG-16网络中,进行了三次最大池化,用以降低特征图的分辨率;
网络后端:后端网络为三层分支网络,它们分别采用空洞率为2和3的空洞卷积,空洞卷积的定义如下:



其中:x(m,n)是长宽分别为M和N的输入图像信息,经过卷积核w(i,j)得到空洞卷积的输出y(m,n);参数r表示空洞率;如果r=1,则空洞卷积是普通卷积;
所述人群特征网络的训练步骤包括:
1)生成密度图:
采用脉冲函数卷积高斯核的方式来定义密度图;
假设标注点的位置为xi,则具有N个头的标签设为H(x);如果假设在一个人头区域的周围,人群的密度是均匀的,它的最近邻给出了一个对于几何形变的合理的估计;
为了使得密度图能够...

【专利技术属性】
技术研发人员:田青唐绍鹏
申请(专利权)人:苏州玖合智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1