人群计数系统中基于可变形高斯核的训练数据生成方法技术方案

技术编号:23853277 阅读:41 留言:0更新日期:2020-04-18 09:45
本发明专利技术涉及一种人群计数系统中基于可变形高斯核的训练数据生成方法,其步骤:从训练数据中找出一组相互重叠的高斯核;对被遮挡的高斯核进行伸缩;对被遮挡的高斯核进行旋转;对被遮挡的高斯核的中心点坐标进行调整;判断训练数据中是否还有未被选取过的高斯核,得到的带灰度数值的人群密度图作为训练数据输出。本发明专利技术有效地增加了训练数据的人群密度图与真实图像的特征相似性,使卷积神经网络更容易学习到训练数据与真实图像之间的规律,提高了人群计数系统的精确性。可以广泛在计算机视觉方向应用。

Training data generation method based on deformable Gaussian kernel in crowd counting system

【技术实现步骤摘要】
人群计数系统中基于可变形高斯核的训练数据生成方法
本专利技术涉及一种模式识别领域,特别是关于一种在计算机视觉方向应用的人群计数系统中基于可变形高斯核的训练数据生成方法。
技术介绍
近年来人群行为分析常用的基础方法是基于卷积神经网络深度学习的人群计数系统,其主要原理是:通过大量的训练,让卷积神经网络自动学习人类头部的主要特征(例如近似圆形,相对于背景来说颜色较深的头发等),最终将网络输出的卷积图与事先做好的、使用类似于人头形状的二维高斯核密度函数(以下简称高斯核)来表示每个人头所在的位置的人群密度图的对比差异。因为单个高斯核在人群密度图中的各个像素点处数值的积分之和为1,所以只需要统计输出的人群密度图中属于各个高斯核的像素点处数值的积分总和,系统就可以得到对原始画面中总人数的估计数值。系统将其对总人数的估计数值与训练数据中的实际数值,以及网络输出的卷积图与训练数据中的人群密度图之间的差异,作为网络反向误差传播的依据,最终通过迭代,修改网络中的相关参数,训练网络对于人头形状目标的识别能力。鉴于现有的绝大部分人群计数数据库中只给出图片中的人头二维坐标作为训练数据(即训练算法去完成的目标),为了便于系统将输出的人群密度图与训练数据进行误差比对,优化卷积神经网络的训练效果,系统需要将训练数据中每个人头的二维坐标,转化为画面中类似人头的形状。因此,人群计数系统的训练数据生成方法,均采用二维高斯核密度函数,以每个人头位置坐标为中心点,在画面中生成用于训练的模拟人头形状,以达到对更好训练效果。如上所述,人群计数系统的训练数据生成中,最关键的一个步骤就是以人头的二维坐标为中心点,生成与之对应的高斯核,为了解释高斯核的具体生成方法,首先将连续型二维高斯函数的表达式展示如下:其中(x0,y0)为该函数的中心点位置,即人头坐标。σx与σy分别为该函数在x轴方向与y轴方向的方差。考虑到人头基本可以视作圆形,为了便于计算,上述文献中默认取σx=σy。于是在离散域内,一个尺度为(2k+1)*(2k+1)离散的高斯核可以被表示为:其中A为为了使高斯核截止区域内各个像素点的高斯核灰度数值积分后等于1而设置的常数,其数值并不一定等于公式1中的项的数值,需要根据实际情况加以调整,调整的目的是使得属于同一个人头head对应的那个高斯核的各个离散像素点的灰度数值相加总和为1,因此,其计算方法如下:将公式3称为:传统人群计数系统的离散高斯核表达式。系统对训练数据中的每一个人头的坐标,重复上述过程,然后将生成的所有高斯核离散像素点的灰度数值以叠加的方式绘制在同一张画面中,就完成了训练数据的生成。然而在现实中人群图片中大量存在一个现象,即人头因为互相遮挡而出现重叠,并且按照透视关系原理,两个相互遮挡的人头在摄像机视角方向的中心点位置越接近,其相互重叠的面积比例越高。按照现有方法,相互重叠的两个人头都用各向均等的圆形的高斯核来代表,而在原始人群图片中位置靠前的人头拥有比较完整、清晰的圆形边缘,与训练数据中的圆形高斯核的形状非常近似,卷积神经网络可以比较容易地通过学习训练数据,将其识别出来;而位置靠后被遮挡的人头依照重叠程度的大小呈现不同程度的月牙形,其视觉重心向未重叠部分移动。此时,如果继续使用圆形高斯核,由于高斯核自身的性质,其越接近圆心处灰度数值越大,两个相互重叠的圆形高斯核的视觉重心位于其中心点连线附近。此时就会使得被遮挡的人头在原图中的视觉中心,不仅与对应的被遮挡的高斯核在训练数据人群密度图中得视觉重心不一致,还容易与遮挡其的人头对应的高斯核融合成一个整体,人群计数系统的卷积神经网络不容易通过对圆形的高斯核的训练,学习到被遮挡的人头的特征规律并将其与前方遮挡其的人头分开,最终导致训练效果差,系统输出的人群密度图不准确,人群计数的误差较大。
技术实现思路
针对上述问题,本专利技术的目的是提供一种人群计数系统中基于可变形高斯核的训练数据生成方法,其有效地增加了训练数据的人群密度图与真实图像的特征相似性,使卷积神经网络更容易学习到训练数据与真实图像之间的规律,提高了人群计数系统的精确性。为实现上述目的,本专利技术采取以下技术方案:一种人群计数系统中基于可变形高斯核的训练数据生成方法,其包括以下步骤:1)从训练数据中找出一组相互重叠的高斯核;2)对被遮挡的高斯核进行伸缩;3)对被遮挡的高斯核进行旋转;4)对被遮挡的高斯核的中心点坐标进行调整;5)判断训练数据中是否还有未被选取过的高斯核,得到的带灰度数值的人群密度图作为训练数据输出。进一步,所述步骤1)中,依次读取使用传统人群计数系统的高斯核生成的训练数据中每个高斯核的中心点坐标,将该高斯核记录为被选取过的高斯核,并找出与之距离最近的另一个高斯核的中心点坐标;若其中心点坐标之间的几何距离小于其方差相加之和,则认为这两个训练数据的高斯核在原始图片中所对应的人头之间发生重叠,即这两个高斯核之间发生重叠。进一步,每个高斯核只与和自身中心点坐标之间的几何距离最近的另一个进行是否相互重叠的判断,若判断结果为它们相互重叠,则将它们都作为被选取过的高斯核,然后转至步骤2);否则,转至步骤5)。进一步,所述步骤2)中,对于被判断为相互重叠的高斯核a与b,如果其中一个高斯核a的方差大于另一个高斯核b的方差,则认为是a对应的人头离拍摄人群画面摄像头的直线距离更近,在画面中a遮挡了b。进一步,对高斯核b沿坐标轴方向进行伸缩:将高斯核b的方差分解为分别沿x轴与y轴的两个相互独立的方差分量σb_x与σb_y,并默认将x轴方向作为高斯核a与b中心点坐标连线的方向;按照以下公式将被遮挡的高斯核b沿着x轴方向的方差分量减小,并保持高斯核b沿着y轴方向的方差分量不变:将伸缩后的高斯核b的方差代入传统人群计数系统的离散高斯核表达式,得到经过伸缩后的离散高斯核表达式。进一步,所述步骤3)中,假设人群密度图画面的x轴正向与高斯核a与b的中心点连线指向b的一端沿着反时针方向相差角度θ,则高斯核b需要以其中心点为原点,沿着反时针方向旋转角度θ;将属于人群密度图画面中的点的坐标(x,y)按照平面直角坐标系反时针方向旋转角度θ的坐标变换规则进行变换,得到该点在被遮挡的高斯核b旋转后的坐标系中的坐标(x*,y*);将该点在被遮挡的高斯核b旋转后的坐标系中的坐标代入经过伸缩后的离散高斯核表达式,得到经过伸缩、旋转后的离散高斯核表达式。进一步,所述坐标(x*,y*)为:进一步,所述步骤4)中,将高斯核b的中心点坐标沿着高斯核a与b的中心点连线方向,向着高斯核b的方向移动,移动的距离等于步骤2)中高斯核b的方差沿着x轴减少的数值进一步,所述高斯核b调整后的中心点坐标为:进一步,所述步骤5)中,如果训练数据中还有未被步骤1)选取过的高斯核,则转至步骤1);反之,则对人群密度图中每个像素点,将其所属的高斯核的灰度数值相加,并将得到的带灰度数值的人群密度图作本文档来自技高网
...

【技术保护点】
1.一种人群计数系统中基于可变形高斯核的训练数据生成方法,其特征在于包括以下步骤:/n1)从训练数据中找出一组相互重叠的高斯核;/n2)对被遮挡的高斯核进行伸缩;/n3)对被遮挡的高斯核进行旋转;/n4)对被遮挡的高斯核的中心点坐标进行调整;/n5)判断训练数据中是否还有未被选取过的高斯核,得到的带灰度数值的人群密度图作为训练数据输出。/n

【技术特征摘要】
1.一种人群计数系统中基于可变形高斯核的训练数据生成方法,其特征在于包括以下步骤:
1)从训练数据中找出一组相互重叠的高斯核;
2)对被遮挡的高斯核进行伸缩;
3)对被遮挡的高斯核进行旋转;
4)对被遮挡的高斯核的中心点坐标进行调整;
5)判断训练数据中是否还有未被选取过的高斯核,得到的带灰度数值的人群密度图作为训练数据输出。


2.如权利要求1所述训练数据生成方法,其特征在于:所述步骤1)中,依次读取使用传统人群计数系统的高斯核生成的训练数据中每个高斯核的中心点坐标,将该高斯核记录为被选取过的高斯核,并找出与之距离最近的另一个高斯核的中心点坐标;若其中心点坐标之间的几何距离小于其方差相加之和,则认为这两个训练数据的高斯核在原始图片中所对应的人头之间发生重叠,即这两个高斯核之间发生重叠。


3.如权利要求2所述训练数据生成方法,其特征在于:每个高斯核只与和自身中心点坐标之间的几何距离最近的另一个进行是否相互重叠的判断,若判断结果为它们相互重叠,则将它们都作为被选取过的高斯核,然后转至步骤2);否则,转至步骤5)。


4.如权利要求1所述训练数据生成方法,其特征在于:所述步骤2)中,对于被判断为相互重叠的高斯核a与b,如果其中一个高斯核a的方差大于另一个高斯核b的方差,则认为是a对应的人头离拍摄人群画面摄像头的直线距离更近,在画面中a遮挡了b。


5.如权利要求4所述训练数据生成方法,其特征在于:对高斯核b沿坐标轴方向进行伸缩:
将高斯核b的方差分解为分别沿x轴与y轴的两个相互独立的方差分量σb_x与σb_y,并默认将x轴方向作为高斯核a与b中心点坐标连线的方向;按照以下公式将被遮挡的高斯核b沿着x轴方向的...

【专利技术属性】
技术研发人员:刘阳倪国栋胡卫明李兵沈志忠孔祥斌
申请(专利权)人:通号通信信息集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1