一种基于改进的Hog特征结合神经网络的图像行人检测方法技术

技术编号:22102200 阅读:37 留言:0更新日期:2019-09-14 03:26
本发明专利技术公开了一种基于改进的Hog特征结合神经网络的图像行人检测方法,通过使用方向可控滤波器算法来计算图像像素梯度,提高运算速率。另外,在进行行人检测时,不是用固定的窗口滑动整张图像进行检测,而是用帧差分法先确定了运动区域,并将运动区域进行一定的缩放,在所在区域进行检测,减少运算的时间,提高检测效率。

An image pedestrian detection method based on improved Hog feature and neural network

【技术实现步骤摘要】
一种基于改进的Hog特征结合神经网络的图像行人检测方法
本专利技术涉及机器视觉检测的
,尤其涉及到一种基于改进的Hog特征结合神经网络的图像行人检测方法。
技术介绍
行人检测是利用计算机视觉技术判断图像或视频序列中是否存在行人并给予精确的定位。经典的行人检测方法使用的是hog特征加svm分类器实现的,该方法采取对图像采用固定窗口扫描,对每一幅扫描获得hog特征并利用训练好的svm分类器对提取的特征进行分类。但由于行人衣着服饰的各异,行人可能出现不同的姿态,摄像机位置造成的行人在图像或视频的角度不同,需要收集大量的样本。但是带核函数的(非线性)的svm分类器在处理大量数据时会消耗大量的运行内存和时间,且分类的效果在此情况下也不是很好,svm分类器较适合做小样本问题。神经网络处于一个快速发展的地位,首先是因为在神经网络训练过程中整合了特征提取,再者,在大数据时代的今天,获取大型数据集不再是什么难题,最后,随着技术的进步,让内存和计算性能“民主化”。因此,用神经网络来实行基于大样本的行人检测是可行有效的。hog特征是提取图像边缘梯度是的一种方法,具有较好的鲁棒性,但在传统的梯度计算中,采用的是较为简单的。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种检测精确度高、检测效率高的基于方向可控滤波器Hog特征结合神经网络的图像行人检测方法。为实现上述目的,本专利技术所提供的技术方案为:包括以下几个阶段:学习阶段:S1-1:建立行人样本库,包括一半的行人样本以及一半的非行人样本;S1-2:对步骤S1-1中的样本进行预处理,将彩色图片灰度化;S1-3:对预处理后的样本提取Hog特征向量;S1-4:建立神经网络,对提取的Hog特征向量进行训练,获取网络权重参数;测试阶段:S2-1:对待检测的图片样本进行与学习阶段相同的预处理;S2-2:计算通过步骤S2-1获得的预处理后的图片的Hog特征向量;S2-3:将步骤S2-2得到的特征向量对训练后的神经网络模型进行测试,计算网络模型的正确率,按实际结果调整网络结构;应用阶段:S3-1:采用帧间差分法提取视频运动物体的区域,根据区域的大小进行缩放,区域若小于固定滑动窗口,将区域放大到窗口大小,提取区域的Hog特征用神经网络来判断是否为行人。进一步地,所述步骤S1-3及步骤S2-2中,提取Hog特征向量的具体步骤如下:A1:使用方向可控滤波器计算每个像素的梯度;A2:构建细胞单元格并统计其梯度直方图;A3:把区块所有的细胞单元的特征向量串联起来并进行归一化,得到该区块的Hog特征;A4:将全部区块的特征向量串联起来,得到样本的Hog特征描述子。进一步地,所述步骤A1使用方向可控滤波器计算每个像素的梯度的具体步骤如下:采用高斯二阶导数所构成可控滤波器,形式如下:其中,分别为高斯函数在对应方向的二阶导数,具体表达式如下:对应系数分为:构造水平方向和垂直方向的方向可控滤波器,分别记为F0,Fπ/2,计算灰度图像(x,y)处像素点在水平方向和垂直方向的梯度值GX(x,y),Gy(x,y):Gx(x,y)=F0*I;Gy(x,y)=Fπ/2*I;其中,I为灰度图像;然后分别计算梯度的方向和幅值:进一步地,所述步骤A2中,梯度方向的范围为0~180度,分成九个部分,即直方图有九个区间,每个区间范围为20度;直方图投票采取加权投票,即每个像素的梯度幅值作为投票权重,得到一个九维的特征向量。进一步地,所述步骤S3-1的具体过程如下:B1:获取视频源;B2:采用帧间差分法确定运动区域;B3:采用固定窗口进行滑动;B4:判断窗口是否有目标,若有,则储存目标区域坐标;若没有,则返回步骤B3;B5:判断是否已遍历运动区域,若是,则结束;若不是,则返回步骤B3。进一步地,所述步骤B2中,将视频流中相邻两帧或相隔几帧图像的两幅图像像素值相减,并对相减后的图像进行阈值化来提取图像中的运动区域;若相减两帧图像的帧数分别为第k帧,第(k+1)帧,则其帧图像分别为:fk(x,y),fk+1(x,y);差分图像二值化阈值为T,差分图像用D(x,y)表示,则帧间差分法的公式如下:与现有技术相比,本方案原理和优点如下:1.现在计算机视觉领域的是以神经网络为基础的深度学习占据统治地位,其优势在大样本在大样本数据的情况下能够发挥其所用,svm是传统机器学习算法,适合做小样本,模型不复杂的实际应用,但在情况复杂,需要大量样本时,有着一定的缺点,比如会消耗大量时间成本和内存。因此,神经网络在此行人检测模型中可获得较svm分类器更好的效果。2.使用方向可控滤波器算法来计算图像像素梯度,提高运算速率。3.在进行行人检测时,不是用64*128窗口滑动整张图像进行检测,而是用帧差分法先确定了运动区域,并将运动区域进行一定的缩放,再所在区域进行检测,减少了运算的时间,提高了检测效率。附图说明图1为本专利技术一种基于改进的Hog特征结合神经网络的图像行人检测方法的工作流程图;图2为行人样本图;图3为图2的梯度幅值图;图4为Hog特征提取流程图;图5为监控视频行人检测流程图;图6为效果图。具体实施方式下面结合具体实施例对本专利技术作进一步说明:如图1所示,本实施例所述的一种基于改进的Hog特征结合神经网络的图像行人检测方法,包括以下步骤:学习阶段:S1-1:建立行人样本库;公路监控的分辨率为1280*64,按照实际行人在视频监控的比例,取样本尺寸大小为64*128,一共三万张,一半为正样本,即行人样本,一半为负样本,即非行人样本,并做好标签,正样本为1,负样本为0,其中的百分之七十为训练样本,百分之三十为测试样本;S1-2:对步骤S1-1中的样本进行预处理,将彩色图片灰度化;S1-3:对预处理后的样本提取Hog特征向量;S1-4:提取Hog特征向量后,建立神经网络,对提取的Hog特征向量进行训练,获取网络权重参数;测试阶段:S2-1:对待检测的图片样本进行与学习阶段相同的预处理;S2-2:计算通过步骤S2-1获得的预处理后的图片的Hog特征向量;S2-3:将步骤S2-2得到的特征向量对训练后的神经网络模型进行测试,计算网络模型的正确率,若满足要求,则进入应用阶段,否则,按实际结果调整网络结构,并返回步骤S1-3;应用阶段:S3-1:采用帧间差分法提取视频运动物体的区域,根据区域的大小进行缩放,区域若小于固定滑动窗口,将区域放大到窗口大小,提取区域的Hog特征用神经网络来判断是否为行人。如图4所示,上述步骤S1-3及步骤S2-2中,提取Hog特征向量的具体步骤如下:A1:使用方向可控滤波器计算每个像素的梯度:采用高斯二阶导数所构成可控滤波器,形式如下:其中,分别为高斯函数在对应方向的二阶导数,具体表达式如下:对应系数分为:构造水平方向和垂直方向的方向可控滤波器,分别记为F0,Fπ/2,计算灰度图像(x,y)处像素点在水平方向和垂直方向的梯度值GX(x,y),Gy(x,y):Gx(x,y)=F0*I;Gy(x,y)=Fπ/2*I;其中,I为灰度图像;然后分别计算梯度的方向和幅值:参见行人样本图2以及其梯度幅值图3,可以看出行人的边缘轮廓得到很好的提取,边缘越明显,说明其梯度值越大,其参与下文直方图统计的比重就越大,行人的特征就越突出;本文档来自技高网...

【技术保护点】
1.一种基于改进的Hog特征结合神经网络的图像行人检测方法,其特征在于,包括以下几个阶段:学习阶段:S1‑1:建立行人样本库,包括一半的行人样本以及一半的非行人样本;S1‑2:对步骤S1‑1中的样本进行预处理,将彩色图片灰度化;S1‑3:对预处理后的样本提取Hog特征向量;S1‑4:建立神经网络,对提取的Hog特征向量进行训练,获取网络权重参数;测试阶段:S2‑1:对待检测的图片样本进行与学习阶段相同的预处理;S2‑2:计算通过步骤S2‑1获得的预处理后的图片的Hog特征向量;S2‑3:将步骤S2‑2得到的特征向量对训练后的神经网络模型进行测试,计算网络模型的正确率,若满足要求,则进入应用阶段,否则,按实际结果调整网络结构,并返回步骤S1‑3;应用阶段:S3‑1:采用帧间差分法提取视频运动物体的区域,根据区域的大小进行缩放,区域若小于固定滑动窗口,将区域放大到窗口大小,提取区域的Hog特征用神经网络来判断是否为行人。

【技术特征摘要】
1.一种基于改进的Hog特征结合神经网络的图像行人检测方法,其特征在于,包括以下几个阶段:学习阶段:S1-1:建立行人样本库,包括一半的行人样本以及一半的非行人样本;S1-2:对步骤S1-1中的样本进行预处理,将彩色图片灰度化;S1-3:对预处理后的样本提取Hog特征向量;S1-4:建立神经网络,对提取的Hog特征向量进行训练,获取网络权重参数;测试阶段:S2-1:对待检测的图片样本进行与学习阶段相同的预处理;S2-2:计算通过步骤S2-1获得的预处理后的图片的Hog特征向量;S2-3:将步骤S2-2得到的特征向量对训练后的神经网络模型进行测试,计算网络模型的正确率,若满足要求,则进入应用阶段,否则,按实际结果调整网络结构,并返回步骤S1-3;应用阶段:S3-1:采用帧间差分法提取视频运动物体的区域,根据区域的大小进行缩放,区域若小于固定滑动窗口,将区域放大到窗口大小,提取区域的Hog特征用神经网络来判断是否为行人。2.根据权利要求1所述的一种基于改进的Hog特征结合神经网络的图像行人检测方法,其特征在于,所述步骤S1-3及步骤S2-2中,提取Hog特征向量的具体步骤如下:A1:使用方向可控滤波器计算每个像素的梯度;A2:构建细胞单元格并统计其梯度直方图;A3:把区块所有的细胞单元的特征向量串联起来并进行归一化,得到该区块的Hog特征;A4:将全部区块的特征向量串联起来,得到样本的Hog特征描述子。3.根据权利要求2所述的一种基于改进的Hog特征结合神经网络的图像行人检测方法,其特征在于,所述步骤A1使用方向可控滤波器计算每个像素的梯度的具体步骤如下:采用高斯...

【专利技术属性】
技术研发人员:姚涛张祺
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1