一种基于神经网络的视频行人检测方法技术

技术编号:15447672 阅读:174 留言:0更新日期:2017-05-29 21:53
本发明专利技术公开了一种基于神经网络的视频行人检测方法,包括以下步骤:步骤S1:提取视频中的一帧图像;步骤S2:将当前帧图像与已有背景图像对比进而生成前景运动对象图像并进行膨胀腐蚀运算;步骤S3:将前景运动对象图像进行归一化处理;步骤S4:在前景运动对象图像中提取HOG特征和LUV特征;步骤S5:将HOG特征和LUV特征输入预先已学习和训练好的神经网络并经神经网络处理检测出行人位置。本发明专利技术针对HOG‑SVM算法计算量大、计算速度慢的缺点,使用神经网络算法替代SVM分类器,使用HOG和LUV特征来描述图像,在保证准确率的基础上提高处理速度;并充分利用了混合高斯背景减除法滤除背景图像;算法计算速度快,准确率高。

A video pedestrian detection method based on Neural Network

The invention discloses a video pedestrian detection method based on neural network, which comprises the following steps: step S1: a frame image in the video; step S2: the current frame image and background image contrast and then generate a foreground object image and the expansion of corrosion operation; step S3: the prospect of moving object image normalized; step S4: extract HOG and LUV feature in the foreground moving objects in the image; step S5: HOG and LUV features of input has been learning and the trained neural network and the neural network processing to detect pedestrian position. The invention is based on HOG SVM algorithm of large amount of calculation, the calculation speed is slow, the use of neural network algorithm instead of SVM classifier, using the HOG and LUV feature to describe the image, while ensuring the accuracy of the processing speed is improved; and make full use of the mixed Gauss background subtraction method to filter the background image; the algorithm fast computation speed. High accuracy.

【技术实现步骤摘要】
一种基于神经网络的视频行人检测方法
本专利技术属于智能视频监控领域,尤其涉及一种基于神经网络的视频行人检测方法。
技术介绍
行人检测是一种在待检测的图像或者视频中发现行人并反馈行人位置信息和相对大小的方法。近年来行人检测在计算机视觉领域受到足够关注和重视,并且取得了很大的发展,使得行人检测的实用性获得增强。但是,在图像或视频内的行人由于运动形态、服饰穿着、拍摄时机等影响,行人的形态存在较大的变化。因此行人检测也成为了计算机视觉领域的一个研究难点。目前有多种检测行人的方法,其中基于机器学习的检测方法比例最大。该方法包括以下两方面:特征描述算子和学习算法。特征描述算子有haar小波、HOG(HistogramofOrientedGradient)、LBP(LocalBinaryPattern)、Shapelet特征以及边缘特征(edgelet)等。学习算法有支持向量机(SVM)、神经网络等。现有的主流技术解决方案是采用HOG特征+SVM分类器的方法,该方法采取对图像采用不同大小框架扫描,对每一幅扫描获得的图像提取HOG特征并利用训练好的SVM分类器对提取的特征进行分类,由于HOG特征在光照和偏移量上有较好的鲁棒性等特点,具有最佳的代表性。但由于采用了扫描的方法提取图像,造成了效率上的大浪费,并且在SVM的处理中计算量大,导致其计算速度不理想。同时由于只使用了一种特征,对行人的特征描述不够全面,在某些特殊场合的检测正确率偏低。故,针对目前现有技术中存在的上述缺陷,实有必要进行研究,以提供一种方案,解决现有技术中存在的缺陷。
技术实现思路
有鉴于此,确有必要提供一种检测速度快且准确率高的基于神经网络的视频行人检测方法。为了克服现有技术存在的缺陷,本专利技术提供以下技术方案:一种基于神经网络的视频行人检测方法,包括以下步骤:步骤S1:提取视频中的一帧图像;步骤S2:将当前帧图像与已有背景图像对比进而生成前景运动对象图像并进行膨胀腐蚀运算;步骤S3:将前景运动对象图像进行归一化处理;步骤S4:在前景运动对象图像中提取HOG特征和LUV特征;步骤S5:将HOG特征和LUV特征输入预先已学习和训练好的神经网络并经神经网络处理检测出行人位置。优选地,所述神经网络采用无隐层结构、单隐层结构或双隐层结构。优选地,在所述步骤S3中,将前景运动对象图像归一化到64像素*128像素大小。优选地,在所述步骤S2中,通过混合高斯算法将当前帧图像与已有背景图像对比进而生成二值化的前景运动对象图像。优选地,对二值化的前景运动对象图像进行膨胀腐蚀运算。优选地,进一步包括以下步骤:对二值化的前景运动对象图像进行一次膨胀运算;将经第一次膨胀运算处理的图像进行多次腐蚀运算;再将经腐蚀运算处理的图像进行多次膨胀运算。优选地,在所述步骤S4中,还包括将提取的HOG特征及LUV特征进行PCA降维的步骤。降维处理后提取HOG特征及LUV特征中最主要的一半维度。优选地,所述神经网络为采用单隐层结构的BP神经网络,采用优化为3780维的特征向量的输入结构、节点个数为80个的可提高检测精度的隐层结构。与现有技术相比较,针对HOG-SVM算法计算量大,计算速度慢的缺点,本专利技术使用神经网络算法替代SVM分类器,使用HOG和LUV特征来描述图像,在保证准确率的基础上还提高了处理速度;同时充分利用了混合高斯背景减除法除滤除背景图像,使得算法具有计算速度快,准确率高的优点。附图说明图1为本专利技术一种基于神经网络的视频行人检测方法的流程框图。图2为本专利技术用于试验使用的原始视频。图3为图2经过混合高斯背景减除处理后的黑白二值图。图4为图3经过一次膨胀运算处理后的黑白二值图。图5为图4经过两次腐蚀运算处理后的黑白二值图。图6为图5经过四次膨胀运算处理后的黑白二值图。图7为通过本文方法处理后的行人检测结果图。如下具体实施例将结合上述附图进一步说明本专利技术。具体实施方式以下将结合附图对本专利技术作进一步说明。参见图1,所示为本专利技术一种基于神经网络的视频行人检测方法的流程框图,包括以下步骤:步骤S1:提取视频中的一帧图像;步骤S2:将当前帧图像与已有背景图像对比进而生成前景运动对象图像并进行膨胀腐蚀运算;步骤S3:将前景运动对象图像进行归一化处理;步骤S4:在前景运动对象图像中提取HOG特征和LUV特征,其中LUV特征为LUV色彩空间,全称CIE1976(L,u,v)色彩空间,L表示物体亮度,u和v是色度。将LUV空间特征量化为1890维特征直方图,从而形成LUV直方图特征向量;步骤S5:将HOG特征和LUV特征输入预先已学习和训练好的神经网络并经神经网络处理检测出行人位置。在步骤S3中,将步骤S2得到的前景运动对象图像进行归一化到64像素*128像素(以下设计HOG特征的尺寸描述的单位均为像素)大小后进行HOG特征提取。由于神经网络对输入有严格要求,因此使用归一化将采集到的前景图像统一大小以便提取相同数量的特征维数。HOG特征提取的参数如下:检测窗口(64,128),块尺寸(16,16),块步长(8,16),cell尺寸(8,8),直方图bin个数9,最后获得共3780维特征向量。所述神经网络是单隐层结构的BP神经网络,在步骤S2中,通过混合高斯算法进行了图像相减除处理。该方法能屏蔽大部分周期性变化的运动目标,其模型为:图像序列I中的某一个特定像素{X0,Y0}可以表示为Xt表示时刻t像素{X0,Y0}的值。K是高斯分布的个数,ω(i,t)是时刻t第i个高斯分布的权重,μ(i,t)是时刻t第i个高斯分布的均值,C(i,t)是时刻t第i个高斯分布的协方差矩阵,若假设红绿蓝三像素相互独立,并且有相同的方差,则协方差矩阵可以表示为定义为C(i,t)=σi2I高斯密度公式,其形式为:η(Xt,μ,C)=1/((2π/n/2|C|2)exp(-1/2(Xt-μt)TC-1(XT-μT))(2)高斯模型参数更新公式如下:ω(k,t)=(1-α)ω(k,t-1)+α(M(k,t))(3)μt=(1-ρ)μ(t-1)+ρXt(4)σt2=(1-ρ)σ(t-1)2+ρ(Xt-μt)T(Xt-μt)(5)其中ρ=αη(Xt│μk,σk)。当MK,t=1即像素与某个高斯分布相匹配,则该高斯分布的权重增大,方差变小,选择权重与方差比值最高的b个高斯分布作为背景模型。某一像素与背景模型相匹配则认为该像素是背景像素,否则,则认为是前景像素,从而实现前景运动对象图像的提取。在提取视频前景运动对象图像时,首先将视频帧进行混合高斯背景减除,得到前景为白色背景为黑色的二值图。由于光照、摄像头抖动等原因,通过混合高斯背景减除后的视频帧依然存在不少噪点。为了解决这个问题,本专利技术对获得的黑白二值图进行膨胀腐蚀运算。为了防止真实的前景在腐蚀运算中被切割,本专利技术先运用了一次膨胀运算,以在后面的腐蚀运算时保证真实前景的连贯性。在通过两次腐蚀运算将黑背二值图中的噪点去除,最后通过四次膨胀运算将真正的前景图像加强。通过膨胀——腐蚀——膨胀处理后的黑白二值图可以很好的表示前景所在区域。参见图2至图6,所示为视频在上述处理中所展现的黑白二值图。在步骤S4中,HOG特征提取分为了以下几个步骤:①平方根Gamma空间和颜色空间标准化。②像素梯本文档来自技高网...
一种基于神经网络的视频行人检测方法

【技术保护点】
一种基于神经网络和双特征融合的视频行人检测方法,其特征在于,包括以下步骤:步骤S1:提取视频中的一帧图像;步骤S2:将当前帧图像与已有背景图像对比进而生成前景运动对象图像并进行膨胀腐蚀运算;步骤S3:将前景运动对象图像进行归一化处理;步骤S4:在前景运动对象图像中提取HOG特征和LUV特征;步骤S5:将HOG特征和LUV特征输入预先已学习和训练好的神经网络并经神经网络处理检测出行人位置。

【技术特征摘要】
1.一种基于神经网络和双特征融合的视频行人检测方法,其特征在于,包括以下步骤:步骤S1:提取视频中的一帧图像;步骤S2:将当前帧图像与已有背景图像对比进而生成前景运动对象图像并进行膨胀腐蚀运算;步骤S3:将前景运动对象图像进行归一化处理;步骤S4:在前景运动对象图像中提取HOG特征和LUV特征;步骤S5:将HOG特征和LUV特征输入预先已学习和训练好的神经网络并经神经网络处理检测出行人位置。2.根据权利要求1所述的一种基于神经网络和双特征融合的视频中的行人检测方法,其特征在于,所述神经网络采用无隐层结构、单隐层结构或双隐层结构。3.根据权利要求1或2所述的基于神经网络和双特征融合的视频行人检测方法,其特征在于,在所述步骤S3中,为HOG特征提取提供的图像为将前景运动图像进行归一化到64像素*...

【专利技术属性】
技术研发人员:邵李焕陈少博
申请(专利权)人:杭州派尼澳电子科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1