一种基于卷积神经网络的视频行人识别方法技术

技术编号:14812502 阅读:112 留言:0更新日期:2017-03-15 03:34
本发明专利技术公开了一种基于卷积神经网络的视频行人识别方法,包括以下步骤:读取视频库中的视频,截取视频帧,并提取视频帧的HOG特征;构建卷积神经网络并训练;选取若干个人物特征属性,为每一个人物特征属性设计一个支持向量机分类器并进行训练;将HOG特征输入到训练好的卷积神经网络模型得到优选特征;将优选特征输入到每个训练好的支持向量机分类器,对各属性特征进行筛选分类。本发明专利技术的有益效果是:本发明专利技术采用卷积神经网络的方法体现出更好的识别率,提取HOG特征能使计算量降低,速度提高,构建的卷积神经网络具有一定深度,同时结合支持向量机进行多次分类,将大大提高识别效率和准确度。

【技术实现步骤摘要】

本专利技术涉及模式识
,特别涉及一种基于卷积神经网络的视频行人识别方法
技术介绍
随着多媒体技术和互联网技术的发展,视频行人识别也是近年来计算机视觉领域的热门研究对象,在智能交通、寻人、安全方面都有广阔的应用前景。视频行人识别的一种传统识别算法为人工神经网络,它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型。基于人工神经网络的训练算法为反向传播算法,它使得网络模型经过对大量训练样本进行学习的过程能够获得统计规律,从而对未知事件做出预测。人工神经网络优点在于具有较强的非线性映射能力、自学习和自适应能力、泛化能力和一定的容错能力,但存在以下缺点,在行人识别样本训练时收敛速度慢,且其训练过程为监督过程,而对训练样本的标注既费时又费力,并且视频行人识别涉及到大量数据的计算和分析,外加一些环境因素的干扰,传统识别算法无法提取到图像的优选特征,导致识别率有限。
技术实现思路
本专利技术的目的在于提供一种识别成功率高、训练样本稳定、计算量低、速度快的基于卷积神经网络的视频行人识别方法。为了实现上述专利技术目的,本专利技术提供了一种基于卷积神经网络的视频行人识别方法,包括以下步骤:步骤101:读取视频库中的视频,截取视频帧,并利用HOG特征提取算法提取视频帧的HOG特征;步骤102:构建卷积神经网络,并利用步骤101得到的HOG特征对所述卷积神经网络进行训练,得到训练好的卷积神经网络模型;<br>步骤103:选取若干个代表性的人物特征属性,包括外部相关属性和人体相关属性,为每一个人物特征属性设计一个支持向量机分类器,同样利用步骤101得到的HOG特征分别对支持向量机分类器进行训练,得到最终训练好的支持向量机分类器;步骤104:将步骤101得到的HOG特征输入到训练好的卷积神经网络模型,进行一次弱分类,通过多次卷积和下采样过程得到优选特征;步骤105:将得到的优选特征输入到每个训练好的支持向量机分类器,对各属性特征进行筛选分类,最终得到若干组分别与人物特征属性相对应的数据集,每个数据集包含与具有相同人物特性属性的视频帧相对应的数据。所述步骤101中,利用HOG特征提取算法提取视频帧的HOG特征,具体为:步骤201、将视频帧灰度化;步骤202、采用Gamma校正法对输入视频帧进行颜色空间的归一化;步骤203、计算视频帧每个像素的梯度,包括大小和方向;步骤204、将视频帧划分成小单元格,每单元格为6*6像素;步骤205、统计每个单元格的梯度直方图,即可形成每个单元格的特征描述器;步骤206、将每九个单元格组成一个区间,一个区间内所有单元格的特征描述器串联起来,得到该区间的特征描述器;步骤207、再将同一视频帧内所有区间的特征描述器串联起来,得到该视频帧对应的特征描述器。所述步骤102中,构建的卷积神经网络为包含九个隐含层的卷积神经网络,具体为:第一层卷积层C1:设定2个特征平面,卷积核大小为5×5;第一层下采样层S1:设定2个特征平面,池化窗口大小为2×2;第二层卷积层C2:设定4个特征平面,卷积核大小为5×5;第二层下采样层S2:设定4个特征平面,池化窗口大小为2×2;第三层卷积层C3:设定8个特征平面,卷积核大小为5×5;第三层下采样层S3:设定8个特征平面,池化窗口大小为2×2;第四层卷积层C4:设定16个特征平面,卷积核大小为5×5;第四层下采样层S4:设定16个特征平面,池化窗口大小为2×2;最后一层输出层。其中,所述卷积神经网络中的卷积核选取Roberts算子和Prewitt算子,利用牛顿法,调整神经网络权值。所述步骤102中,用HOG特征对所述卷积神经网络模型进行训练具体为:步骤1:对每一隐含层的输出进行反卷积,将反卷积结果与该层的输入特征对比得到误差E;步骤2:通过牛顿法调整卷积核权值,公式为:其中W*为更新的权值,E′(w)和E″(w)分别是误差对权值的一阶和二阶偏导;运用步骤1和步骤2,通过对所有训练样本的10次迭代训练,即对网络权值的10次更新,训练得到能够提取图像优选特征的卷积神经网络模型。其中,步骤103中,所述外部相关属性包括:带帽、戴眼镜、背包、上衣颜色多样、下衣颜色单一和鞋子颜色单一;所述人体相关属性:男性、女性、身高大于1.7m、身高小于等于1.7m。所述步骤103中,利用HOG特征对支持向量机分类器进行训练具体为:利用顺序最小优化算法,将HOG特征输入支持向量机分类器中训练,得到模型,由模型生成检测子;支持向量机分类器在训练过程中的核函数选用多项式函数。所述步骤104中,卷积过程包括:用一个可训练的滤波器fx去卷积一个输入的视频帧,然后加一个偏置bx,得到卷积层Cx;下采样过程包括:每邻域四个像素求和变为一个像素,然后通过标量Wx+1加权,再增加偏置bx+1,然后通过一个sigmoid激活函数,产生一个约缩小四倍的特征映射图Sx+1。其中,x为当前卷积层所处的层数。本专利技术的有益效果是:本专利技术与传统的行人识别方法相比,采用卷积神经网络的方法体现出更好的识别率,提取HOG特征能使计算量降低,速度提高,构建的卷积神经网络具有一定深度,同时结合支持向量机进行多次分类,将大大提高识别效率和准确度。附图说明图1为本专利技术基于卷积神经网络的视频行人识别方法的流程图。具体实施方式卷积神经网络是今年来广泛应用于图像处理等领域的一种高效识别算法,是神经网络的一种结构。神经网络的优化目标是基于经验风险最小化,易陷入局部最优,训练结果不太稳定,一般需要大样本;而支持向量机有严格的理论和数学基础,基于结构风险最小化原则,泛化能力优于前者,算法具有全局最优性,是针对小样本统计的理论。因此先用卷积神经网络对视频帧进行第一次分类得到优选特征,再用支持向量机进行二次分类将提高识别成功率。参见图1,本专利技术实施例提供了一种基于卷积神经网络的视频行人识别方法,包括以下步骤:步骤101:读取视频库中的视频,截取视频帧,并利用HOG特征提取算法提取视频帧的HOG特征;步骤102:构建卷积神经网络,并利用步骤101得到的HOG特征对所述卷积神经网络进行训练,得到训练好的卷积神经网络模型;步骤103:选取若干个代表性的人物特征属性,包括外部相关属性和人体相关属性,为每一个人物特征属性设计一个支持向量机分类器,同样利用步骤101得到的HOG特征分别对支持向量机分类器进行训练,得到最终训练好的支持向量机分类器;步骤104本文档来自技高网...

【技术保护点】
一种基于卷积神经网络的视频行人识别方法,其特征在于,包括以下步骤:步骤101:读取视频库中的视频,截取视频帧,并利用HOG特征提取算法提取视频帧的HOG特征;步骤102:构建卷积神经网络,并利用步骤101得到的HOG特征对所述卷积神经网络进行训练,得到训练好的卷积神经网络模型;步骤103:选取若干个代表性的人物特征属性,包括外部相关属性和人体相关属性,为每一个人物特征属性设计一个支持向量机分类器,同样利用步骤101得到的HOG特征分别对支持向量机分类器进行训练,得到最终训练好的支持向量机分类器;步骤104:将步骤101得到的HOG特征输入到训练好的卷积神经网络模型,进行一次弱分类,通过多次卷积和下采样过程得到优选特征;步骤105:将得到的优选特征输入到每个训练好的支持向量机分类器,对各属性特征进行筛选分类,最终得到若干组分别与人物特征属性相对应的数据集,每个数据集包含与具有相同人物特性属性的视频帧相对应的数据。

【技术特征摘要】
1.一种基于卷积神经网络的视频行人识别方法,其特征在于,包括以下步骤:
步骤101:读取视频库中的视频,截取视频帧,并利用HOG特征提取算法提取视频帧的
HOG特征;
步骤102:构建卷积神经网络,并利用步骤101得到的HOG特征对所述卷积神经网络进行
训练,得到训练好的卷积神经网络模型;
步骤103:选取若干个代表性的人物特征属性,包括外部相关属性和人体相关属性,为
每一个人物特征属性设计一个支持向量机分类器,同样利用步骤101得到的HOG特征分别对
支持向量机分类器进行训练,得到最终训练好的支持向量机分类器;
步骤104:将步骤101得到的HOG特征输入到训练好的卷积神经网络模型,进行一次弱分
类,通过多次卷积和下采样过程得到优选特征;
步骤105:将得到的优选特征输入到每个训练好的支持向量机分类器,对各属性特征进
行筛选分类,最终得到若干组分别与人物特征属性相对应的数据集,每个数据集包含与具
有相同人物特性属性的视频帧相对应的数据。
2.根据权利要求1所述的基于卷积神经网络的视频行人识别方法,其特征在于,所述步
骤101中,利用HOG特征提取算法提取视频帧的HOG特征,具体为:
步骤201、将视频帧灰度化;
步骤202、采用Gamma校正法对输入视频帧进行颜色空间的归一化;
步骤203、计算视频帧每个像素的梯度,包括大小和方向;
步骤204、将视频帧划分成小单元格,每单元格为6*6像素;
步骤205、统计每个单元格的梯度直方图,即可形成每个单元格的特征描述器;
步骤206、将每九个单元格组成一个区间,一个区间内所有单元格的特征描述器串联起
来,得到该区间的特征描述器;
步骤207、将同一视频帧内所有区间的特征描述器串联起来,得到该视频帧对应的特征
描述...

【专利技术属性】
技术研发人员:舒泓新蔡晓东梁晓曦王爱华
申请(专利权)人:中通服公众信息产业股份有限公司
类型:发明
国别省市:新疆;65

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1