一种基于卷积神经网络的视频行人识别方法技术

技术编号：14812502 阅读：112 留言：0更新日期：2017-03-15 03:34

本发明专利技术公开了一种基于卷积神经网络的视频行人识别方法，包括以下步骤：读取视频库中的视频，截取视频帧，并提取视频帧的HOG特征；构建卷积神经网络并训练；选取若干个人物特征属性，为每一个人物特征属性设计一个支持向量机分类器并进行训练；将HOG特征输入到训练好的卷积神经网络模型得到优选特征；将优选特征输入到每个训练好的支持向量机分类器，对各属性特征进行筛选分类。本发明专利技术的有益效果是：本发明专利技术采用卷积神经网络的方法体现出更好的识别率，提取HOG特征能使计算量降低，速度提高，构建的卷积神经网络具有一定深度，同时结合支持向量机进行多次分类，将大大提高识别效率和准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模式识
，特别涉及一种基于卷积神经网络的视频行人识别方法。
技术介绍
随着多媒体技术和互联网技术的发展，视频行人识别也是近年来计算机视觉领域的热门研究对象，在智能交通、寻人、安全方面都有广阔的应用前景。视频行人识别的一种传统识别算法为人工神经网络，它从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型。基于人工神经网络的训练算法为反向传播算法，它使得网络模型经过对大量训练样本进行学习的过程能够获得统计规律，从而对未知事件做出预测。人工神经网络优点在于具有较强的非线性映射能力、自学习和自适应能力、泛化能力和一定的容错能力，但存在以下缺点，在行人识别样本训练时收敛速度慢，且其训练过程为监督过程，而对训练样本的标注既费时又费力，并且视频行人识别涉及到大量数据的计算和分析，外加一些环境因素的干扰，传统识别算法无法提取到图像的优选特征，导致识别率有限。
技术实现思路
本专利技术的目的在于提供一种识别成功率高、训练样本稳定、计算量低、速度快的基于卷积神经网络的视频行人识别方法。为了实现上述专利技术目的，本专利技术提供了一种基于卷积神经网络的视频行人识别方法，包括以下步骤：步骤101：读取视频库中的视频，截取视频帧，并利用HOG特征提取算法提取视频帧的HOG特征；步骤102：构建卷积神经网络，并利用步骤101得到的HOG特征对所述卷积神经网络进行训练，得到训练好的卷积神经网络模型；<...

【技术保护点】
一种基于卷积神经网络的视频行人识别方法，其特征在于，包括以下步骤：步骤101：读取视频库中的视频，截取视频帧，并利用HOG特征提取算法提取视频帧的HOG特征；步骤102：构建卷积神经网络，并利用步骤101得到的HOG特征对所述卷积神经网络进行训练，得到训练好的卷积神经网络模型；步骤103：选取若干个代表性的人物特征属性，包括外部相关属性和人体相关属性，为每一个人物特征属性设计一个支持向量机分类器，同样利用步骤101得到的HOG特征分别对支持向量机分类器进行训练，得到最终训练好的支持向量机分类器；步骤104：将步骤101得到的HOG特征输入到训练好的卷积神经网络模型，进行一次弱分类，通过多次卷积和下采样过程得到优选特征；步骤105：将得到的优选特征输入到每个训练好的支持向量机分类器，对各属性特征进行筛选分类，最终得到若干组分别与人物特征属性相对应的数据集，每个数据集包含与具有相同人物特性属性的视频帧相对应的数据。

【技术特征摘要】
1.一种基于卷积神经网络的视频行人识别方法，其特征在于，包括以下步骤：
步骤101：读取视频库中的视频，截取视频帧，并利用HOG特征提取算法提取视频帧的
HOG特征；
步骤102：构建卷积神经网络，并利用步骤101得到的HOG特征对所述卷积神经网络进行
训练，得到训练好的卷积神经网络模型；
步骤103：选取若干个代表性的人物特征属性，包括外部相关属性和人体相关属性，为
每一个人物特征属性设计一个支持向量机分类器，同样利用步骤101得到的HOG特征分别对
支持向量机分类器进行训练，得到最终训练好的支持向量机分类器；
步骤104：将步骤101得到的HOG特征输入到训练好的卷积神经网络模型，进行一次弱分
类，通过多次卷积和下采样过程得到优选特征；
步骤105：将得到的优选特征输入到每个训练好的支持向量机分类器，对各属性特征进
行筛选分类，最终得到若干组分别与人物特征属性相对应的数据集，每个数据集包含与具
有相同人物特性属性的视频帧相对应的数据。
2.根据权利要求1所述的基于卷积神经网络的视频行人识别方法，其特征在于，所述步
骤101中，利用HOG特征提取算法提取视频帧的HOG特征，具体为：
步骤201、将视频帧灰度化；
步骤202、采用Gamma校正法对输入视频帧进行颜色空间的归一化；
步骤203、计算视频帧每个像素的梯度，包括大小和方向；
步骤204、将视频帧划分成小单元格，每单元格为6*6像素；
步骤205、统计每个单元格的梯度直方图，即可形成每个单元格的特征描述器；
步骤206、将每九个单元格组成一个区间，一个区间内所有单元格的特征描述器串联起
来，得到该区间的特征描述器；
步骤207、将同一视频帧内所有区间的特征描述器串联起来，得到该视频帧对应的特征
描述...

【专利技术属性】
技术研发人员：舒泓新，蔡晓东，梁晓曦，王爱华，
申请(专利权)人：中通服公众信息产业股份有限公司，
类型：发明
国别省市：新疆;65

全部详细技术资料下载我是这个专利的主人