一种基于自适应特征通道的行人检测方法技术

技术编号：21141786 阅读：24 留言：0更新日期：2019-05-18 05:21

本发明专利技术公开了一种基于自适应特征通道的行人检测方法，包括如下步骤：步骤一，获取Caltech行人数据帧，基于该数据帧捕获训练集和验证集；步骤二，缩放训练集和验证集图像；步骤三，将标准化后图像作为模型输入数据；步骤四，基于Caffe开源深度学习框架设计卷积神经网络，输出图像包含行人与否的信息、行人的位置信息以及该位置存在行人的可能性；步骤五，计算模型的输出信息与对应标注信息的损失，优化并训练模型；步骤六，利用优化后的模型参数，检测真实场景图像中存在的行人，得到相应的行人检测框。本发明专利技术基于卷积神经网络，采用了转移学习以及多任务联合学习的技术，实现了端到端的行人检测方法，为行人检测的后续操作提供了重要的技术支持。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自适应特征通道的行人检测方法
本专利技术涉及卷积神经网络和行人检测技术，尤其涉及基于卷积神经网络的自适应特征通道的行人检测方法。
技术介绍
行人检测是计算机视觉中重要的研究课题之一，其研究结果对于其它的视觉任务有着重要的影响作用。行人检测目前已广泛应用于车辆辅助驾驶、智能视频监控以及人机交互系统，但在某些复杂的场景中，还存在检测性能低下的问题。行人属于柔性物体，其不同的姿势和扮相都会在一定程度上造成行人间差距变大，使得行人难以检测。随着深度学习和机器学习的稳步发展，利用卷积神经网络学习目标特征受到了研究者们的极大追捧，同时行人检测技术也得到了大的突破。目前基于卷积神经网络的行人检测方法分为单阶段网络和两阶段网络，单阶段网络中比较经典的算法包括：YOLO系列算法、SSD网络以及RPN网络等，而两阶段网络包括：RCNN系列算法以及基于RCNN改进的算法等。行人检测方法研究的难点在于如何消除行人的类内差距，并学习有效的分类与回归特征。
技术实现思路
本专利技术为解决真实场景中行人的检测与识别问题，为行人检测的后续操作提供了重要的技术支持，可应用于车辆辅助驾驶、智能视频监控以及人机交互系统。本专利技术采用的技术方案是：一种基于自适应特征通道的行人检测方法，包括以下步骤：1)、获取Caltech行人数据帧，基于该数据帧捕获训练集图像和验证集图像，用于检测模型的训练与评估；2)、将训练集图像和验证集图像大小均缩放至M×N，M和N分别为缩放后图像的宽和高，并根据缩放系数更新对应的行人位置数据；3)、以减去ImageNet数据集的RGB通道均值形式对训练集图像和验证集...

【技术保护点】
1.一种基于自适应特征通道的行人检测方法，其特征在于，包括以下步骤：1)、获取Caltech行人数据帧，基于该数据帧捕获训练集图像和验证集图像，用于检测模型的训练与评估；2)、将训练集图像和验证集图像大小均缩放至M×N，M和N分别为缩放后图像的宽和高，并根据缩放系数更新对应的行人位置数据；3)、以减去ImageNet数据集的RGB通道均值形式对训练集图像和验证集图像进行标准化，标准化的数据作为模型的输入数据；4)、基于Caffe开源深度学习框架设计卷积神经网络，输出图像包含行人与否的信息、行人的位置信息以及该位置存在行人的可能性；5)、计算模型输出信息与对应标注信息的损失，优化并训练检测模型；6)、利用优化后的模型参数，检测真实场景图像中是否存在行人，得到相应的行人检测框。

【技术特征摘要】
1.一种基于自适应特征通道的行人检测方法，其特征在于，包括以下步骤：1)、获取Caltech行人数据帧，基于该数据帧捕获训练集图像和验证集图像，用于检测模型的训练与评估；2)、将训练集图像和验证集图像大小均缩放至M×N，M和N分别为缩放后图像的宽和高，并根据缩放系数更新对应的行人位置数据；3)、以减去ImageNet数据集的RGB通道均值形式对训练集图像和验证集图像进行标准化，标准化的数据作为模型的输入数据；4)、基于Caffe开源深度学习框架设计卷积神经网络，输出图像包含行人与否的信息、行人的位置信息以及该位置存在行人的可能性；5)、计算模型输出信息与对应标注信息的损失，优化并训练检测模型；6)、利用优化后的模型参数，检测真实场景图像中是否存在行人，得到相应的行人检测框。2.根据权利要求1所述一种基于自适应特征通道的行人检测方法，其特征在于：步骤1)所述训练集图像和验证集图像的获取，在数据帧中以每6帧捕获一帧的形式获取训练图像，以每120帧捕获一帧的形式获取验证图像，同时处理对应的行人位置数据标签，分别构成训练集图像和验证集图像。3.根据泉流要求1所述一种基于自适应特征通道的行人检测方法，其特征在于：步骤2)所述更新对应的行人位置数据为：行人在图像中表示为中心坐标(x,y),行人的宽为w，高为h，更新后的行人中心坐标可表示为宽和高分别为λwW和λhh，λw为宽方向缩放系数，λh为高方向缩放系数，其中m和n分别为原始图片的宽和高。4.根据权利要求1所述一种基于自适应特征通道的行人检测方法，其特征在于：步骤4)所述卷积神经网络包括：基础网络模块，采用5个卷积层+修正线性单元+池化层组成，用于生成图像的浅层细节特征通道和深层语义特征通道；特征通道连接模块，用于连接浅层细节特征通道和...

【专利技术属性】
技术研发人员：陈乔松，弓攀豪，陶亚，申发海，范金松，于越，陆思翔，荣巧玲，官暘珺，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人