一种基于自适应特征通道的行人检测方法技术

技术编号:21141786 阅读:24 留言:0更新日期:2019-05-18 05:21
本发明专利技术公开了一种基于自适应特征通道的行人检测方法,包括如下步骤:步骤一,获取Caltech行人数据帧,基于该数据帧捕获训练集和验证集;步骤二,缩放训练集和验证集图像;步骤三,将标准化后图像作为模型输入数据;步骤四,基于Caffe开源深度学习框架设计卷积神经网络,输出图像包含行人与否的信息、行人的位置信息以及该位置存在行人的可能性;步骤五,计算模型的输出信息与对应标注信息的损失,优化并训练模型;步骤六,利用优化后的模型参数,检测真实场景图像中存在的行人,得到相应的行人检测框。本发明专利技术基于卷积神经网络,采用了转移学习以及多任务联合学习的技术,实现了端到端的行人检测方法,为行人检测的后续操作提供了重要的技术支持。

【技术实现步骤摘要】
一种基于自适应特征通道的行人检测方法
本专利技术涉及卷积神经网络和行人检测技术,尤其涉及基于卷积神经网络的自适应特征通道的行人检测方法。
技术介绍
行人检测是计算机视觉中重要的研究课题之一,其研究结果对于其它的视觉任务有着重要的影响作用。行人检测目前已广泛应用于车辆辅助驾驶、智能视频监控以及人机交互系统,但在某些复杂的场景中,还存在检测性能低下的问题。行人属于柔性物体,其不同的姿势和扮相都会在一定程度上造成行人间差距变大,使得行人难以检测。随着深度学习和机器学习的稳步发展,利用卷积神经网络学习目标特征受到了研究者们的极大追捧,同时行人检测技术也得到了大的突破。目前基于卷积神经网络的行人检测方法分为单阶段网络和两阶段网络,单阶段网络中比较经典的算法包括:YOLO系列算法、SSD网络以及RPN网络等,而两阶段网络包括:RCNN系列算法以及基于RCNN改进的算法等。行人检测方法研究的难点在于如何消除行人的类内差距,并学习有效的分类与回归特征。
技术实现思路
本专利技术为解决真实场景中行人的检测与识别问题,为行人检测的后续操作提供了重要的技术支持,可应用于车辆辅助驾驶、智能视频监控以及人机交互系统。本专利技术采用的技术方案是:一种基于自适应特征通道的行人检测方法,包括以下步骤:1)、获取Caltech行人数据帧,基于该数据帧捕获训练集图像和验证集图像,用于检测模型的训练与评估;2)、将训练集图像和验证集图像大小均缩放至M×N,M和N分别为缩放后图像的宽和高,并根据缩放系数更新对应的行人位置数据;3)、以减去ImageNet数据集的RGB通道均值形式对训练集图像和验证集图像进行标准化,标准化的数据作为模型的输入数据;4)、基于Caffe开源深度学习框架设计卷积神经网络,输出图像包含行人与否的信息、行人的位置信息以及该位置存在行人的可能性;5)、计算模型输出信息与对应标注信息的损失,优化并训练检测模型;6)、利用优化后的模型参数,检测真实场景图像中是否存在行人,得到相应的行人检测框。具体地,步骤1)所述训练集图像和验证集图像的获取,在数据帧中以每6帧捕获一帧的形式获取训练图像,以每120帧捕获一帧的形式获取验证图像,同时处理对应的行人位置数据标签,分别构成训练集图像和验证集图像。步骤2)所述更新对应的行人位置数据为:行人在图像中表示为中心坐标(x,y),行人的宽为w,高为h,更新后的行人中心坐标可表示为宽和高分别为λwW和λhh,λw为宽方向缩放系数,λh为高方向缩放系数,其中m和n分别为原始图片的宽和高。步骤4)所述卷积神经网络包括:基础网络模块,采用5个卷积层+修正线性单元+池化层组成,用于生成图像的浅层细节特征通道和深层语义特征通道;特征通道连接模块,用于连接浅层细节特征通道和深层语义特征通道,生成特征多样化的新特征映射M1;特征通道适应模块,包括全局平均池化层、三个全连接层、修正线性单元函数、Sigmoid函数以及通道适应层,其中,全局平均池化层提取M1中每一特征通道的全局信息,全连接层拟合通道之间的关系以及生成图像包含行人与否的信息,修正线性单元函数和Sigmoid函数将线性结果做非线性映射,通道适应层根据Sigmoid函数值S以及M1选择并更新强辨识力特征通道,生成新的映射M2;候选框生成模块,用于生成行人的位置信息以及该位置存在行人的可能性。进一步,所述修正线性单元函数和Sigmoid函数的公式分别为:relu(x)=max(0,x),其中x为网络层的输出值,relu(x)和sigmoid(x)为x的非线性映射。步骤5)所述计算模型输出信息与对应标注信息的损失,优化并训练检测模型,具体包括:(1)将步骤3)中标准化的数据输入步骤4)所述卷积神经网络进行优化训练;(2)训练优化的损失主要由三部分组成:图像分类损失、区域候选框回归损失以及区域候选框分类损失;其中图像分类损失与区域候选框分类损失的计算选择交叉熵损失,分别记为loss1和loss2;区域候选框分类损失的计算选用SmoothL1损失,记为loss3;loss1=-logcrloss2=-logpu其中cr为图像存在行人的可能性,pu为区域候选框存在行人的概率,和vi分别为真实行人的位置坐标和预测行人的位置坐标。(3)训练优化的损失函数为:loss=λ1loss1+λ2loss2+λ3loss3其中λ1,λ2,λ3为不同任务损失占总损失的比重。本专利技术的有益效果如下:本专利技术基于卷积神经网络,连接浅层细节特征通道和深层语义特征通道,使得特征映射中的特征信息更加多样化,继而提高后续行人定位与分类的准确率;添加通道选择模块,学习不同特征通道对行人定位与回归影响权重,进一步的更新上流网络形成的特征映射,以此实现更具辨识度的行人特征;使用多任务联合学习技术,增加不同任务之间相互促进的影响作用;该模型具有稳定的检测性能,对不同真实场景中的行人具有很好的鲁棒性。附图说明图1是本专利技术的流程图;图2是ReLU激活函数图像;图3是Sigmoid激活函数图像;图4是SmoothL1函数图;图5是真实场景图片行人检测结果样例。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本专利技术的一部分实施例。本专利技术提供一种基于自适应特征通道的行人检测方法,其流程示意图如图1所示,具体包含以下步骤:步骤一,获取Caltech行人数据帧,基于该数据帧捕获训练集和验证集,用于检测模型的训练与评估;步骤二,将训练集图像和验证集图像大小均缩放至M×N,M和N为缩放后图像的宽和高,并根据缩放系数更新对应的行人位置数据;步骤三,以减去ImageNet数据集的RGB通道均值形式对训练图像和验证图像进行标准化,标准化的数据作为模型的输入数据;步骤四,基于Caffe开源深度学习框架设计卷积神经网络,输出图像包含行人与否的信息、行人的位置信息以及该位置存在行人的可能性;步骤五,计算模型输出信息与对应标注信息的损失,优化并训练检测模型;步骤六,利用优化后的模型参数,检测真实场景图像中存在的行人,得到相应的行人检测框。所述的一种基于自适应特征通道的行人检测方法,其中步骤一,包括:下载公开的行人数据帧Caltech,基于该数据帧,以每6帧捕获一帧的形式获取训练图像,以每120帧捕获一帧的形式获取验证图像,共计21391张训练图像和1046张验证图像,分别构成训练集和验证集,同时处理捕获图像对应的行人位置标签数据,得到用于训练的监督信息。所述的一种基于自适应特征通道的行人检测方法,其中步骤二,包括:将训练集图像和验证集图像大小均缩放至M×N,并根据缩放系数更新对应的行人位置数据,其中M设置为896,N设置为672,缩放系数内容具体如下:缩放系数可分为宽方向系数λw和高方向系数λh,其定义为:其中m和n为原始图片的宽和高,即m=480,n=640。假设行人在图像中表示为中心坐标(x,y),行人的宽为w,高为h,那么更新后的行人中心坐标可表示为宽和高分别为λwW和λhh。所述的一种基于自适应特征通道的行人检测方法,其中步骤四,包括:卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种前馈神经网络,最大的特征使局部连接性和权值共本文档来自技高网...

【技术保护点】
1.一种基于自适应特征通道的行人检测方法,其特征在于,包括以下步骤:1)、获取Caltech行人数据帧,基于该数据帧捕获训练集图像和验证集图像,用于检测模型的训练与评估;2)、将训练集图像和验证集图像大小均缩放至M×N,M和N分别为缩放后图像的宽和高,并根据缩放系数更新对应的行人位置数据;3)、以减去ImageNet数据集的RGB通道均值形式对训练集图像和验证集图像进行标准化,标准化的数据作为模型的输入数据;4)、基于Caffe开源深度学习框架设计卷积神经网络,输出图像包含行人与否的信息、行人的位置信息以及该位置存在行人的可能性;5)、计算模型输出信息与对应标注信息的损失,优化并训练检测模型;6)、利用优化后的模型参数,检测真实场景图像中是否存在行人,得到相应的行人检测框。

【技术特征摘要】
1.一种基于自适应特征通道的行人检测方法,其特征在于,包括以下步骤:1)、获取Caltech行人数据帧,基于该数据帧捕获训练集图像和验证集图像,用于检测模型的训练与评估;2)、将训练集图像和验证集图像大小均缩放至M×N,M和N分别为缩放后图像的宽和高,并根据缩放系数更新对应的行人位置数据;3)、以减去ImageNet数据集的RGB通道均值形式对训练集图像和验证集图像进行标准化,标准化的数据作为模型的输入数据;4)、基于Caffe开源深度学习框架设计卷积神经网络,输出图像包含行人与否的信息、行人的位置信息以及该位置存在行人的可能性;5)、计算模型输出信息与对应标注信息的损失,优化并训练检测模型;6)、利用优化后的模型参数,检测真实场景图像中是否存在行人,得到相应的行人检测框。2.根据权利要求1所述一种基于自适应特征通道的行人检测方法,其特征在于:步骤1)所述训练集图像和验证集图像的获取,在数据帧中以每6帧捕获一帧的形式获取训练图像,以每120帧捕获一帧的形式获取验证图像,同时处理对应的行人位置数据标签,分别构成训练集图像和验证集图像。3.根据泉流要求1所述一种基于自适应特征通道的行人检测方法,其特征在于:步骤2)所述更新对应的行人位置数据为:行人在图像中表示为中心坐标(x,y),行人的宽为w,高为h,更新后的行人中心坐标可表示为宽和高分别为λwW和λhh,λw为宽方向缩放系数,λh为高方向缩放系数,其中m和n分别为原始图片的宽和高。4.根据权利要求1所述一种基于自适应特征通道的行人检测方法,其特征在于:步骤4)所述卷积神经网络包括:基础网络模块,采用5个卷积层+修正线性单元+池化层组成,用于生成图像的浅层细节特征通道和深层语义特征通道;特征通道连接模块,用于连接浅层细节特征通道和...

【专利技术属性】
技术研发人员:陈乔松弓攀豪陶亚申发海范金松于越陆思翔荣巧玲官暘珺
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1