当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于深度监督学习提取图像多级特征的行人检测方法技术

技术编号:19904219 阅读:46 留言:0更新日期:2018-12-26 03:09
一种基于深度监督学习提取图像多级特征的行人检测方法,包括:构建红外行人检测训练集和测试数据集;在深度学习框架Caffe上搭建基于深度监督学习的行人检测网络;采用RMSprop学习策略训练行人检测网络:参数初始化方法为msra,设置Batchsize大小为48,初始学习率为0.025,每迭代5个epoch,学习率衰减一次,衰减率为0.98,进行240000次迭代后达到最佳效果;针对Intel Haswell CPU硬件平台,对行人检测网络的前向推理阶段进行优化加速。本发明专利技术不需要预训练模型,从零开始训练的行人检测方法,实现了在红外数据集上的端到端训练,提高了基于远红外图像行人检测的准确率。可实现基于PC端X86 CPU和嵌入式端ARM CPU的实时检测。

【技术实现步骤摘要】
一种基于深度监督学习提取图像多级特征的行人检测方法
本专利技术涉及一种行人检测方法。特别是涉及一种基于深度监督学习提取图像多级特征的行人检测方法。
技术介绍
行人检测是利用计算机视觉技术判断图像中是否存在行人并给予精确定位。针对远红外图像的行人检测拥有诸多优点和广泛的应用场景。相比与可见光波段,远红外热成像探测距离远、成像质量高、行人目标特征突出,广泛应用在车辆自动驾驶、辅助驾驶、安防监控、机场安全等领域。深度学习技术和卷积神经网络近年来在许多计算机视觉任务中都有不俗的表现。许多采用深度学习检测模型的行人检测方法,相比基于传统机器学习的模型,也取得了突破性的进展。现行的深度学习行人检测方法大多先行在ImageNet数据集上预训练分类模型,随后再于行人检测的数据集上进行检测任务的调优。但是远红外的图像为单通道灰度图像,而预训练的ImageNet数据集为彩色三通道图像,远红外热成像的细节特征也与可见光图像迥异,由分类模型转向检测任务会有也迁移学习的瓶颈,这些因素极大的影响了神经网络训练结果,限制了红外行人检测系统的准确率。基于深度学习的行人检测方法虽然性能优异,但也有计算量大,占用内存空本文档来自技高网...

【技术保护点】
1.一种基于深度监督学习提取图像多级特征的行人检测方法,其特征在于,包括如下步骤:1)构建红外行人检测训练集和测试数据集;2)在深度学习框架Caffe上搭建基于深度监督学习的行人检测网络;3)采用RMSprop学习策略训练行人检测网络,采用如下配置进行训练:参数初始化方法为msra,设置Batchsize大小为48,初始学习率为0.025,每迭代5个epoch,学习率衰减一次,衰减率为0.98,进行240000次迭代后达到最佳效果;4)针对Intel Haswell CPU硬件平台,对行人检测网络的前向推理阶段进行优化加速。

【技术特征摘要】
1.一种基于深度监督学习提取图像多级特征的行人检测方法,其特征在于,包括如下步骤:1)构建红外行人检测训练集和测试数据集;2)在深度学习框架Caffe上搭建基于深度监督学习的行人检测网络;3)采用RMSprop学习策略训练行人检测网络,采用如下配置进行训练:参数初始化方法为msra,设置Batchsize大小为48,初始学习率为0.025,每迭代5个epoch,学习率衰减一次,衰减率为0.98,进行240000次迭代后达到最佳效果;4)针对IntelHaswellCPU硬件平台,对行人检测网络的前向推理阶段进行优化加速。2.根据权利要求1所述的一种基于深度监督学习提取图像多级特征的行人检测方法,其特征在于,步骤1)中红外行人检测训练集和测试数据集所需红外图像数据采用Elektra研究中心的CVC-09和CVC-14数据集,包括:(1)修改红外图像的标注数据格式为VOC数据集标准;(2)将CVC-09和CVC-14两数据集合并;(3)选取12534张图片为训练集,剩余3600张图片为测试集;(4)制作训练和测试时时所需的图片目录文本文件。3.根据权利要求2所述的一种基于深度监督学习提取图像多级特征的行人检测方法,其特征在于,在输入神经网络前,将图片尺寸裁剪为320*320,此时图片长宽均为CPU单指令多数据流指令宽度的整数倍。4.根据权利要求1所述的一种基于深度监督学习提取图像多级特征的行人检测方法,其特征在于,步骤2)所述的行人检测网络包括:骨干网络和后端检测器。5.根据权利要求4所述的一种基于深度监督学习提取图像多级特征的行人检测方法,其...

【专利技术属性】
技术研发人员:赵美蓉何翼飞郑叶龙黄银国
申请(专利权)人:天津大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1