一种基于深度学习的行人检测方法技术

技术编号：18784271 阅读：421 留言：0更新日期：2018-08-29 07:08

本发明专利技术涉及一种基于深度学习的行人检测方法，该方法包括以下步骤：首先将待检测的视频图像输入提取网络生成特征图，然后，将提取网络生成的特征图输入区域提议网络，利用区域提议方法检测最有可能是行人的区域，生成行人候选者以及行人候选者对应的分数，最后利用训练好的决策树算法确定行人候选者是否为真正的行人。本发明专利技术的优点是计算简单、快速，能够显著提高行人检测的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的行人检测方法
本专利技术涉及一种行人检测方法，尤其是一种基于深度学习的行人检测方法，属于图像处理

技术介绍
据了解，行人检测是计算机视觉领域的一个重要研究课题。行人检测的目的是为了准确识别和定位行人在图像或视频序列中的位置。目前，行人检测在车辆辅助驾驶系统、智能视频监控和智能交通中得到了广泛的应用。传统的行人检测方法也被称为手工设计的模型，是基于底层特征来表示行人的特征，例如HOG特征、Haar特征、LBP特征、LUV特征、ICF特征、SquaresChnFtrs特征以及LDCF特征等。目前多利用支持向量机或决策树作为分类器来解决行人检测的问题。然而，传统的行人检测方法需要人工设计的特征较为复杂，需要大量的专业知识并且在鲁棒性方面存在一定的局限性。随着深度学习的发展，基于深度学习的行人检测方法在不考虑计算成本的情况下取得了巨大的成功。一般来说，基于深度学习的行人检测方法可以分为两类：一类是基于区域建议的行人检测方法，例如R-CNN方法、SPP-Net方法、FasterR-CNN方法以及R-FCN方法；另一类是不基于区域建议的行人检测方法，例如YOLO方法以及SSD方法。虽然不基于区域建议的行人检测方法在计算速度上有一些优势，但是这种方法不能获得很高的精度。因此，对于大多数基于深度学习的行人检测方法来说，往往采用区域建议来生成行人候选者的策略。另外，随着深度学习在行人检测领域的广泛应用，卷积神经网络被广泛地应用于行人检测，例如AlexNet网络、VGG网络、ZF网络、Fast-RCNN网络、Faster-RCNN网络、R-CNN网...

【技术保护点】
1.一种基于深度学习的行人检测方法，其特征在于，包括以下步骤：第一步、将待检测的视频图像输入提取网络生成特征图；第二步、将提取网络生成的特征图输入区域提议网络，再利用区域提议方法检测最有可能是行人的区域，生成行人候选者以及行人候选者对应的分数；第三步、利用训练好的决策树算法确定行人候选者是否为真正的行人。

【技术特征摘要】
1.一种基于深度学习的行人检测方法，其特征在于，包括以下步骤：第一步、将待检测的视频图像输入提取网络生成特征图；第二步、将提取网络生成的特征图输入区域提议网络，再利用区域提议方法检测最有可能是行人的区域，生成行人候选者以及行人候选者对应的分数；第三步、利用训练好的决策树算法确定行人候选者是否为真正的行人。2.根据权利要求1所述一种基于深度学习的行人检测方法，其特征在于:所述提取网络采用PVANet网络，所述PVANet网络有十四层，其中前三层为卷积层，中间为两组起始层，每组起始层包含四个结构相同的起始层，最后三层为全连接层；所述全连接层的输出为区域提议网络以及决策树分类器的输入。3.根据权利要求2所述一种基于深度学习的行人检测方法，其特征在于:单个起始层由第一、第二、第三分支组成，所述第一分支由一个1×1的卷积层组成，所述第二分支由一个1×1的卷积层和一个3×3的卷积层组成，所述第三分支由一个1×1的卷积层和两个3×3的卷积层组成。4.根据权利要求3所述一种基于深度学习的行人检测方法，其特征在于，单个起始层生成特征图的具体方法如下：上一层产生的特征图被分别传入起始层的三个分支，然后由这三个分支输出的特征图被传送至一连接层，最后进入下一层，成为下一层的输入特征图。5.根据权利要求4所述一种基于深度学习的行人检测方法，其特征在于：在所述区域提议网络中，对于PVANet网络产生的输入特征图，将一个滑动窗口用到每一幅特征图上生成多个全连接的特征，每个全连接的特征包含两个分支，其中一个分支是scs层，另一个分支是cds层；所述cds层用来生成行人候选者，包括行人候选者中心点的坐标以及该行人候选者的宽度和高度；所述scs层用来生成行人候选者对应的分数；由cds层生成的行人候选者和由scs层生成的行人候选者对应的分数被输送到决策树分...

【专利技术属性】
技术研发人员：孙炜程，朱松豪，荆晓远，代心灵，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人