一种基于深度学习的行人检测方法技术

技术编号:18784271 阅读:421 留言:0更新日期:2018-08-29 07:08
本发明专利技术涉及一种基于深度学习的行人检测方法,该方法包括以下步骤:首先将待检测的视频图像输入提取网络生成特征图,然后,将提取网络生成的特征图输入区域提议网络,利用区域提议方法检测最有可能是行人的区域,生成行人候选者以及行人候选者对应的分数,最后利用训练好的决策树算法确定行人候选者是否为真正的行人。本发明专利技术的优点是计算简单、快速,能够显著提高行人检测的准确率。

【技术实现步骤摘要】
一种基于深度学习的行人检测方法
本专利技术涉及一种行人检测方法,尤其是一种基于深度学习的行人检测方法,属于图像处理

技术介绍
据了解,行人检测是计算机视觉领域的一个重要研究课题。行人检测的目的是为了准确识别和定位行人在图像或视频序列中的位置。目前,行人检测在车辆辅助驾驶系统、智能视频监控和智能交通中得到了广泛的应用。传统的行人检测方法也被称为手工设计的模型,是基于底层特征来表示行人的特征,例如HOG特征、Haar特征、LBP特征、LUV特征、ICF特征、SquaresChnFtrs特征以及LDCF特征等。目前多利用支持向量机或决策树作为分类器来解决行人检测的问题。然而,传统的行人检测方法需要人工设计的特征较为复杂,需要大量的专业知识并且在鲁棒性方面存在一定的局限性。随着深度学习的发展,基于深度学习的行人检测方法在不考虑计算成本的情况下取得了巨大的成功。一般来说,基于深度学习的行人检测方法可以分为两类:一类是基于区域建议的行人检测方法,例如R-CNN方法、SPP-Net方法、FasterR-CNN方法以及R-FCN方法;另一类是不基于区域建议的行人检测方法,例如YOLO方法以及SSD方法。虽然不基于区域建议的行人检测方法在计算速度上有一些优势,但是这种方法不能获得很高的精度。因此,对于大多数基于深度学习的行人检测方法来说,往往采用区域建议来生成行人候选者的策略。另外,随着深度学习在行人检测领域的广泛应用,卷积神经网络被广泛地应用于行人检测,例如AlexNet网络、VGG网络、ZF网络、Fast-RCNN网络、Faster-RCNN网络、R-CNN网络、MS-CNN网络以及R-FCN网络。在R-CNN、Fast-RCNN以及FasterR-CNN这一系列的方法中,区域提议策略被用来提高目标检测准确率以及计算速度。对于MS-CNN方法,一个多尺度的区域提议网络被用来提高检测小目标的准确性。对于R-FCN方法,使用全卷积网络和区域提议网络相结合来进行行人检测。与Faster-RCNN方法相比,R-FCN方法大大提高了计算速度并且轻微提高了行人检测的准确率。虽然基于深度学习的目标检测技术发展十分迅速,但无论是在准确率还是速度方面,行人检测的方法仍有很大的改进空间。
技术实现思路
本专利技术的目的在于:针对现有技术存在的缺陷,提出一种新的基于学习深度的行人检测方法,用于提高行人检测的准确性和快速性。为了达到以上目的,本专利技术提供了一种基于深度学习的行人检测方法,包括以下步骤:第一步、将待检测的视频图像输入提取网络生成特征图;第二步、将提取网络生成的特征图输入区域提议网络,再利用区域提议方法检测最有可能是行人的区域,生成行人候选者以及行人候选者对应的分数;第三步、利用训练好的决策树算法确定行人候选者是否为真正的行人。本专利技术首先将视频图像输入到设计好的行人检测模型中,然后利用基于深度学习的PVANet网络生成特征图,接着利用区域提议网络生成行人候选者和对应的分数,最后利用训练好的决策树算法对生成的行人候选者进行分类以找出真正的行人。优选地,所述提取网络采用PVANet网络,所述PVANet网络有十四层,其中前三层为卷积层,中间为两组起始层,每组起始层包含四个结构相同的起始层,最后三层为全连接层;所述全连接层的输出为区域提议网络以及决策树分类器的输入。进一步优选地,所有起始层的结构都是相同的,单个起始层由第一、第二、第三分支组成,所述第一分支由一个1×1的卷积层组成,所述第二分支由一个1×1的卷积层和一个3×3的卷积层组成,所述第三分支由一个1×1的卷积层和两个3×3的卷积层组成。再进一步优选地,单个起始层生成特征图的具体方法如下:上一层产生的特征图被分别传入起始层的第一、第二、第三等三个分支,然后由这三个分支输出的特征图被传送至一连接层,最后进入下一层,成为下一层的输入特征图,这样通过起始层更为准确地获得小尺度的目标。上一层是单个起始层或者前面的卷积层,下一层是单个起始层或者后面的全连接层。优选地,在所述区域提议网络中,对于PVANet网络产生的输入特征图,将一个m*m大小的滑动窗口用到每一幅特征图上生成多个全连接的特征,每个全连接的特征包含两个分支,其中一个分支是scs层,另一个分支是cds层。单个滑动窗口能够同时预测不同尺度和不同纵横比的区域提案。例如,滑动窗口预测四个尺度和四个长宽比的区域提案时,会产生4*4个区域提案。也就是说,滑动窗口在cds层产生4*4*4个输出,在scs层产生2*4*4个输出。所述cds层用来生成行人候选者,包括行人候选者(即预测目标)中心点的坐标以及该行人候选者(即预测目标)的宽度和高度;所述scs层用来生成行人候选者对应的分数,即预测目标的相应分数,预测目标的相应分数为预测目标是行人的估计概率以及不是行人的概率;由cds层生成的行人候选者和由scs层生成的行人候选者对应的分数被输送到决策树分类器进行训练和检测。为了在不影响行人检测精度的情况下降低计算成本,在训练过程中,由PVANet网络产生的卷积特征被用作区域提议网络以及检测网络的输入。本专利技术的决策树采用树型结构,其中每个非叶子节点表示对一个特征属性的判断,每个分支表示对一个特征属性判断的结果,每个叶子节点代表了一个类别。为了进行决策,首先要从根节点开始对待分类目标的特征属性进行测试,然后根据测试结果选择相应的分支,最后重复该过程直到到达一个叶子节点为止。到达的叶子节点的类别就是预测的要分类的目标的类别。虽然决策树算法的变种有很多,例如ID3,C5.0以及CART算法,但它们的基本思想都是相同的,并且使用决策树算法进行分类得到的准确率是很高的。决策树分类器的基本思想是在同一个训练集上训练多个弱分类器,然后将这些弱分类器组合成最终的强分类器。这些弱分类器各有一个权值参数β,也就是分类器正确分类的样本数的比例。因此需要设置一个阈值来确定样本是否被正确分类。在对决策树的训练过程中将会进行多次迭代,如果一次迭代过程中某个弱分类器的分类准确率很低,也就意味着该弱分类器的性能很差,那么就会减小该弱分类器的参数。具体的,采用RealBoost算法训练决策树的方法如下:①给定训练集,(x1,y1),…(xi,yi),…(xN,yN)其中,yi是特征向量,且i=1,…,N;②在初始阶段,对弱分类器进行编号并将编号记为j,根据(1)式确定每个弱分类器的权重,(1)其中,Wj为弱分类器的权重,H为弱分类器的个数;③对弱分类器进行N次训练得到训练数据,对训练进行编号并将编号记为n,然后根据(2)式获得一概率估计,(2)其中,Pn(y)为弱分类器的概率估计值,N为弱分类器的训练次数;④根据(3)式计算弱分类器的真实值分布,(3)其中,fn(y)为弱分类器的真实值,R为实数集;⑤在训练过程中,根据(4)式获得弱分类器的权重,(4)⑥在每次迭代之后,所有弱分类器的权重被重新归一化,使得所有弱分类器的总权重等于1,最终得到强分类器,根据(5)式获得强分类器,(5)其中,N为弱分类器的训练次数。确定真正行人的方法如下:首先利用训练好的决策树算法对生成的行人候选者进行分类,然后根据行人候选者分类预先设定阈值,当特征图中的行人候选者是行人的概率小于预先设定的阈本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的行人检测方法,其特征在于,包括以下步骤:第一步、将待检测的视频图像输入提取网络生成特征图;第二步、将提取网络生成的特征图输入区域提议网络,再利用区域提议方法检测最有可能是行人的区域,生成行人候选者以及行人候选者对应的分数;第三步、利用训练好的决策树算法确定行人候选者是否为真正的行人。

【技术特征摘要】
1.一种基于深度学习的行人检测方法,其特征在于,包括以下步骤:第一步、将待检测的视频图像输入提取网络生成特征图;第二步、将提取网络生成的特征图输入区域提议网络,再利用区域提议方法检测最有可能是行人的区域,生成行人候选者以及行人候选者对应的分数;第三步、利用训练好的决策树算法确定行人候选者是否为真正的行人。2.根据权利要求1所述一种基于深度学习的行人检测方法,其特征在于:所述提取网络采用PVANet网络,所述PVANet网络有十四层,其中前三层为卷积层,中间为两组起始层,每组起始层包含四个结构相同的起始层,最后三层为全连接层;所述全连接层的输出为区域提议网络以及决策树分类器的输入。3.根据权利要求2所述一种基于深度学习的行人检测方法,其特征在于:单个起始层由第一、第二、第三分支组成,所述第一分支由一个1×1的卷积层组成,所述第二分支由一个1×1的卷积层和一个3×3的卷积层组成,所述第三分支由一个1×1的卷积层和两个3×3的卷积层组成。4.根据权利要求3所述一种基于深度学习的行人检测方法,其特征在于,单个起始层生成特征图的具体方法如下:上一层产生的特征图被分别传入起始层的三个分支,然后由这三个分支输出的特征图被传送至一连接层,最后进入下一层,成为下一层的输入特征图。5.根据权利要求4所述一种基于深度学习的行人检测方法,其特征在于:在所述区域提议网络中,对于PVANet网络产生的输入特征图,将一个滑动窗口用到每一幅特征图上生成多个全连接的特征,每个全连接的特征包含两个分支,其中一个分支是scs层,另一个分支是cds层;所述cds层用来生成行人候选者,包括行人候选者中心点的坐标以及该行人候选者的宽度和高度;所述scs层用来生成行人候选者对应的分数;由cds层生成的行人候选者和由scs层生成的行人候选者对应的分数被输送到决策树分...

【专利技术属性】
技术研发人员:孙炜程朱松豪荆晓远代心灵
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1