一种行人检测方法技术

技术编号：17971060 阅读：41 留言：0更新日期：2018-05-16 11:43

本发明专利技术公开了一种行人检测方法，通过基于卷积神经网络的行人检测方法，对输入图像进行多次卷积和池化，提取原图特征，得到原图对应的特征图，通过图像特征金字塔规则近似计算出原图缩放后对应的特征图，分别经过区域建议网络RPN生成候选窗口，按候选窗口内行人尺寸分布进一步选择候选提议窗口并汇总，利用带标签的训练数据训练出不同尺度的行人目标在不同规模图像上对应的权重，训练分类器网络。求得汇总后的候选窗口经过分类器后得到的置信度与设定的阈值相比做出最终的行人检测的判断。图像特征金字塔的应用避免了图像缩放计算得到特征图的繁重计算量，并且利用不同权值加权的方式在不同特征图上检测有效避免了单一特征图检测的误判和漏检。

全部详细技术资料下载

【技术实现步骤摘要】
一种行人检测方法
本专利技术涉及一种行人检测方法，属于目标检测领域。
技术介绍
近年来，行人检测技术在智能监控、自动驾驶、机器人视觉等方面具有广泛的应用。实际应用中行人的着装，姿态尤其是视频中捕捉到的行人尺寸多变使得行人检测面临极大的挑战性。行人检测主要有两大方式：一种是基于滑动窗口的传统的行人检测方法，一种是基于深度学习提取特征的行人检测方法。传统的行人检测方法计算量大且没有利用GPU资源检测速度受限，由于计算机性能不断增强并且利用了GPU计算能力，大多基于学习特征的深度学习方法检测速度优于传统方法，但是往往难以解决行人的多尺度问题。
技术实现思路
为了解决行人检测过程中速度和检测精度难以权衡以及行人的多尺度问题，本专利技术提供一种行人检测方法，包括步骤：步骤(1)确定当前帧图像：将测试集中的一张图片作为当前帧图像或者视频序列中待处理的帧图像作为当前帧图像；步骤(2)求得特征图：将当前帧图像通过多个卷积层和池化层，通过最后一个卷积层得到一个(featuremap)特征图；步骤(3)特征图扩展：通过图像特征金字塔规则计算图像临近尺度对应的特征图，依次扩展N个小尺度扩展特征图和N个大尺度扩展扩展特征图，扩展次数N和扩展倍数不设限，一共得到2N+1个特征图；步骤(4)提议窗口分配：特征图经过区域建议网络RPN(regionproposalnetwork)生成候选窗口,根据行人尺寸分布进一步选择候选窗口；步骤(5)分类网络训练：利用多种尺度行人在不同特征图中的的分布训练深度神经网络；步骤(6)行人检测标注：将得到的三种规模特征图的提议窗口数目按比例汇总，经过步骤(5...
一种行人检测方法

【技术保护点】
一种行人检测方法，其特征在于包括以下步骤：步骤(1)确定当前帧图像：将测试集中的一张图片作为当前帧图像或者视频序列中待处理的帧图像作为当前帧图像，记做I1；步骤(2)计算特征图：将当前帧图像通过多个卷积层和池化层，这里卷积层和池化层交叉进行并且层数不设限，通过最后一个卷积层后得到一个特征图(feature map)，记做f1；步骤(3)特征图扩展：通过图像特征金字塔规则计算图像临近尺度对应的特征图，依次扩展N个小尺度扩展特征图和N个大尺度扩展扩展特征图，扩展次数N和扩展倍数不设限，一共得到2N+1个特征图；步骤(4)候选窗口提取：特征图经过区域建议网络RPN(region proposal network)生成候选窗口，根据行人尺寸分布进一步选择候选窗口；步骤(5)分类器的训练：利用多种尺度行人在不同特征图中的的分布训练深度神经网络；步骤(6)行人检测输出：将得到的多规模特征图的候选窗口汇总，经过训练好的分类器分类，经过非极大值抑制后框出行人。

【技术特征摘要】
1.一种行人检测方法，其特征在于包括以下步骤：步骤(1)确定当前帧图像：将测试集中的一张图片作为当前帧图像或者视频序列中待处理的帧图像作为当前帧图像，记做I1；步骤(2)计算特征图：将当前帧图像通过多个卷积层和池化层，这里卷积层和池化层交叉进行并且层数不设限，通过最后一个卷积层后得到一个特征图(featuremap)，记做f1；步骤(3)特征图扩展：通过图像特征金字塔规则计算图像临近尺度对应的特征图，依次扩展N个小尺度扩展特征图和N个大尺度扩展扩展特征图，扩展次数N和扩展倍数不设限，一共得到2N+1个特征图；步骤(4)候选窗口提取：特征图经过区域建议网络RPN(regionproposalnetwork)生成候选窗口，根据行人尺寸分布进一步选择候选窗口；步骤(5)分类器的训练：利用多种尺度行人在不同特征图中的的分布训练深度神经网络；步骤(6)行人检测输出：将得到的多规模特征图的候选窗口汇总，经过训练好的分类器分类，经过非极大值抑制后框出行人。2.如权利要求1所述的行人检测方法，其特征在于：步骤(3)具体为：计算图像I1临近规模对应的特征图，一般利用fm＝Cp(S(I1,M))，式中I1代表原图像，M代表缩放规模，S代表将图像缩放，Cp代表卷积池化操作计算特征，为减少卷积运算提高计算速度，通过图像图像特征金字塔规则计算临近规模图像对应的特征图，计算公式是：其中参数m表示当前规模，m'表示缩放后的规模，S代表将特征图缩放m'/m倍，f表示特征，常系数α可以在训练集上通过实验测得，以上公式表明原图Im通过卷积池化操作得到特征，临近缩放规模图像特征由已知特征图近似计算得到，如1/2*I1可以计算得到f1/2，因为图像上采样没有高频损失，上采样图片的信息内容与低分辨率的内容相似，特征计算公式为：fσ＝σ*S(f1,σ))(1.2)式中f1代表原图对应特征图，S代表将特征图f1放大σ倍，fσ为上采样图像。3.如权利要求1所述的行人检测方法，其特征在于：步骤(4)具体为：将特征图分别通过RPN网络生成候选提议窗口，按候选窗口中的行人按高度height将行人尺度设置为height<H1,H1≤height<H2,...,Hn-1≤height<Hn,height≥Hn,这里H1到Hn是由小大的像素点个数，对应不同尺度的行人数目分别为A1,A2,...,An；然后在每一张特征图上对每个尺度的行人候选框按特征图中候选框比例分布选取Tuv个，依次选取个数Tuv个候选窗口：式中Tuv是最终需要提取的第u张特征图上第v个规模尺度...

【专利技术属性】
技术研发人员：章东平，胡葵，王都洋，张香伟，杨力，肖刚，
申请(专利权)人：江西高创保安服务技术有限公司，
类型：发明
国别省市：江西,36

全部详细技术资料下载我是这个专利的主人