一种基于多特征融合的行人检测方法技术

技术编号:11611847 阅读:137 留言:0更新日期:2015-06-17 12:14
本发明专利技术公开了一种基于多特征融合的行人检测方法,该方法包括如下步骤:对获取的深度图像进行降噪处理;利用深度阈值实现感兴趣区域检测;在获取HOG-LBP联合特征的基础上,利用分类器实现目标检测。本发明专利技术依据一种基于多特征融合的行人检测方法,将HOG和LBP的融合特征用支持向量机分类进行分类。本发明专利技术具有更强的行人表征能力,在复杂背景下行人检测正确率明显提高。

【技术实现步骤摘要】

本专利技术涉及一种行人跟踪方法,尤其涉及一种基于多特征融合的行人跟踪方法。
技术介绍
行人检测在视频监控、机器人学、虚拟现实等领域有着广泛的应用,也是计算机视 觉和模式识别领域中的重要研宄方向。不同的身材、姿势、衣着、光照,复杂的背景场景及摄 像头自身的移动和晃动,这都是行人检测问题的难点。如何快速、准确地从视频或图像背景 中将行人检测出来,仍是目前的一个研宄热点。目前的行人检测方法可以分为以下三类:基于运动特性的行人检测、基于多部位 模板匹配的行人检测、基于机器学习的行人检测。 基于运动特性的行人检测,是在对多幅连续图像进行检测和分析的基础上,实现 目标检测。如Vola等人提出使用连续两帧图像间上、下、左、右的位移差值,作为行人运动 特征的描述。这种方法的优势在于它不易受外观变化,如光照情况、衣着颜色等;而它的不 足之处在于需一系列连续的图片及运动的目标,实时性不佳且无法识别出静止的行人。 基于多部位模板匹配的行人检测,这种方法首先利用模板匹配实现人体各个部位 的检测,如腿、头部等;然后,将这些部位的检测结果综合成对行人的检测。这类方法的有点 在于能较好地解决遮挡问题;而它的不足之处在于实时性欠佳,且由于行人的高矮胖瘦、运 动姿势等方面的不同,会导致检测率的降低。这类方法中的模板匹配包括固定模板与可变 形模板,如Zhao和Masoud提出的基于轮廓模型的目标跟踪能依据目标轮廓的运动进行模 板的自我修正。 基于机器学习的行人检测,是通过特征提取和分类学习进行行人检测。这种方法 能解决因外形差异、运动姿势等引起的漏检、误检问题。特征提取是这个方法的核心之一, 如何提取高效的,能够迅速准确的区分出行人的特征是一个关键问题。
技术实现思路
本专利技术目的在于克服现有行人跟踪方法的不足,提供了一种基于多特征融合的行 人跟踪方法,该方法是将HOG和LBP的融合特征用支持向量机分类进行分类,具有更强的行 人表征能力,在复杂背景下行人检测正确率明显提高。 方法流程: 步骤1 :对得到的深度图像进行降噪处理,以获得清晰的深度图像信息; 步骤2 :基于阈值方法实现深度图像感兴趣区域检测,以获得图像目标的区域位 置信息; 步骤3 :基于H0G-LBP特征,实现图像目标的检测。 本专利技术是基于动态阈值实现深度图像的降噪,包括: (1)将原图像分割成若干个子图像,其中为保留图像边缘、纹理等细节特征的连续 性,各子图像间存在一定的区域重叠,且自动设定重叠区域的大小。 (2)构造一种自适应识别边缘区域与非边缘区域;由于边缘、纹理等细节特征仅 占整幅图像的很小一部分,且梯度直方图中边缘区域与非边缘间并无明显界限,因而并不 能直接通过灰度直方图双峰实现梯度直方图的分割,而是在梯度直方图特性的基础上,构 造一种自适应识别边缘区域与非边缘区域的方法。 (3)自适应动态阈值是相对的,在全局最优原则下,按照子图像的局部特征,确定 不同图像区域的阈值。动态阈值的优点是可兼顾整体最优与局部细节,具有很好的实用性。 本专利技术采用基于阈值的方法实现感兴趣区域的检测,该方法包括以下两个步骤: 一是计算行人的深度距离;二是选择合适的阈值,实现感兴趣区域的检测。具体过程包括: (1)设Kinect返回行人头肩某一像素点的深度值为<,摄像头的最大视野距离为 L_,则根据Kinect的校准过程,可求得行人头肩实际的距离深度值为: d = ktan (dt/Lmax+l. 187)-s 通过实际距离与深度值的转换,可求得行人头肩某一像素点(i,j,d)的实际坐标 (x,y,z),进而求得行人的深度距离。 (2)通过距离与灰度值的换算关系,设置合适的阈值,实现感兴趣区域的检测。 本专利技术是基于HOG-LBP特征,实现图像目标的检测,其具体实现过程包括: (1)分别提取HOG特征和LBP特征; (2)利用分类器实现目标检测。 本专利技术应用于视频监控、机器人学、虚拟现实
有益效果: 1、本专利技术依据,将HOG和LBP的融合特征用 支持向量机分类进行分类,更好地实现了向量机分类。 2、本专利技术提出的方法具有更强的行人表征能力,在复杂背景下行人检测正确率明 显提尚。【附图说明】 图1为本专利技术的深度成像获取过程示意图。 图2为本专利技术的深度成像原理图。 图3为本专利技术的相同梯度对应不同的局部结构示意图。 图4为本专利技术的方法流程图。【具体实施方式】 下面结合说明书附图对本专利技术创造作进一步的详细说明。 本专利技术提供了,该方法首先利用Kinnect获 取深度图像,并对深度图像进行降噪处理;然后基于深度阈值的方法实现感兴趣区域的检 测;最后提取H0G-LBP联合特征,并用SVM分类器实现目标检测。 本专利技术的基于多特征融合的行人检测方法的一个优选实施方式,具体包括以下步 骤: 步骤1、利用Kinnect获取深度图像,并对深度图像进行降噪处理。 (1)深度成像的获取过程如图1所示,其具体过程如下描述: 标定;首先在距光源的多个位置,分别用CMOS感光元件采集散斑图案;然后,分别 记录这些参考图像的位置(如图2所示的Xp x2, x3, x4),完成标定。 取样;当物体在场景中运动时,会在物体表面形成新的散斑,且得到的散斑与所有 参考图像的散斑均不同,如图2中物体V、W形成的散斑是ZJP Z B。 定位;将测试图像与所有参考图像分别计算相关系数,选取产生相关系数最大的 参考图像,即物体在该参考图像所在位置的可能性最大,如图2中V物体的散斑位置^与 x 2处参考图像的相关系数最大,即认为V物体在x 2位置;同理,W物体在x 3位置。 重建;首先,根据所选参考图像与光源间的标定关系,通过几何变换得到物体到光 源的距离,依此构建3D图像,并归一化;然后,进行灰度转换,并将生成的深度图像输出;最 后,继续执行第2步,最终得到连续不断的深度图像视频流。 (2)深度图像的预处理,利用自适应阈值的中值滤波去除深度图像的噪声。 将原图像分割成若干个子图像。为保留图像边缘、纹理等细节特征的连续性,分割 图像时,要使子图像间存在一定的区域重叠,且按梯度直方图统计特性,自动设定各子图像 与重叠区域的比值。 计算子图像中各个像素(i,j)八邻域内四个方向的一阶偏导,以确定各个像素 (i,j)的梯度值N(i,j):【主权项】1. ,其特征在于,所述方法包括如下步骤: 步骤1;对得到的深度图像进行降噪处理,W获得清晰的深度图像信息; 步骤2 ;采用基于阔值方法实现深度图像感兴趣区域检测,W获得图像目标的区域位 置信息; 步骤3 ;采用基于HOG-LBP特征,实现图像目标的检测。2. 根据权利要求1所述的,其特征在于,所述方 法的的步骤2是基于动态阔值对深度图像进行降噪处理,包括: (1) 将原图像分割成若干个子图像;为保留图像边缘、纹理等细节特征的连续性,分割 图像时,要使子图像间存在一定的区域重叠,且按梯度直方图统计特性,自动设定各子图像 与重叠区域的比值; (2) 在获得梯度直方图特性的基础上,构造一种自适应识别边缘区域与非边缘区域的 方法。3. 根据权利要求1所述的,其特征在于;所述方 法的步骤2是基于距离阔值对感兴趣区域进行确定,W实现将前景目标所在区域从背景中 提取出来,包括本文档来自技高网
...

【技术保护点】
一种基于多特征融合的行人检测方法,其特征在于,所述方法包括如下步骤:步骤1:对得到的深度图像进行降噪处理,以获得清晰的深度图像信息;步骤2:采用基于阈值方法实现深度图像感兴趣区域检测,以获得图像目标的区域位置信息;步骤3:采用基于HOG‑LBP特征,实现图像目标的检测。

【技术特征摘要】

【专利技术属性】
技术研发人员:朱松豪陈玲玲李向向
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1