在摄像机获取的场景的测试图像中检测人物的方法和系统技术方案

技术编号:2924761 阅读:185 留言:0更新日期:2012-04-11 18:40
提出了一种用于在由摄像机获取的场景的图像序列中检测人物的方法和系统。图像中像素的梯度被确定并被分选到直方图的条中。针对直方图的每个条存储积分图像。从所述积分图像中提取特征,提取的所述特征对应于实质上较大集合的子集,其中所述较大集合是所述测试图像中可变大小且随机选择的像素块的集合。所述特征被应用于级联分类器以确定所述测试图像是否包括人物。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术 一般地涉及计算机视觉,更具体地涉及在由摄像机获取的场 景的图像中检测人物。
技术介绍
在由摄像机获取的场景的图像序列中检测人脸是相对容易的。然而, 检测人物仍是一个难题,原因在于由于衣着、关节和场景中的照明条件 而导致人物的外貌发生很大变化。主要有两类使用计算机视觉方法来检测人物的方法,参见D. M. Gavrila、 "The visual analysis of human movement: A survey", Journal of Computer Vision and Image Understanding (CVIU), vol. 73, no. 1, pp. 82-98, 1999。 一类方法使用基于部分的分析,而另一类使用单个检测窗 分析。针对这些方法的不同特征和不同分类器是公知的。基于部分的方法目的是处理由于人体关节而导致的人的外貌的巨大 可变性。在该方法中,每个部分被分别地检测,并且这些部分中的一些 或全部呈几何上看似合理的结构时检测出人物。用图来描绘结构的方法通过利用弹簧连接的对象的多个部分来描述 一个对象。每个部分利用不同尺度和方向的高斯微分滤波器表示,参见 P. Felzenszwalb禾卩D. Huttenlocher 的"Pictorial structures for object recognition", International Journal of Computer Vision (IJCV), vol. 61, no. 1, pp.55-79, 2005。另一种方法将多个部分表示为直圆柱体的投影,参见S. Ioffe和D. Forsyth的"Probabilistic methods for finding people", International Journal of Computer Vision (IJCV), vol. 43, no. 1, pp. 45-68, 2001。他们描述了 逐渐地将多个部分组装成一个完整的人体组件的方式。另一种方法将多个部分表示为局部方向特征的共存,参见K.Mikoajczyk、 C. Schmid禾口 A. Zisserman的"Human detection based on a probabilistic assembly of robust part detectors", European Conference on Computer Vision (ECCV), 2004。他们对特征进行检测,然后对多个部 分进行检测,最后基于这些部分的组装来检测人物。检测窗方法包括使用倒角距离将边缘图像与数据集进行比较的方 》去,参见D. M. Gavrila禾口 V. Philomin的"Real-time object detection for smart vehicles", Conference on Computer Vision and Pattern Recognition(CVPR), 1999。另一个方法对用于运动人物的检测的时空信息进行处理,参见P. Viola、M. Jones禾卩D. Snow的"Detecting pedestrians using patterns of motion and appearance", International Conference on Computer Vision (ICCV), 2003。第三种方法使用与多项式支持向量机(SVM)分类器相结合的基于 Haar的表示参见C. Papageorgiou禾口 T. Poggiom的"A trainable system for object detection", International Journal of Computer Vision (IJCV), vol. 38, no. 1, pp. 15-33, 2000。Dalai & Triggs方法另一种基于窗的方法使用梯度方向的直方图(HoG)的密集网格, 参见N. Dalai禾口 B. Triggs的"Histograms of oriented gradients for human detection" , Conference on Computer Vision and Pattern Recognition (CVPR), 2005,通过引用将其合并于此。Dalai和Triggs对具有16x16像素固定大小的块计算直方图来表示检 测窗。该方法使用线性SVM分类器来检测人物。此外,该方法对于对象 表示是有用的,参见D. Lowe 的"Distinctive image features from scale-invariant key points" , International Journal of Computer Vision(IJCV), vol. 60, no. 2, pp.91-110, 2004; K. Mikolajczyk、 C. Schmid和A. Zisserman 的"Human detection based on a probabilistic assembly of robust part detectors", European Conference on Computer Vision (ECCV), 2004; 以 及J. M. S. Belongie禾口丄Puzicha的"Shape matching object recognition usingshape contexts", IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI), vol. 24, no. 24, pp. 509-522, 2002。在Dalai & Triggs方法中,每个检测窗被划分为大小是8x8像素的单 元,并且每组2x2单元以滑动方式被结合成16x16的块,从而这些块彼 此重叠。从这些单元中提取图像特征,并且将这些特征分选(sort)至U9个 条(bin)的梯度直方图(HoG)中。每个窗由这些单元的所有特征向量 的级连向量表示。因而,每个块由被归一化为L2单元长度的36维特征 向量表示。每个64x128检测窗由7x15个块表示,得到每个检测窗总共 3780个特征。这些特征用于训练线性SVM分类器。Dalai & Triggs方法依赖于以下组成部分。HoG是基本的构建块。跨 过整个固定大小检测窗的HoG的密集网格提供了对该检测窗的特征描 述。第三,与绝对值相对的是,在每个块之内的L2归一化步骤强调了关 于相邻单元的相对特性。他们使用了被训练用于对象/非对象分类的软常 规线性SVM。高斯核SVM以高得多的运行时间为代价而对性能略有提 咼。不幸的是,Dalai & Triggs方法中的块具有相对小的固定16x16像素 大小。因而,在检测窗中仅能够检测到局部特征。它们不能够检测"大图 像"或者全局特征。此外,Dalai & Triggs方法仅能够大约每秒一帧地处理320x本文档来自技高网...

【技术保护点】
一种用于在由摄像机获取的场景的测试图像中检测人物的方法,该方法包括以下步骤: 针对所述测试图像中的每个像素来确定梯度; 将所述梯度分选到直方图的条中; 存储针对所述直方图中的每个条的积分图像; 从所述积分图像中提取特征,提取的所述特征对应于实质上较大集合的子集,其中所述较大集合是所述测试图像中可变大小且随机选择的像素块的集合;以及 将所述特征应用于级联分类器以确定所述测试图像是否包括人物。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:什穆埃尔阿维丹朱强
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利