用于检测图像中的特定对象的方法和系统技术方案

技术编号:2947637 阅读:122 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种用于检测图像中的特定对象的方法。确定任意对象相对于图像平面的取向,并根据该取向选择多个取向及对象特定的分类器之一。利用所选择的取向及对象特定的分类器将该任意对象分类为特定对象。

【技术实现步骤摘要】
【国外来华专利技术】
本申请一般涉及计算机视觉和模式识别领域,尤其涉及检测图像中的任意取向的对象。
技术介绍
在利用计算机视觉的所有应用中,面部检测提出了难度很大的挑战。例如,在监视摄像机所获取的图像中,通常场景的照明不良且无法控制,因此摄像机显得质量差并且常常离场景中可能重要的部分较远。重要事件是不可预测的。重要事件往往是指人进入场景。一般通过面部来辨认人。在场景中面部取向通常不受控制。换言之,所要分析的图像基本上不受约束。面部检测历史悠久。有些技术采用神经网络系统,参见Rowleyet al.,“Neural network-based face detection”,IEEE Patt.Anal.Mach.Intell.,Vol.20,pp.22-38,1998。其他技术采用Bayesian统计模型,参见Schneiderman et al.,“A statistical method for 3D objectdetection applied to faces and cars”,Computer Vision and PatternRecognition,2000。尽管神经网络系统工作既快又好,但Bayesian系统要耗费更长的处理时间才能获得更好的检测率。图像中的不受控制的面部取向引起尤为困难的检测问题。除了Rowley等人和Schneiderman等人的技术之外,还有许多能成功检测多种图像中的正面直立面部的技术。Sung等人在“Example-basedlearning for view based face detection”(IEEE Patt.Anal.Mach.Intell.,Volume 20,pages 39-51,1998)中描述了一种基于实例的学习技术,用于定位复杂场景中人的面部的直立正面视图。这种技术利用几个基于视图的“面部”和“非面部”原型群模拟人的面部模式的分布。在每一图像位置,计算局部图像模式与基于分布的模型之间的区别特征矢量。经过训练的分类器根据区别特征矢量判断人的面部是否存在于当前图像位置。尽管“正面”和“直立”的定义可以根据系统而不同,事实上许多图像都包含了难以可靠检测的旋转、倾斜或侧面的面部。非直立面部检测在Rowley等人的论文“Rotation invariant neuralnetwork-based face detection”(Proceedings of the IEEE Conferenceon Computer Vision and Pattern Recognition,pages 38-44,1998)中被描述。这种基于神经网络的分类器首先估算图像中正面面部的转角。只考虑了图像平面中的转角,即绕z轴的旋转量。然后,将图像旋转到直立位置,并进行分类。至于更详细的描述,可以参见Baluja等人于2000年10月3日被授予的美国专利第6,128,397号“Method for findingall frontal faces in arbitrarily complex visual scenes”。图1示出了现有技术的面部检测器的步骤。估算110图像101中正面面部的旋转。利用旋转111将图像101旋转120到直立位置。然后,将旋转后的图像121分类130为面部或非面部131。这种方法只检测平面中旋转的面部。该方法无法检测3D中任意取向的面部。因此,需要一种能准确检测图像中的任意取向的对象的系统和方法。
技术实现思路
本专利技术提供一种用于检测图像中的特定对象的方法。确定图像中的任意对象的取向,并根据取向选择多个取向及对象特定的分类器之一。利用所选择的取向及对象特定的分类器将该任意对象分类为特定对象。附图说明图1是用于检测平面中旋转的正面面部的现有技术方法的流程图; 图2是用于检测具有任意取向的对象的系统和方法的框图;图3A-3D是本专利技术所用的矩形滤光器的框图;和图4A-4D是对角排列的矩形滤光器的框图。具体实施例方式系统结构图2示出了根据本专利技术的用于检测图像201中具有任意取向的特定对象的系统200。关于取向,我们是指在图像201被获取的瞬间绕三个主轴(x、y和z轴)中的任意或所有主轴相对于图像平面的旋转,例如倾斜、偏转和滚动。我们将这里的取向与现有技术的绕z轴的单一旋转区分开来。在一个实例应用中,在图像中检测到的对象是面部,然而,应当理解,还可以检测其他任意取向的对象。还应当理解,从摄像机角度来看,同样的方法还可以用来确定摄像机相对于固定对象的取向。系统200包括互相连接的取向分类器210、分类器选择器220以及取向及对象特定的分类器230。系统200将含有任意对象的图像201作为输入,并输出图像201中所检测到的特定对象231。分类器选择器220利用取向类别211以及一组取向及对象特定的分类器212输出一个所选择的分类器221。在一种优选实施例中,将图像分割成不同尺寸的检测窗或“片”,例如将整个图像分割成四个窗,每个窗为图像的四分之一等。系统操作在操作期间,一种方法首先确定210图像201中的任意对象的取向类别211。根据所确定的图像201中的任意对象的取向类别211,从一组取向及对象特定的分类器212中选择220一个取向及对象特定的分类器221。然后,利用所选择的取向及对象特定的分类器221将该任意对象分类230为特定对象231。分类器可以是任何已知的分类器,例如Bayesian、基于神经网络、支持矢量机、决策树等。取向分类器取向分类器210是一种多类别分类器,这种多类别分类器只按所要分类的对象例如面部的正图像抽样进行训练。正图像抽样意谓每个图像抽样都是特定对象的一个例子。正抽样包括三个主轴上的任意或所有可能取向的特定对象。在图像被获取的瞬间任意对象相对于图像平面的可能取向的各抽样按类别分组,例如,每一取向类别都包括其取向在该类别的倾斜、偏转和滚动的预定度数范围内的特定对象。正抽样根据取向类别进行标记。输入到该取向分类器的每一任意对象都被分类为具有特定取向类别。如果该任意对象不是特定对象,那么取向分类器210的输出211是随机取向类别。在一种优选实施例中,取向分类器采用了决策树,如Quinlan在“Improved use of continuous attributes in C4.5”(Journal of ArtificialIntelligence Research 4,77-90,1996)中所述,该文在此引用作为参考。每一节点功能都是下述一组矩形滤光器中的一个滤光器,而且没有修剪。分割决策树的每个节点,直到达到最大的叶深度或者叶包含了仅一个节点的各例子。取向及对象特定的分类器取向及对象特定的分类器212组中的每个分类器都是二元分类器,用于检测检测窗中的特定取向的特定对象。该分类器组中的每个分类器都按取向类别之一中的特定对象进行训练。所选择的分类器221是按取向分类器210所输出的取向类别211中的特定对象进行训练的取向及对象特定的分类器。上述每一取向类别都可以包括在绕三个主轴中一个或所有主轴的旋转度数范围内的图像抽样,例如,在一种优选实施例中,这一范围可以是±15°。如下所述的滤光器可以旋转90°。因此,每一取向及对象特定的本文档来自技高网
...

【技术保护点】
一种用于检测图像中的特定对象的方法,包括:为特定对象利用取向分类器确定图像中的任意对象的取向;根据该取向选择多个取向及对象特定的分类器之一;和利用所选择的取向及对象特定的分类器将所述图像中的任意对象分类为特定对象。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:迈克尔J琼斯保罗A维奥拉
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利