学习判别模型的概率推进树架构制造技术

技术编号:2929804 阅读:206 留言:0更新日期:2012-04-11 18:40
公开了一种用于计算两级和多级判别模型的概率推进树架构。在学习阶段中,概率推进树(PBT)自动构造树,在该树中,每个节点将多个弱分类器(例如,证据、知识)组合成强分类器或条件后验概率。通过分治法策略经由数据增量(例如,树扩展)使该PBT接近目标后验分布。在测试阶段中,根据学习过的分类器在每个树节点处计算条件概率,该学习过的分类器引导该树的子树中的概率传播。因此,树的顶部节点通过结合从其子树所收集的概率而输出总体后验概率。在训练阶段中,递归地构造树,在该树中,每个树节点是一个强分类器。根据学习过的分类器,输入训练集被划分成两个新集合、即左和右集合。然后每个集合被递归地用于训练左和右子树。

【技术实现步骤摘要】

本专利技术针对一种用于学习判别模型的概率推进树(probabilistic boostingtree)架构,并且更特别地,本专利技术针对一种用于计算两级和多级判别模型的概率推进树架构。
技术介绍
本申请要求于2005年3月9日提交的序列号为60/660,136的美国临时申请的利益,该美国临时申请的全部内容被结合作为参考。在自然景物中分类/识别、检测以及聚类一般对象的任务是极端复杂的。上述难题应归于多种原因大的级内的变化和级间的相似性,清晰度和运动,不同的照明条件,定向/观察方向,以及不同对象的复杂构造。图1示出多幅不同的图像。图1的第一行102显示一些人脸图像。剩下的行104-110示出一些根据加利福尼亚理工学院(Caltech)的101种对象类别的典型图像。一些对象是高度非刚性的,而一些相同类别中的对象互相具有很少的相似性。针对分类任务,要求很高水平的知识,以将一级的不同实例置入该相同的类别中。一般景物理解的问题能够从两个方面来观察建模和计算。建模提出怎样学习/定义一般图案/对象的统计学的问题。计算解决该推理问题。假设x为图像样本并且其解释为y。理论上,针对图案获得生成式(generative)模型p(x|y),以测量关于任何样本x的统计学。遗憾的是,不仅该生成式模型经常超范围,而且这些生成式模型在计算阶段中还产生了大的计算负担。例如,人脸被认为是要研究的相对简单的类。然而,并不存在捕获人脸的所有变化、诸如多视图、阴影、表情、遮挡、以及发型的生成式模型。能够在图1的第一行102中看到一些样本人脸。可替换地,判别模型p(y|x)被直接学习,其中y只是说“是”或“否”的简单变量或类标记。一种被称为AdaBoost的现有技术及其变型已经成功地被应用到视觉和机器学习的许多问题中。AdaBoost通过选择和将一组弱分类器组合成强分类器来接近后验的p(y|x)。然而,当前的AdaBoost方法存在几个问题。第一,虽然AdaBoost逐渐会聚到目标分布,但是需要挑选上百个弱分类器。这引起巨大的计算负担。第二,不保留在训练阶段中所拾取的特征的顺序。一组特征的顺序可以与高级语义一致,并且因此,理解对象/图案是非常重要的。第三,AdaBoost的再称量方案可使先前正确分类的样本再次被错误分类。第四,虽然已提出从两级到多级分类的扩展,但是利用输出编码学习多级情况下的弱分类器是更加困难的而且在计算上花费巨大。结合AdaBoost与决策树的另一种公知方法一般被称为AdaTree。AdaTree方法的主要目的是通过修剪来加速AdaBoost方法。AdaTree方法通过将一组弱分类器组合到树结构中来学习强分类器,但其并没有提出多级分类。存在多种用于处理对象分类和检测的方法。与AdaBoost一起使用的级联方法已表明在偶发事件检测中是有效的。该级联方法可被看作是本专利技术方法的特例。在该级联中,选取一阈值,以致全部正样本(positive sample)被压入树的右侧。然而,特别是当该正样本和负样本难以分离时,将正样本压入右侧会导致大的错误肯定率。本专利技术的方法自然地将该训练集分成两部分。在负样本比正样本多很多的情况下,大部分负样本成为接近顶部的叶节点。深处的树叶集中分类该难以分离的正样本和负样本。决策树已被广泛用于视觉和人工智能。在传统的决策树中,每个节点是一个弱决策者,并且因此每个节点处的结果更加随机。相反,在本专利技术中,每个树节点是一个强决策者并且其学习分布q(x|y)。其他方法包括A*、生成式模型、EM以及语法和语义。需要一种在计算上不繁重的多级分类中使用的能够学习判别模型的架构。
技术实现思路
本专利技术针对一种用于定位图像中的对象的方法。构造一种概率推进树,在该概率推进树中,每个节点将多个弱分类器组合成强分类器或条件后验概率。接收包含要被定位的对象的至少一个输入图像。根据条件后验概率识别该输入图像中的边界框,该对象驻留在该边界框中。根据该对象实际驻留在该位置的似然性计算边界框的概率值。针对输入图像中的不同位置确定边界框和概率值。选择具有最高计算概率的边界框作为对象驻留在其中的位置。本专利技术也针对一种用于检测图像中的对象的方法。构造一种概率推进树,在该概率推进树中,每个节点将多个弱分类器组合成强分类器或条件后验概率。接收至少一个输入图像。根据该条件后验概率来识别该至少一个输入图像中的边界框,该对象可驻留在该边界框中。根据该对象驻留在该图像中的似然性计算边界框的概率值。该概率与预定的阈值进行比较。如果该概率大于预定的阈值,则边界框被保留。针对输入图像中的不同位置确定边界框和概率值。如果至少一个边界框的概率大于预定的阈值,则关于该对象是否驻留在该图像中作出确定。本专利技术还针对一种将对象的图像分类为不同的图像类别的方法。递归地构造一种概率推进树,在该概率推进树中,每个树节点是一个强分类器。在树的顶部获得判别模型,并且树的每一级包括一扩充变量。根据学习过的分类器将输入训练集分成两个新的集合。这两个新集合被递归地用于训练左右子树,以致以分层方式自动形成聚类。根据多个所形成的聚类输出适当数量的分类。附图说明下面将参考附图更详细地描述本专利技术的优选实施例,其中相同的参考编号表示相同的元件图1说明自然景物和普通对象的图像的例子;图2是一种用于实现根据本专利技术的概率推进树的系统的框图;图3概述一种用于训练根据本专利技术的推进树的方法;图4说明一种根据本专利技术如何学习概率推进树以及如何划分训练样本的例子;图5概述一种用于测试根据本专利技术的概率推进树的方法;图6说明根据本专利技术的树的概率模型的例子;图7概述一种用于训练根据本专利技术的多级概率推进树的方法;图8说明根据本专利技术的四个对象图像在亮度和三个Gabor滤波结果方面的频率曲线(histogram);图9说明来自根据本专利技术学习过的图像集以及聚类的一些样本图像;图10说明根据本专利技术所形成的一些样本图像聚类;图11说明根据本专利技术的来自心脏的输入视频以及最终的左心室检测的静止图像;图12示出根据本专利技术的超声图像中的左心室定位的例子;图13示出根据本专利技术的超声图像中的胎儿头部定位的例子; 图14示出根据本专利技术的超声图像中的胎儿腹部定位的例子;图15示出根据本专利技术的超声图像中的胎儿股骨定位的例子;图16示出根据本专利技术的计算层析图像中的直肠管检测的例子;图17示出根据本专利技术的图16的直肠管的放大视图;以及图18示出根据本专利技术的人脸检测的例子。具体实施例方式本专利技术针对一种用于计算两级和多级判别模型的概率推进树架构。在学习阶段中,概率推进树(PBT)自动构造树,在该树中,每个节点将多个弱分类器(例如,证据、知识)组合成强分类器或条件后验概率。通过分治法策略经由数据增量(例如,树扩展)使该PBT接近该目标后验分布。在测试阶段中,根据学习过的分类器在每个树节点处计算条件概率,该学习过的分类器引导该树的子树中的概率传播。因此,该树的顶部节点通过结合从其子树所收集的概率而输出总体后验概率。而且,在学习阶段中自然地嵌入聚类并且每个子树表示某一级的聚类。在训练阶段中,递归地构造树,在该树中,每个树节点是一个强分类器。根据学习过的分类器将输入训练集划分成两个新集合(左集合和右集合)。然后每个集合被用于递归地训练左和右子树。通过数据增量,在树的顶本文档来自技高网
...

【技术保护点】
一种用于在图像中定位对象的方法,其包括以下步骤:a).构造概率推进树,在该概率推进树中,每个节点将多个弱分类器组合成强分类器或条件后验概率;b).接收包含要被定位的对象的至少一个输入图像;c).根据该条件后验概率识别 该输入图像中的边界框,该对象应驻留在该边界框中;d).根据该对象实际驻留在该位置的似然性计算该边界框的概率值;e).在输入图像中的不同位置重复步骤c).-d).;以及f).选择具有最高计算概率的边界框作为对象驻留的位 置。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:Z屠A巴布
申请(专利权)人:西门子共同研究公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1