从低维类模型集合中选择对象类的特定模型的方法技术

技术编号:2928916 阅读:278 留言:0更新日期:2012-04-11 18:40
从类的低维模型集合中选择对象类的特定模型,其中模型是图,每个图包括表示类中对象的多个顶点和连接这些顶点的边缘。测量类中对象的高维样本子集之间的第一距离。将第一距离与类的低维模型集合组合,以产生受第一距离约束的模型子集,并且从模型子集中选择具有最为分散的顶点的特定模型。

【技术实现步骤摘要】

本专利技术一般涉及对采样数据建模,特别是涉及用低维模型表示高维数据。
技术介绍
如图1所示,非线性降维(NLDR)从高维采样数据101产生低维表示120。数据101对嵌入在环境空间RD110中的d维流形(ddimensional manifold)M 105采样,其中D>d。目的是将嵌入的非本征几何(即流形M 105如何在环境空间RD内成形)与它的本征几何(即流形M的d维坐标系120)分开115。流形可以表示104为具有由边缘(edge)130连接的顶点125的图,如图理论领域中所熟知的。顶点125表示高维坐标系内流形上的采样数据点101,而边缘130为连接顶点125的线或弧。因此,图被嵌入流形。术语“图”(graph)不应该与如在解析几何内的函数图(即曲线图(plot))相混淆。例如,如果已知诸如人的面部之类的对象的流形怎样嵌入面部图像的环境空间,就可用模型的本征几何对面部图像进行编辑、比较和分类,而可用非本征几何来检测图像内的面部和合成新的面部图像。作为另一个例子,可用嵌入在语音空间内的元音对象的流形来对元音内的声音变化的空间建模,这可用来区分元音的类(class)。已知的通过嵌入图和将数据流形浸在低维空间内产生高维数据的低维模型的频谱法由于约束集合不充分和/或约束集合在数字方面情况不好从而是不稳定的。在度量约束下嵌入图在NLDR、自组织无线网络映射和关系数据的视觉化中是一种频繁操作。尽管在频谱嵌入法方面有一些进步,但现有技术的NLDR方法还是不实际和不可靠的。与NLDR关联的一个困难是自动产生使问题能被很好提出、很好调整和用切合实际的时间可解决的嵌入约束。很好提出的约束保证唯一解(solution)。很好调整的约束使解在数字上可与次最优解可分开。两个问题表现为在嵌入约束的谱中特征间隙(eigengap)很小甚至为零,这表明图(即模型)实际上是非刚性(non-rigid)的,并且存在解的特征空间,在该空间中最优解难以与其他解分开。很小的特征间隙使得很难甚至不可能将一个解与它的变形模式分开。图嵌入在拉普拉斯算符那样的局部到整体的图嵌入中,每个图顶点的嵌入受该顶点的近邻(即,在图理论术语中,顶点的1-环)的嵌入的限制。为了降维,顶点是从在环境高维样本空间内以某种方式卷起(roll-up)的流形采样的数据点,而图嵌入约束被设计成再现该流形的局部仿射结构,同时将流形在较低维的目标空间内“打开”。现有技术的局部到整体的图嵌入的例子包括Tutte的方法,见W.T.Tutte的“How to draw a graph”,Proc.London MathematicalSociety,13743-768,1963;拉普拉斯特征映射,见Belkin等人的“Laplacian elgenmaps for dimensionality reduction and datarepresentation”,volume 14 of Advances in Neural InformationProcessing Systems,2002;局部线性嵌入(LLE),见Roweis等人的“Nonlinear dimensionality reduction by locally linear embedding”,Science,2902323-2326,December 22 2000;Hessian LLE,见Donoho等人的“Hessian eigenmaps”,Proceedings,National Academy ofSciences);作图,见Brand的“charting amanifold”,Advances inNeural Information Processing Systems,volume 15,2003;线性正切空间对准(LTSA),见Zhang等人的“Nonlinear dimension reductionvia local tangent space alignment”,Proc.,Conf.on Intelligent DataEngineering and Automated Learning,number 2690 in Lecture Noteson Computer Science,pages 477-481,Springer-Verlag,2003;以及短程线零空间分析(GNA),见Brand的“From subspaces tosubmanifolds”,Proceedings,British Machine Vision Conference,2004。以上所列的最后这三种方法构成最大可能秩的局部仿射约束,导致基本上稳定的解。LTSA和GNA取嵌入在环境空间RD中的N顶点图,顶点位置为X=∈RD×N,并将图重新嵌入较低维空间Rd,新的顶点位置为Y=∈Rd×N,保留局部仿射结构。通常,通过某种试探法从点数据(诸如k个最近邻居)构成图。嵌入如下工作。取k个点的一个这样的邻域,用例如局部主分量分析(PCA)构成局部d维坐标系Xm∈Rd×k。PCA产生一个具有与坐标系Xm的行和常数向量1正交的正交列的零空间矩阵Qm∈Rk×(k-d-1)。这个零空间(nullspace)还与局部坐标系的任何仿射变换A(Xm)正交,使得维护局部坐标系内平行线的任何变换、旋转或延伸都满足A(Xm)Qm=0。于是,任何其他变换T(Xm)可以分离成一个仿射分量A(Xm)加上非线性失真N(Xm)=T(Xm)QmQmT。LTSA和GNA方法将零空间投影QmQmT,m=1,2,...汇编成在图内所有邻域上对非线性失真求和(LTSA)或加权平均的稀疏矩阵K∈RN×N。嵌入基(embedding base)V∈Rd×N具有正交的并横越的列零空间的行向量;即,VVT=I和V=0。可以得出,如果嵌入基V存在并且作为将图嵌入Rd的基础提供,则该嵌入中的每个邻域将相对它的原始局部坐标系具有零非线性失真,见以上Zhang等人的论文。此外,如果邻域充分交叠,使得图在Rd内成为仿射刚性的,那么从原始数据X到嵌入基V的变换就以相同的方式“伸展”图的每个邻域。然后,线性变换T∈Rd×d消除该伸展,给出较低维顶点位置Y=TV,使得从较高维数据X到较低维嵌入Y的变换只包括局部邻域的刚性变换,即嵌入Y是等距的。当在这过程中有任何类型的噪声或测量误差时,可以通过K∈RN×N的瘦奇异值分解(SVD)或K的零空间的瘦特征值分解(EVD)(即KKT)得到最小平方最佳近似嵌入基V。由于矩阵K是非常稀疏的,具有O(N)个非零值,迭代子空间估计器通常呈现O(N)倍缩放。在稀疏矩阵K用GNA构成时,对应的奇异值SN-1,SN-2,...测量按维的在点范围上的平均失真。现有技术的图嵌入的核心问题之一是KKT以及局部NLDR中的任何约束矩阵的特征值在λ0=0附近(其是提供嵌入基V的谱的末端)二次性增长,附录A是KKT的特征值的二次增长的证明。二次增长意味着特征值曲线在谱的低端几乎是平坦的(λi+1-λi≈0),使得将嵌入基与其他特征向量分离的特征间隙可以忽略。在简单的图拉普拉斯算符的谱内可以观察到类似的结果,它们也是S形的,在零附近二次增本文档来自技高网...

【技术保护点】
一种从对象类的低维模型的集合中选择对象类的特定模型的方法,其中模型是图,每个图包括表示类中对象的多个顶点和连接所述顶点的边缘,所述方法包括:测量类中对象的高维样本子集之间的距离,将第一距离与类的低维模型集合组合,以产生受第一 距离约束的模型子集,以及从模型子集中选择具有最为分散的顶点的特定模型。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:马修E布兰德
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1