模式识别方法技术

技术编号:2928020 阅读:156 留言:0更新日期:2012-04-11 18:40
根据本发明专利技术的一个实施例,提出了一种用于根据基函数来对向量空间中的向量集合的分布以及类界限进行近似的模式识别方法。该方法包括:在两个基向量之间定义有方向的基函数(ST1至ST6),并且利用有方向的基函数的线性组合来执行近似(ST7至ST8)。

【技术实现步骤摘要】

本专利技术涉及这样一种,该用于根据基函数来对向量空间中的向量集合的分布以及两个或多个向量集合(类)的界限进行近似。
技术介绍
使用被称为径向基函数(在下文中被称为球形基函数)的基函数的方法是已知的。数个研究组已经独立地提出了球形基函数。作为这种提议的一个示例,在这里引用了J.E.Moody和C.Darken所著的“Fast Learning in Networks of Locally-Tuned Processing Units”(Neural Computation 1,第281-294页,1989年)。球形基函数在中心上具有峰值并且在各个方向上都对称。对于球形基函数,所谓的高斯型球形基函数是最通行的,并且通过下述公式来表示oi(x)=exp,其中,x是与输入模式相对应的向量,并且ξi是第i个基向量(用于表示在高斯分布中的位置的参数),而σi是第i个标准偏差(用于表示高斯分布的扩展的参数)。第i个高斯型基函数的值是oi(x),当x接近于ξi时,该第i个高斯型基函数的值是非负的且很大,并且当x=ξi时,该第i个高斯型基函数的值采用最大值1。通过提供充够数目的基函数并且使用由下述公式所表示的加权线性组合,可将任何任意选择的向量集合的分布近似为期望的精度级,所述公式为y1(x)=Σi=1H′w1ioi(x),]]>其中,1是向量集合的类编号,并且w1i是第i个基函数相对于类1而言的分布率(加权参数),而H′是基函数的数目。上述公式表示未知的输入模式相似于特定类的程度(相似度),因此它可用于对类进行分类。例如,如果C(x)=arg max1(y1(x)],那么可根据基函数所定义的类界限来确定输入模式的类。在上述公式3中,argmax1是提供相似度的最大值的类的编号。使用球形基函数的提供了这样的优点,其中包括与基于一般的S形函数的前馈神经网络一样,通过学习可使参数最优化;但是,与一般神经网络不同,独立的基函数的分布率在直觉上是易于了解的。然而,与从现实世界中所观测到的模式相对应的向量的分布通常很复杂,并且因此必须准备很大数目的基函数以便对这种分布进行精确地近似。相反,当所获得的抽样数目小时,近似会产生相对于适当分布(群体分布)而言也很复杂这样的状态(过度学习)。
技术实现思路
因此,本专利技术的目的就是提供这样一种,该适于根据与已知的可比性方法相比数目更少的基向量来对可能很复杂的向量集合的分布以及类的界限进行近似。根据本专利技术的一个实施例,提供了一种用于根据基函数来对向量空间中的向量集合的分布以及类界限进行近似的方法。该方法包括在两个基向量之间定义有方向的基函数,并且利用有方向的基函数的线性组合来执行近似。在下面的描述中对本专利技术的另外的目的和优点进行阐述,并且这些目的和优点在某种程度上是可从该描述中显而易见地得知的,或者可从本专利技术的实践中获悉。借助于尤其是在下文中所指出的手段及组合可实现并获得本专利技术的目的和优点。附图说明包含在说明书中并构成了说明书一部分的附图对本专利技术的实施例进行了说明,并且与以上给出的一般描述以及以下给出的对实施例的详细说明一起用于说明本专利技术的原理。图1是作为示例而示出的本专利技术的实施例的处理操作的流程图;图2是作为示例而示出的与输入模式相对应的向量、基函数、以及向量集合的分布的图示;图3是作为示例而示出的基函数的图示;图4是作为示例而示出的对模式分布进行近似的示意性说明;图5是使用传统的球形基函数、对与图4相同的模式分布进行近似的示意性说明;图6是作为示例而示出的当所获得的抽样数目小时的基函数的示意性图示;图7是作为示例而示出的当所获得的抽样数目小时对模式分布进行近似的示意性说明;图8是作为示例而示出的、使用传统的球形基函数对与图7相同的模式分布进行近似的示意性说明;图9是示出了通过学习抽样来定义参数的方法的流程图;以及图10是给出了作为示例的硬件结构的硬件的示意性方框图。具体实施例方式下面参考附图对本专利技术的实施例进行描述。<第一实施例> 图1是该实施例的处理操作的流程图。图2是与输入模式相对应的向量、基函数、以及向量集合的分布的示意性图示。首先,输入一个模式(ST1)。在这里所使用的表述“模式”是指诸如数字图像的像素值或一行特征量这样的计算机可处理的数字值串。模式可以被认为是具有这种数字值作为分量(ST2,ST3)的向量。通过下述公式来表示与输入模式相对应的向量x=T, 其中,x1、x2、…、xM表示模式的数字值串(每个向量的单元),并且M表示单元的数目。此后,通过计算确定基函数的值(ST4至ST6)。根据这个实施例,在两个基向量之间定义基函数,以便如果基向量的数目是H,那么基函数的数目是H2。该实施例提出了通过下述公式所表示的基函数oij(x),所述公式在两个基向量的位置上具有峰值,并且具有集中在用于连接两个峰值的线段上的增强了的特征。该公式是oij(x)=exp,其中,x表示与输入模式相对应的向量,并且ξi表示第i个基向量,同时ξj表示第j个基向量,并且σij表示在第i个和第j个基向量之间定义的基函数的标准偏差。基函数实质上与传统的球形基函数的不同之处在于,当将基向量作为中心进行查看时它不是在所有方向上都对称的(并且具有取决于其它某个基向量的方向的增强了的特征)。图3是作为示例而示出的基函数的图示。本专利技术基于“线性插值的假定”或者“当两个基向量之间的距离短时这两个基向量之间的线性内插强这样的假定”。图3给出了当两个向量之间的距离为长、中等、以及短时的三个不同基函数的轮廓图。与球形基函数一样,oij(x)的值是非负的,并且当x接近ξi或ξj时变大,以便当x=ξi或x=ξj时采用最大值1。另外,或类似地,可通过由下面的公式所表示的加权线性组合(ST7,ST8)来对向量集合的分布y1(x)进行近似y1(x)=Σi=1HΣi=1Hw1ijoij(x),]]>其中,1表示向量集合的类编号,并且w1ij表示在第i个基向量与第j个基向量之间定义的基函数的类1的分布率,而H表示基函数的数目。最后,借助于如下所示的公式来通过计算确定输入模式相似于该类的程度(相似度)或C(x) C(x)=arg max1,其中,argmax1是提供相似度的最大值的类的编号。该实施例中的基函数的优点在于,可学习参数,并且与传统的球形基函数一样分布率在直觉上是易于了解的,并且另外可克服传统方法的问题。更具体地说,可通过比以往更少的基向量对向量的复杂分布进行近似。图4是借助于该实施例对模式分布进行近似的示意性说明。因为该实施例中的基函数具有示出了由实线所表示的椭圆形或圆柱形扩展(不对称)这样的特征,因此,与仅示出了圆形扩展的传统基函数相比,它是具有高度表现性的。图5是使用传统的球形基函数来对与图4相同的模式分布进行近似的示意性说明。图5示意性地示出了传统的基函数需要比该实施例(仅需要三个基向量)更多的基向量。通常,当模式分布很复杂但是在从本地观察的情况下该模式分布是本地连续的(尤其是线性的)时,由于本专利技术的基函数的插值可能性,可降低基向量的数目。在插值不能有助于对模式分布进行近似的最坏情况下,根据本文档来自技高网
...

【技术保护点】
一种用于根据基函数来对向量空间中的向量集合的分布以及类界限进行近似的模式识别方法,其特征在于包括:在两个基向量之间定义有方向的基函数(ST1~ST6);以及利用有方向的基函数的线性组合来执行近似(ST7~ST8)。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:名取直毅
申请(专利权)人:株式会社东芝
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利