基于曲率预测的流形学习自适应邻域选择算法制造技术

技术编号:8215615 阅读:263 留言:0更新日期:2013-01-17 13:12
基于曲率预测的流形学习自适应邻域选择算法,它涉及一种应用于流形学习的自适应邻域选择算法,以解决现有的领域选择算法应用于流形学习算法存在适应性差,低维嵌入质量差,算法复杂度较高的问题,算法的具体步骤为,步骤一、高维离散数据点的曲率计算;步骤二、自适应邻域选择,本发明专利技术能够广泛的应用到目前的流形学习算法,本发明专利技术能够根据数据集分布的不同曲率选择合适的领域大小,本发明专利技术以高维数据点的一个自适应邻域选择矩阵,能够有效地降低流形学习算法的复杂度和找到优化的邻域大小,实现最佳的低维嵌入,低维嵌入质量好。本发明专利技术用于流形学习算法。

【技术实现步骤摘要】

本专利技术涉及一种应用于流形学习的自适应邻域选择算法。
技术介绍
自2000年在《科学》杂志发表两篇关于等距映射算法(Isometric Mapping,IS0MAP)流形学习算法和局部线性嵌入算法(Local Linear Embedding,LLE)的论文起,流形学习成为了解决计算机科学领域问题,特别是机器视觉和模式识别领域的常用方法,通过将嵌入在高维空间的数据映射到低维空间,实现对高维数据的维数约简。随着现今科技发展情况下海量数据处理需求,流形学习算法成为了众多研究领域的热点,如人脸识别,指纹识别,网络海量数据处理等。目前基于流形假设的维数约简算法有很多,它们各自采用不同的方法来保持高维 数据某一特征或多个特征来实现对高维数据的低维映射,LLE算法通过保持高维流形的局部线性结构实现对高维数据的降维;而ISOMAP算法通过保持高维数据点之间的测地线距离不变而实现维数约简的目标。基于上述两种算法,近年来出现了解决不同具体问题的流形学习算法,像拉普拉斯特征映射(Laplacian Eigen Mapping, LE)、局部线性投影算法(Local Linear Pro jection, LLP)及一些改进算法,如带标记的等距映射(L-IS0MAP)、海赛局部线性嵌入(Hessian LLE,HLLE)。据不完全统计,目前基于流形假设的降维算法不少于二十种。通过分析典型流形学习算法的实现流程,可以发现基于流形假设的维数约简算法都有一些共同的算法步骤,如计算距离、寻找邻近点、特征向量预测等。不同的流形学习算法对于距离的衡量各不相同,LLE等算法中采用欧氏距离,LE算法采用拉普拉斯特征算子来衡量距离,ISOMAP算法中提出用测地线来表示高维数据点距离。在距离表示上,许多算法的不同之处正是基于这一点实现了对高维数据的不同特征的提取与保持。但在已有的流形学习算法中,特别是基于LLE和ISOMAP算法提出的众多流形学习算法,都有一个关键步骤一寻找邻近点。邻近点,即邻域,选取的大小与嵌入结果的好坏息息相关。因为流形学习是基于数据点之间信息传播及高维数据局部特征提取的方法,只有适当的邻域大小才能最好的得到低维嵌入结果,并同时实现算法复杂度最小和嵌入“质量”最高。常见邻域选择的方式有两种一是K最邻近(K Nearest Neighbors, KNN) ;二是ε -超球体(ε -ball)。考虑到现有的流形学习算法,基本上都是基于KNN方法来实现,提出的技术专利技术中自适应KNN邻域的选择方法。从目前已有的参考文献来看,提出自适应邻域选择算法的文献很少,并且没有文献提出通用于目前大多数流形算法的自适应邻域选择算法。因此,提高低维嵌入质量,同时一定程度上降低算法复杂度,找到一种简单有效且有一定普适性的自适应邻域选择算法具体现实意义。从流形假设出发,即高维数据点至少给分布在一个广义流形上,那么高维数据点的函数关系是存在的,并且是可微的。从这一假设出发,满足流形学习条件的数据集是可以计算或估计其数据点相应的曲率。通过阅读数学资料及文献,可以得出在已知确定函数关系条件下,由微分几何可知,可能通过计算导数的方法来求出相应自变量取值处的斜率。斜率变化趋势就可以用来表示随着自变量的改变,因变量的变化情况。当处理多元函数的曲率问题时,可以应用黎曼微分几何的相关的知识来求解。但在求解高维数据对应的函数关系时有两个明显的问题一是,对于高维数据,自变量与因变量的关系是不确定的,即无法确定哪些变量是自变量,哪些变量是因变量;二是在离散点条件下,准确的求解函数关系不可行的,最多只是采用某种算法来进行拟合,如此一来,那么就要假定数据点满足某种特定的函数关系,再来计算相应的系数。这两个明显的问题使得上述提出的理论计算方法变得不可以实现。综上所述,现有的领域选择算法应用于流形学习算法存在适应性差,低维嵌入质量差,算法复杂度较高的问题。
技术实现思路
本专利技术的目的是为解决现有的领域选择算法应用于流形学习算法存在适应性差,低维嵌入质量差,算法复杂度较高的问题,进而提供一种基于曲率预测的流形学习自适应邻域选择算法。本专利技术为解决上述问题采取的技术方案是本专利技术的基于曲率预测的流形学习自适应邻域选择算法的具体步骤为步骤一、高维离散数据点的曲率计算,假定Ni = {xn, xi2,…,XiJ为数据点Xi邻近的N个点,则Jacobi矩阵可以由下式预测权利要求1.基于曲率预测的流形学习自适应邻域选择算法,所述自适应邻域选择算法的具体步骤为 步骤一、高维离散数据点的曲率计算,假定Ni = {xn, Xi2, ···, xiN}为数据点Xi邻近的N个点,则Jacobi矩阵可以由下式预测全文摘要基于曲率预测的流形学习自适应邻域选择算法,它涉及一种应用于流形学习的自适应邻域选择算法,以解决现有的领域选择算法应用于流形学习算法存在适应性差,低维嵌入质量差,算法复杂度较高的问题,算法的具体步骤为,步骤一、高维离散数据点的曲率计算;步骤二、自适应邻域选择,本专利技术能够广泛的应用到目前的流形学习算法,本专利技术能够根据数据集分布的不同曲率选择合适的领域大小,本专利技术以高维数据点的一个自适应邻域选择矩阵,能够有效地降低流形学习算法的复杂度和找到优化的邻域大小,实现最佳的低维嵌入,低维嵌入质量好。本专利技术用于流形学习算法。文档编号G06F17/16GK102880593SQ20121032565公开日2013年1月16日 申请日期2012年9月5日 优先权日2012年9月5日专利技术者马琳, 周才发, 刘曦, 马欣茹, 徐玉滨, 强蔚 申请人:哈尔滨工业大学本文档来自技高网
...

【技术保护点】
基于曲率预测的流形学习自适应邻域选择算法,所述自适应邻域选择算法的具体步骤为:步骤一、高维离散数据点的曲率计算,假定Ni={xi1,xi2,…,xiN}为数据点xi邻近的N个点,则Jacobi矩阵可以由下式预测:其中:?是Ni个点的中心,即为Ni个点坐标的平均值,其表达式为:?Qi是由矩阵?前r个最大的奇异值分解的特征向量构成的矩阵;?是矩阵?的奇异分解的特征向量中第j(1≤j≤N)点的特征向量,上角标代表的是第i个点,下角标代表的是第i点的N邻近点中的第j点,?代表的是点xi邻近的一个小邻域,其中τ表示点xi的函数变量,?表示点xi的邻域函数变量,由式(1),可以得到:其中,‖‖表示对符号内表达式(或矩阵)求其相应的欧几里得距离,由式(2)可以推导出:由式(3)推导出:由式(4),可以得出Jacobi矩阵的下限值Jinf:其中下表inf代表的是相应变量的下界,即下限值,式(5)即为用来计算离散点的曲率?的公式,上述公式(1)中的N值的确定如下:其中:D是高维数据的维数;d是嵌入的低维空间的维数;步骤二、自适应邻域选择,邻域选择的大小存在下限值与上限值,分别表示为Kinf、Ksup:其中,下标inf和sup分别代表的是相应变量的下限值和上限值,D是高维数据的维数,d是嵌入的低维空间的维数;在邻域选择的范围内,有下式的邻域选择准则:其中:int[?]表示对符号内表达式向下取整,Ki是数据点xi的邻域大小;Ko是初始的邻域大小;ΔJτ是相邻数据点之前曲率的变化值;δo曲率变化步长,它的值与曲率变化的极差及数据点的分区数目有关,综合式(7)及式(8),可以给出自适应邻域选择准则:Ko采用与式(6)的N相同的取值方式,通过上述分析,可以由式(9)计算各个数据点的自适应邻域大小。?dest_path_FDA00002216029400011.jpg,dest_path_FDA00002216029400012.jpg,dest_path_FDA00002216029400013.jpg,dest_path_FDA00002216029400014.jpg,dest_path_FDA00002216029400015.jpg,dest_path_FDA00002216029400016.jpg,dest_path_FDA00002216029400017.jpg,dest_path_FDA00002216029400018.jpg,dest_path_FDA00002216029400019.jpg,dest_path_FDA000022160294000110.jpg,dest_path_FDA000022160294000111.jpg,dest_path_FDA000022160294000112.jpg,dest_path_FDA00002216029400021.jpg,dest_path_FDA00002216029400022.jpg,dest_path_FDA00002216029400023.jpg,dest_path_FDA00002216029400024.jpg...

【技术特征摘要】

【专利技术属性】
技术研发人员:马琳周才发刘曦马欣茹徐玉滨强蔚
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1