【技术实现步骤摘要】
一种基于局部正交对齐的特征降维方法
本专利技术属于模式识别领域,具体涉及一种保持局部正交对齐的非线性降维方法(简称LOPA)。
技术介绍
随着计算机、互联网等科学技术的飞速发展,人们获取、存储数据的能力不断增强。现在的数据已经开始呈现出规模大、维度高的特性,如高清照片视频数据、基因染色体数据、社交网络的用户数据等。这些海量的高维数据在为人们的生活、研究工作带来便利的同时也带来了存储、传输、处理上的困难。首先是“维度灾难”问题,在机器学习中,很多在低维空间中有效的算法在高维空间中并不能得以直接地推广;其次,高维数据往往带有很多的冗余信息,这些冗余信息为我们认清数据的本质特征带来了困难。数据降维,作为机器学习、模式识别、数据挖掘必要的预处理步骤,就是有效的解决办法。数据降维,又称为维度约简,在特定的优化目标下,通过线性或非线性映射将高维数据映射到低维空间。降维的目标一般是要保持原有高维空间中某些特性,如距离、方差等。这样在减少数据规模的情况下,仍然能保持数据的主要信息。数据降维的意义主要表现在:●特征提取:高维特征数据通常带有很多不相关的信息,通过数据降维,可以实现特 ...
【技术保护点】
一种基于局部正交对齐的降维方法,其特征是,采用如下步骤进行数据降维:步骤1:输入N个高维数据点xi∈Rm组成的数据矩阵X∈Rm×N,根据高维数据点之间的欧式距离,获取数据点xi的局部近邻关系:xi的局部k近邻Xi∈Rm×k,近邻选择矩阵Si∈RN×k,Si是0‑1选择矩阵,使得Xi=XSi;步骤2:局部的低维表示:若数据的分布满足流形假设,对于流形结构,其局部通过欧式空间的性质进行逼近;利用主成分分析将局部k近邻Xi降到d维,得到局部坐标Θi∈Rd×k;步骤3:低维坐标的全局对齐:将得到的所有低维坐标Θi,i=1,…,N通过正交对齐得到最优的全局低维坐标Y∈Rd×N,并使得 ...
【技术特征摘要】
1.一种基于局部正交对齐的降维方法,其特征是,采用如下步骤进行数据降维:步骤1:输入N个高维数据点xi∈Rm组成的数据矩阵X∈Rm×N,根据高维数据点之间的欧式距离,获取数据点xi的局部近邻关系:xi的局部k近邻Xi∈Rm×k,近邻选择矩阵Si∈RN×k,Si是0-1选择矩阵,使得Xi=XSi;步骤2:局部的低维表示:若数据的分布满足流形假设,对于流形结构,其局部通过欧式空间的性质进行逼近;利用主成分分析将局部k近邻Xi降到d维,得到局部坐标Θi∈Rd×k;步骤3:低维坐标的全局对齐:将得到的所有低维坐标Θi,i=1,...,N通过正交对齐得到最优的全局低维坐标Y∈Rd×N,并使得重构误差最小:其中Li∈Rd×d为正交变换,Id为d维的单位矩阵,Hk∈Rk×k为中心化矩阵;步骤4:在给定全局低维坐标Y的情况下,Li通过最小二乘进行求解其中Θi+为Θi的Moore-Penrose伪逆;将Li代入到公式I中,并通过迹与F-范数的关系可以将公式I等价转化为:其中对公式II进行条件松弛,并将多个正交约束进行叠加,得到单个正交约束:其中公式III就是本方法最终的目标函数;步骤5:将目标函数公式III分解为两个子问题:半正定松弛部分和正交约束部分;并分别通过半正定松弛方法和强制正交化方法进行求解,最终得到降维后的结果。2.如权利要求1所述的降维方法,其特征是,步骤4中所述的对公式II进行条件松弛,其实现方法为:每个局部正交约束利用迹运算,将局部正交约束简化为对角和为...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。