一种基于半监督学习的高光谱图像的降维方法技术

技术编号:17780401 阅读:25 留言:0更新日期:2018-04-22 09:16
本发明专利技术涉及一种基于半监督学习的高光谱图像的降维方法,所述方法包括以下步骤:构造改进的半监督相似权重矩阵Q;计算相似权重矩阵的对角矩阵D

【技术实现步骤摘要】
一种基于半监督学习的高光谱图像的降维方法
本专利技术涉及高光谱图像的降维
,具体地说,是一种基于半监督学习的高光谱图像的降维方法。
技术介绍
高光谱遥感技术是20世纪80年代出现的一种全新的遥感技术。高光谱遥感技术从其诞生之日起就得到了迅猛发展,现已在许多领域有着广泛的应用和研究,比如地理学、地质学、生态学、环境科学、大气科学和海洋学等,尤其是在军事应用方面都得到了广泛的研究和应用。随着互联网和信息技术的不断发展,人们获取信息和数据的能力越来越强,这些数据往往具有波段多、光谱分辨率高、波段宽度窄、数据量庞大、维数高等特点,可以将其看作是由两个空间维和多个光谱维构成的高维“图像立方体”,受“维数灾难”现象的影响使得高光谱图像处理的难度、计算量都相当的巨大。因此,需要在高光谱影像处理前进行预处理,且需要满足3种要求:①减少高光谱数据特征之间的冗余;②保持对随后分类非常重要的地物之间的判别信息;⑨减少计算复杂度。高光谱数据降维技术主要是利用低维数据来有效表达高维数据信息,在压缩数据量的同时为地物信息提取提供优化的特征。根据降维方法不同,主要分为两类:特征提取和特征选择,如图1所示。高光谱特征提取是指对原始的光谱空间特征进行重新组合和优化,提取出最适合当前应用需求的新特征。高光谱特征选择则是对原始特征空间的子集挑选,选出那些最具有可分性的光谱波段。根据样本数据是否考虑或使用类别标签,传统的降维方法可以分为三类:监督降维、无监督降维和半监督降维。无监督降维是指未给数据加类标进行降维,用于高光谱图像特征提取中无监督的传统降维算法包括主成分分析法(principlecomponentanalysis,PCA)、等度量映射(IsometricMappingIsomap)、局部线性嵌入(locallylinearembedding,LLE)和局部保留投影(localitypreservingprojections,LPP),对高光谱图像进行无监督降维,无能保证从高维到低维投影之后样本点间距离不变。有监督降维是指给所有的数据都加入类标进行降维,有监督降维的传统降维算法包括线性判别分析(lineardiscriminantanalysis,LDA)、局部Fisher判别分析(localfisherdiscriminantanalysis,LFDA)和非参数加权特征提取(nonparametricweightedfeatureextraction,NWFE),对高光谱图像进行有监督降维,图像的类标需要大量的人力,物力,且有类标数据难以获取。半监督降维是指少数数据加上类标,多数数据未加类标,半监督降维的传统降维算法包括半监督降维(semi-superviseddimensionalityreduction,SSDR)和成对约束传播(pairwiseconstraintprojection[21],PCP),半监督降维利用这些有少量的类标数据和大量的无类标数据进行降维,只需较少的人工参与就能获得更高的准确度,因此这个方法成为近几年来的一个研究热点。然而,当高维中不同类的数据有部分重合或者靠的很近,虽然LPP有局部保留特性,但是LPP没有利用样本的类标信息,LPP会把不同的类投影到一起,会得到不理想的分类精度。而SSDR利用了类别标签信息,并没有考虑邻域信息,不能很好地反映数据集的局部结构。中国专利文献CN201610008366.2,申请日20160107,专利名称为:基于有监督图的直推式数据降维方法,公开了一种直推式局部保持投影数据降维方法,主要解决现有基于半监督学习的数据降维方法仅利用欧氏距离进行构图,识别结果不理想的问题。其实现步骤是:(1)输入数据并归一化;(2)计算归一化后的原始矩阵及类标向量;(3)由原始数据计算第一拉普拉斯矩阵L;(4)由类标向量计算第二拉普拉斯矩阵Ll;(5)由第一拉普拉斯矩阵L和第二拉普拉斯矩阵Ll计算相似度矩阵S;(6)由类标向量计算样本的类间权重矩阵Wc;(7)由相似度矩阵S和类间权重矩阵Wc构建广义特征值公式并求解,得到投影矩阵E;(8)由投影矩阵E计算出降维后的样本。上述专利文献有效地对数据进行特征提取与降维,提高了数据分类识别的准确率,可用于数据与图像处理。但是,关于一种既利用样本的类标信息,又考虑了样本点之间的邻域信息的降维方法,能够最小化同类样本间的距离,最大化不同类样本间的距离,从而提高了样本的分类精度的技术方案则无相应的公开。综上所述,需要一种既利用样本的类标信息,又考虑了样本点之间的邻域信息的降维方法,能够最小化同类样本间的距离,最大化不同类样本间的距离,从而提高了样本的分类精度。而关于这种降维方法目前还未见报道。
技术实现思路
本专利技术的目的是针对现有技术中的不足,提供一种既利用样本的类标信息,又考虑了样本点之间的邻域信息的降维方法,能够最小化同类样本间的距离,最大化不同类样本间的距离,从而提高了样本的分类精度。本专利技术的第二目的是:提供一种基于半监督学习的高光谱的降维方法的技术路线。为实现上述目的,本专利技术采取的技术方案是:一种基于半监督学习的高光谱的降维方法,所述方法包括以下步骤:步骤S1、设高维空间RD中存在数据集X={x1,x2,…,xl,xl+1,…,xl+u},l+u=N,其中前l个样本Xl为有类标样本,类别标签为c,各类样本数为Ni,i=(1,2,…,c),后u个样本Xu是无类标样本,根据第一公式构造改进的半监督相似权重矩阵Q:其中,qij为改进的半监督相似权重矩阵Q的元素,Wij为第一公式,Nk(xi)为xi的k近邻域,Wij为局部权重值,令(1+Wij)为类内判别权值,(1-Wij)为类间判别权值;步骤S2、计算相似权重矩阵的对角矩阵D*以及拉普拉斯矩阵L*;对角矩阵为Dii*=∑jqij,L*=D*-Q为拉普拉斯矩阵;步骤S3、根据步骤S1中的半监督相似权重矩阵的qij构造改进后的目标函数;步骤S4、引入约束条件YDYT=ATXD*XTA=I,其中I为单位矩阵,根据步骤S3的目标函数求解广义特征方程:XL*XTai=λiXD*XTai步骤S5、令a1,a2,…,ad分别为上式前d个最小非零特征值对应的特征向量,根据步骤S4的广义特征方程求解转换函数矩阵A=(a1,a2,…,ad);输入:样本数据集参数为k及σ;输出转换矩阵A=[a1,a2,…,ad]及低维子空间样本点Y=ATX={y1,y2,…,yN}。作为一种优选的技术方案,第一公式采用局部保持投影法,具体如下:给定一个在高维空间RD中N维的样本数据点{x1,x2,,…,xN},求出一个转换矩阵A=[a1,a2,…,ad],将N维的数据点映射到低维的子空间Rd(d<<D)的点为{y1,y2,…,yN},其中yi=AT×xi,获得局部保持投影的相似权重矩阵为:其中,σ为调节参数,其取值为所有样本对之间欧氏距离平均值的平方,Nk(xi)为xi的k近邻域。为实现上述第二个目的,本专利技术采用的技术方案是:一种基于半监督学习的高光谱的降维方法的技术路线,包括以下步骤:第一步,把已有的高光谱图像,参考图例,提取出不同类别的样本数据{x1,x2,,…,xN},作为高光谱图像降维的输入本文档来自技高网
...
一种基于半监督学习的高光谱图像的降维方法

【技术保护点】
一种基于半监督学习的高光谱的降维方法,其特征在于,所述方法包括以下步骤:步骤S1、设高维空间R

【技术特征摘要】
1.一种基于半监督学习的高光谱的降维方法,其特征在于,所述方法包括以下步骤:步骤S1、设高维空间RD中存在数据集X={x1,x2,…,xl,xl+1,…,xl+u},l+u=N,其中前l个样本Xl为有类标样本,类别标签为c,各类样本数为Ni,i=(1,2,…,c),后u个样本Xu是无类标样本,根据第一公式构造改进的半监督相似权重矩阵Q:其中,qij为改进的半监督相似权重矩阵Q的元素,Wij为第一公式,Nk(xi)为xi的k近邻域,Wij为局部权重值,令(1+Wij)为类内判别权值,(1-Wij)为类间判别权值;步骤S2、计算相似权重矩阵的对角矩阵D*以及拉普拉斯矩阵L*;对角矩阵为Dii*=∑jqij,L*=D*-Q为拉普拉斯矩阵;步骤S3、根据步骤S1中的半监督相似权重矩阵的qij构造改进后的目标函数;步骤S4、引入约束条件YDYT=ATXD*XTA=I,其中I为单位矩阵,根据步骤S3的目标函数求解广义特征方程:XL*XTai=λiXD*XTai步骤S5、令a1,a2,…,ad分别为上式前d个最小非零特征值对应的特征向量,根据步骤S4的广义特征方程求解转换矩阵A=(a1,a2,…,ad);输入样本数据集参数为k及σ;输出转换矩阵A=[a1,a2,…,ad]及低维子空间样本点Y=ATX={y1,y2,…,yN}。2.根据权利要求1所述的基于半监督学习的高光谱的降维方法,其特征在于,第一公式采用局部保持投影法,具体如下:给定一个在高维空间RD中N...

【专利技术属性】
技术研发人员:黄冬梅张明华张晓桐郑小罗张腾飞田为民
申请(专利权)人:上海海洋大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1