基于锚点稀疏图的半监督高光谱分类方法技术

技术编号:12514399 阅读:161 留言:0更新日期:2015-12-16 12:17
本发明专利技术公开了一种基于锚点稀疏图的半监督高光谱分类方法,主要解决现有技术在构图时计算量与存储量大的问题。其步骤为:1.从高光谱数据集中得到训练数据集和标记样本集;2.随机选取锚点;3.构造样本点与锚点的稀疏空谱关系矩阵;4.计算图拉普拉斯矩阵;5.计算锚点的标签;6.根据求解得到的锚点标签以及稀疏空谱关系矩阵获得未标记样本点的类别。本发明专利技术在构图过程中选取少量锚点,根据样本与锚点的空间和谱间关系,构造稀疏空谱关系矩阵,大大减少了构图时的复杂度,缩短了计算的时间。本发明专利技术可以用于高光谱数据的分类识别。

【技术实现步骤摘要】

本专利技术属于图像处理
,更进一步涉及一种分类方法,可用于高光谱图像 的分类。
技术介绍
近年来,高光谱遥感已经成为遥感方向的前沿技术。高光谱图像中包含着丰富的 空间、光谱和辐射信息,这些信息特征已使其在许多领域都具有巨大的应用前景,比如地质 勘探、精细农业、海洋检测、军事侦察等。 高光谱遥感技术除了可以获得确定物质或地物性质的光谱信息之外,还能够揭示 地物之间的空间位置关系,即实现了 "图谱合一"。这使得高光谱遥感可以同时实现获取地 物光谱特征以及保留其与周围地物的关系。此外,与普通遥感相比,高光谱遥感具有数目更 多、波段更窄的谱段,因此能够揭示那些只有在狭窄范围内才能表现出的物质特征,形成更 为完整的光谱数据。高光谱图像的这些特点以及其所包含的丰富的空谱信息,使其在地物 分类和识别中具有独特的优势,能显著提高分类识别的精确度。 高光谱数据地物分类一直是高光谱数据研究中的一个重点研究方向。所谓的高光 谱数据地物分类,就是指一种根据收集到的信息,给出需要进行分类的地物目标的所属种 类的数据处理技术,通过为每个高光谱图像中的像元赋予一个所属类别的标记,从而得到 所有像元的标记图。进行分类识别后的标记图能够反映出各类地物的空间分布情况,有利 于全面和清楚的认识所研究的区域,使得高光谱图像具有应用价值。 然而,高光谱遥感数据的光谱分辨率提高的同时,其数据维度和数据量也随之大 幅度的增加,使得处理数据时的计算压力明显增大,这为高光谱分类和识别的实际应用带 来困难。许多传统的多光谱数据分类算法对于高光谱数据已经不再适用,需要根据高光谱 数据的特点,提出能够减少运算量、提高分类精度的适用于高光谱数据的分类算法。目前已 有的高光谱数据分类算法,根据是否有已标记样本参与训练分类器,可以将分类方法以下 三类: (1)无监督分类算法 无监督分类方法是指在所有样本的标记均未知的情况下,只根据高光谱数据中光 谱特性之间是否相似对样本进行分类,这种分类方法其实属于一种分割方式,比如K均值 聚类、IS0DATA。无监督分类算法也被称为聚类。该类方法的优点是,并不需要标记样本,能 够节省人力物力。但是,由于没有先验信息,无监督分类方法的分类正确率不高,并且不能 得到地物所属的具体类别。另外,无监督分类方法的计算过程比较耗时。 (2)监督分类算法 有监督分类算法首先根据已标记样本进行训练,学习得到一个分类器,然后用这 个分类器对未标记的样本进行分类。支持向量机(SVM)是目前较常见的方法,该方法属于 一种基于结构风险最小化的分类方法。在监督分类算法中,标记样本决定分类的精确程度, 但是,在高光谱数据中对样本进行标记需要花费大量人力物力,而获取大量的未标记样本 比较容易。当标记样本数目较少时,监督分类算法的分类效果并不理想,该问题会制约监督 分类算法在高光谱数据分类领域中的推广。 (3)半监督分类算法 半监督分类算法同时利用已标记样本和未标记样来训练分类器,此种算法能够充 分利用未标记样本中的信息来提高分类精度,并且提高了分类器的泛化性能。其中基于图 的半监督分类算法,由于能明确的描述和解决流型假设而在近年来逐渐受到关注和发展, 如LapSVM。但是,对于高光谱数据的分类样本数量很多,导致构图所需的计算量和存储量过 于大,使得基于图的学习方法在运用中遇到困难。
技术实现思路
本专利技术的目的在于针对基于图的半监督分类算法中的不足,提出一种基于锚点稀 疏图的半监督高光谱分类方法,通过构建样本与少量锚点的关系矩阵,并利用少量的标记 样本,实现对高光谱遥感数据的分类。 实现本专利技术目的的技术方案是:通过选取少量锚点,构造样本点与锚点的稀疏空 谱关系矩阵,根据该关系矩阵得到图拉普拉斯矩阵,从而计算得到锚点的标签,再根据样本 点标签与锚点标签的关系,实现对数据的分类。具体步骤包括如下: (1)从高光谱数据集中得到训练数据集X和标记样本集Y。 (2)从训练数据集中随机选取m个点作为锚点,表示为>样本 的标签f (Vk)可以通过下式得到: 其中,f (Vk)表示锚点的标签,Zlk表示锚点标签f(v k)对样本标签f (X1)的贡献比 重权值。 (3)构造样本点与锚点的稀疏空谱关系矩阵 3a)对于每个样本点X1,根据该样本点与所有锚点的空间欧式距离(!(X 1, vk),选择 出在空间距离上与X1最近的s个锚点; 3b)根据下式计算稀疏空谱关系矩阵: 其中,核函数选用高斯核表示距离 样本X1最近的s个锚点的位置索引。 (4)根据下式计算图拉普拉斯矩阵: 其中,4 e ITmm表示一个对角矩阵且 (5)根据下式计算锚点的标签: LlN 丄UOlbUdO丄 A I ^ J/O JM 其中,岑e表示Z中1个标记样本所对应的子矩阵,γ > 0表示正则参数。 (6)根据求解得到的锚点标签If以及稀疏空谱关系矩阵Ζ,通过下式计算未标记 样本点的类别 其中,Zi表示Z的第i行,表示X ;与m个锚点的关系权值向量。 与现有技术相比,本专利技术有以下优点: 本专利技术通过选取少量锚点,构造样本点与锚点的稀疏空谱关系矩阵,克服了现有 基于图的半监督算法中构图时计算量和存储量过大的缺点,根据稀疏空谱关系矩阵计算得 到图拉普拉斯矩阵,从而计算得到锚点的标签,再根据样本点标签与锚点标签的关系,获得 样本点的标签,实现对数据的分类。【附图说明】 图1是本专利技术的流程图; 图2是本专利技术仿真使用的实验高光谱数据IndianPines及其真实标记图; 图3是每类标记10个样本时的分类结果比较图。【具体实施方式】 参照图1,对本专利技术做进一步的详细描述。 步骤1 :从高光谱数据集中得到训练数据集X和标记样本集Y。 la)在高光谱数据集中,随机选择40%的数据构成训练样本数据集X e Rdxn,剩余 的60%数据作为测试样本数据集T e Rdxt,其中,d表示训练集样本和测试集样本的维数, Rn表示N维实数空间,η表示训练集样本的总数,t表示测试集样本的总数;在本专利技术的实 施实例IndianPines数据集中,样本维数d为200,训练集样本的总数η为4146 ; Ib)在训练数据集X中,每类随机选取k个样本构成标记样本集Y e Rlx'其c为 类别数,I = kXc为标记样本总数,当样本Xi的标签y ;= j时,Y U= 1 ;在本专利技术的实施 实例 IndianPines 数据集中,c 为 16, k 取{3, 5, 8, 10}。 步骤2 :从训练数据集.中随机选取m个点作为锚点,表示为样本的标签f (Vk)可以通过下式得到: 其中,f (Vk)表示锚点的标签,Zlk表示锚点标签f(v k)对样本标签f (X1)的贡献比 重权值。在本专利技术的实施实例IndianPines数据集中,锚点个数m= 1000。 步骤3 :构造样本点与锚点的稀疏空谱关系矩阵 3a)对于每个样本点X1,根据该样本点与所有锚点的空间欧式距离d(Xl,v k),选择 出在空间距离上与X1最近的S个锚点。在本专利技术的实施实例IndianPines数据集中,令S =3〇当前第1页1 2 本文档来自技高网
...

【技术保护点】
一种基于锚点稀疏图的半监督高光谱分类方法,包括以下步骤:(1)从高光谱数据集中得到训练样本数据集X和标记样本类别矩阵Y;(2)从训练样本数据集中随机选取m个样本作为锚点,表示为锚点集其中,xi为训练样本数据集X中第i个训练样本,n为训练样本的个数,vk为锚点集V中第k个锚点,m为锚点的个数;对于训练样本数据集X中的任意样本xi,样本xi的标签f(xi)通过下式得到:f(xi)=Σk=1mZikf(vk)]]>其中,f(xi)∈R1×c和f(vk)∈R1×c分别表示样本xi的标签和锚点vk的标签,c表示类别数,Zik表示锚点标签f(vk)对样本标签f(xi)的贡献比重权值;(3)构造样本点与锚点的稀疏空谱关系矩阵3a)对于每个训练样本xi,计算该样本点与锚点集V中所有锚点的空间欧式距离其中,xij表示样本xi的第j个特征,vkj表示锚点vk的第j个特征,d表示样本xi和锚点vk的特征维数,根据计算结果,选择出在空间距离上与样本xi最近的s个锚点;3b)根据下式计算稀疏空谱关系矩阵Ζ中的元素:Zik=K(xi,vk)Σk′∈<i&gt;K(xi,vk′),∀k∈<i>]]>其中,选用高斯核函数计算样本xi和锚点vk的谱距离,σ为高斯核函数的参数,<i>表示距离样本xi最近的s个锚点的位置索引集合,<i>的取值范围是[1:m],Ζ∈Rn×m表示稀疏空谱关系矩阵,n和m分别表示训练样本的个数和锚点的个数,Zik表示稀疏空谱关系矩阵Ζ第i行第j列的元素;(4)根据下式计算图拉普拉斯矩阵:L~=ZTZ-(ZTZ)Λ-1(ZTZ)]]>其中,Ζ表示稀疏空谱关系矩阵,表示一个对角矩阵且表示图拉普拉斯矩阵;(5)根据下式计算锚点的标签:U*=(ZlTZl+γL~)-1ZlTY]]>其中,U*表示所有锚点的对应标签,U*=[f(v1),f(v2),…,f(vm)]T∈Rm×c,第k行表示第k个锚点的标签,c表示类别数,Y表示标记样本类别矩阵,Y∈Rl×c,l表示标记样本的总数,表示稀疏空谱关系矩阵Z中与l个标记样本相对应的行所构成的子矩阵,γ>0表示正则参数;(6)根据得到的锚点标签U*以及稀疏空谱关系矩阵Z,通过下式计算未标记样本的类别:y^i=argmaxj∈{1,...,c}Ziuj,(i=l+1,...,n)]]>其中,表示第i个未标记样本的类别标记,Zi表示稀疏空谱关系矩阵Z的第i行,uj表示锚点标签U*的第j列。...

【技术特征摘要】

【专利技术属性】
技术研发人员:杨淑媛焦李成李素婧刘红英马晶晶马文萍侯彪屈嵘冯志玺周红静刘志
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1