主动学习和邻域信息相结合的高光谱图像分类方法技术

技术编号:10724862 阅读:155 留言:0更新日期:2014-12-04 01:48
本发明专利技术公开了一种主动学习和邻域信息相结合的高光谱图像分类方法。针对高光谱图像中标签样本的建立需要实地考察及传统方法只考虑单一的光谱信息问题。其实现步骤是:(1)用初始已标记样本集Xl训练SVM分类器;(2)用SVM分类器从未标注样本集Xu中挑选信息量最大的q个样本由专家标注;(3)将专家标注后的q个样本放入Xl中;(4)用更新后Xl重新训练SVM分类器;(5)根据停止准则判断是否退出循环;(6)迭代完成后用训练好的SVM分类器对测试样本集进行测试;(7)利用Xl中每个样本的邻域信息对测试结果进行修正,得到最终分类结果。本发明专利技术实现了高光谱图像的空谱结合,相比其他同类方法,可以得到更好的分类结果。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种。针对高光谱图像中标签样本的建立需要实地考察及传统方法只考虑单一的光谱信息问题。其实现步骤是:(1)用初始已标记样本集Xl训练SVM分类器;(2)用SVM分类器从未标注样本集Xu中挑选信息量最大的q个样本由专家标注;(3)将专家标注后的q个样本放入Xl中;(4)用更新后Xl重新训练SVM分类器;(5)根据停止准则判断是否退出循环;(6)迭代完成后用训练好的SVM分类器对测试样本集进行测试;(7)利用Xl中每个样本的邻域信息对测试结果进行修正,得到最终分类结果。本专利技术实现了高光谱图像的空谱结合,相比其他同类方法,可以得到更好的分类结果。【专利说明】
本专利技术属于高光谱图像处理方法与应用
,涉及一种同时利用主动学习和邻域信息的高光谱图像分类方法,可用于地图制图、植被调查、海洋遥感、农业遥感、大气研究、环境监测等领域。
技术介绍
遥感是20世纪60年代发展起来的对地观测综合性技术,是指在不直接接触的情况下,对目标或自然现象远距离探测和感知的一种技术。遥感作为一门新兴的综合性探测技术科学,其发展还不到50年,而高光谱分辨率遥感就更年轻了,至今还不到30年的历史。但他们由于建立在现代物理学、电子计算机技术、数学方法和地学规律基础上,发展迅猛,已在地理学、地质学、生态学、环境科学、大气科学和海洋学等学科领域得到广泛的研究和应用。近年来,高光谱遥感正由航空遥感为主转向航空和航天遥感相结合的阶段,成为地图制图、植被调查、海洋遥感、农业遥感、大气研究、环境监测等领域的有效技术手段。 高光谱遥感是将成像技术和光谱技术相结合的多维信息获取技术,同时探测目标的二维几何空间与一维光谱信息,获取高分辨率的连续、窄波段的图像数据。一般认为,光谱分辨率在10_4数量级范围内的遥感称为多光谱遥感,光谱分辨率在10_2λ数量级范围内的遥感称为高光谱遥感,光谱分辨率在ιο_3λ数量级范围内的遥感称为超光谱遥感。高光谱遥感数据的光谱分辨率高达ιο_2λ数量级,在可见光到短波红外波段范围内光谱分辨率为纳米(nm)级,光谱波段数多达数十个甚至数百个以上,各光谱波段之间通常是连续的,因此高光谱遥感通常又被称为成像光谱遥感。 高光谱图像分类是基于图像像元的光谱与空间特性,对每个像元所代表的不同类别地物进行类别属性的确定和标注。经过科技工作者多年的研究和探索,高光谱图像分类技术取得了巨大的发展,形成了一系列针对高光谱图像特点的地物分类算法。归纳起来,这些算法主要从两个方面进行考虑:分别是基于光谱特征空间的分类方法和基于数据统计特性的分类方法。 基于光谱特征空间的高光谱图像分类,是一类基于图像光谱特征的分类方法,该方法建立在对高光谱图像光谱特征提取和变换的基础上,利用基于地物物理光学性质的光谱曲线来进行地物识别。 基于统计特征的分类策略,通常可分为无监督和监督分类两种方法,无监督分类方法不需要先验知识,可以直接对原始高光谱遥感图像进行分类,虽然分类精度往往有所欠缺,但容易实现,也是常用的分类方法之一,例如K均值聚类。监督分类策略需要一定的先验知识,首先要经过学习、训练得到分类器,并利用得到的分类器对未标签的样本进行分类。而半监督分类在学习过程中融合了标签样本和未标签样本的信息,利用海量未标签样本所含信息来改进分类器,提高分类精度。 现有的高光谱图像分类方法有K均值聚类、决策树方法、Naive Bayesian学习方法、人工神经网络、K近邻法(K nearest neighbor, KNN)、支持向量机(Support VectorMachines, SVM)等等。在机器学习领域,目如基于结构风险最小化原理的支持向量机在理论研究和算法实现上都取得了很大进展,与传统分类器相比较取得了较好的分类效果,成为解决“维数灾难”和“过学习”问题的有力手段。相对于传统地物分类方法,SVM于高光谱分类具有比较好的效果,因为支持向量机应用于分类时具有适用于高维特征空间、小样本统计学习等特点,这些特点降低了高光谱图像分类中Hughes现象的影响,目前SVM在高光谱分类中已经有了很多成功的应用。 然而,传统的SVM方法的不足在于,训练分类器时需要大量已经标注好的样本参与训练,但是,标注样本并不是越多越好,过多的标注样本会产生冗余,增加计算的工作量;而且,大量的已标注样本中并不是每个样本都是对分类器的训练有用的。因此,在进行样本标注时,除了要保证一定的数量外,还应保证标注样本的质量,这样不但能提高分类器的分类性能,而且能减少人工标注的工作量。
技术实现思路
本专利技术的目的在于针对上述已有技术的不足,提出一种,以在训练样本数量很少的情况下,提高分类效果。 为实现上述目的,本专利技术的实现步骤包括如下: (I)把大小为mXn的待分类高光谱图像中的所有像元作为总样本集X,在总样本集X中随机选择I %的样本进行专家标记,作为已标记样本集X1,将其余样本集Xu作为未标记样本集,并用已标记样本集X1对初始的SVM分类器进行训练,设置最大迭代次数T,T>0,并开始第一次迭代; (2)用训练后的SVM分类器根据主动学习的采样策略从未标记样本集Xu中挑选出信息含量最大的q个样本,由专家进行标记,其中q〈Xu ; (3)将专家标记后的q个样本放入已标记样本集X1中,并将该q个样本从未标记样本集Xu中移除,得到更新后的已标记样本集X1,和未标记样本集xu’,令已标记样本集X1=X1,,未标记样本集Xu = xu’ ; (4)用已标记样本集X1重新对SVM分类器进行训练,完成一次迭代; (5)根据停止准则判断是否退出迭代:如果达到最大迭代次数,则退出迭代,继续下一步骤,否则返回步骤2,进行下一次迭代,并使迭代次数加一; (6)利用步骤⑷中训练好的SVM分类器对未标记样本集Xu进行测试得到初始测试结果; (7)应用已标记样本集X1中每个样本的邻域信息对步骤(6)中的测试结果进行修正,得到最终分类结果: (7a)对于已标记样本集X1中的一个样本(Xli,yii),判断与其相邻的四个样本Xl1- n) Xl1-1,Xli+1,Xli+n疋否在未丨不记样本集Xu中:如果在,分力U求样本Χχ? - η,Χχ? -1,Xli+1,Xli+n与Xli的光谱相关系数Sli _n,Sl1-1; Sli+1, Sli+n ;如果不在,则初始测试结果中样本Xl1-n, Xl1-1, xli+1,Xli+I^应的标签不变,其中,Xli为样本的特征向量,Yli为样本的标签,I1C1,η为待分类高光谱图像的列数; (7b)将光谱相关系数Sli _n,Sl1.!, Sli+1, Sli+n分别与设定的阈值ω进行大小比较,根据比较的结果对初始测试结果中对应样本的标签进行修正,其中0.95〈ω〈1 ; (7c)重复步骤(7a)和(7b)对已标记样本集X1中所有的样本进行修正,得到的修正结果则为最终的分类结果。 本专利技术与现有技术相比具有以下优点: 1.本专利技术采用基于支持向量机的主动学习方法来选择训练样本集,主动学习在学习过程中选择最有利于分类器性能的样本来进一步训练分类器,与传统的有监督分类方法相比,它最大的优点是当仔本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201410453096.html" title="主动学习和邻域信息相结合的高光谱图像分类方法原文来自X技术">主动学习和邻域信息相结合的高光谱图像分类方法</a>

【技术保护点】
一种主动学习和邻域信息相结合的高光谱图像分类方法,包括如下步骤:(1)把大小为m×n的待分类高光谱图像中的所有像元作为总样本集X,在总样本集X中随机选择1%的样本进行专家标记,作为已标记样本集Xl,将其余样本集Xu作为未标记样本集,并用已标记样本集Xl对初始的SVM分类器进行训练,设置最大迭代次数T,T>0,并开始第一次迭代;(2)用训练后的SVM分类器根据主动学习的采样策略从未标记样本集Xu中挑选出信息含量最大的q个样本,由专家进行标记,其中q<Xu;(3)将专家标记后的q个样本放入已标记样本集Xl中,并将该q个样本从未标记样本集Xu中移除,得到更新后的已标记样本集Xl’和未标记样本集Xu’,令已标记样本集Xl=Xl’,未标记样本集Xu=Xu’;(4)用已标记样本集Xl重新对SVM分类器进行训练,完成一次迭代;(5)根据停止准则判断是否退出迭代:如果达到最大迭代次数,则退出迭代,继续下一步骤,否则返回步骤2,进行下一次迭代,并使迭代次数加一;(6)利用步骤(4)中训练好的SVM分类器对未标记样本集Xu进行测试得到初始测试结果;(7)应用已标记样本集Xl中每个样本的邻域信息对步骤(6)中的测试结果进行修正,得到最终分类结果:(7a)对于已标记样本集Xl中的一个样本(xli,yli),判断与其相邻的四个样本xli‑n,xli‑1,xli+1,xli+n是否在未标记样本集Xu中:如果在,分别求样本xli‑n,xli‑1,xli+1,xli+n与xli的光谱相关系数Sli‑n,Sli‑1,Sli+1,Sli+n;如果不在,则初始测试结果中样本xli‑n,xli‑1,xli+1,xli+n对应的标签不变,其中,xli为样本的特征向量,yli为样本的标签,li<Xl,n为待分类高光谱图像的列数;(7b)将光谱相关系数Sli‑n,Sli‑1,Sli+1,Sli+n分别与设定的阈值ω进行大小比较,根据比较的结果对初始测试结果中对应样本的标签进行修正,其中0.95<ω<1;(7c)重复步骤(7a)和(7b)对已标记样本集Xl中所有的样本进行修正,得到的修正结果则为最终的分类结果。...

【技术特征摘要】

【专利技术属性】
技术研发人员:慕彩红焦李成王依萍刘红英熊涛马文萍马晶晶田小林云智强
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1