一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法技术

技术编号:10243460 阅读:186 留言:0更新日期:2014-07-23 17:00
本发明专利技术属于机器学习技术领域,可用于高光谱地物分类,具体公开了一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法,主要解决了高光谱地物分类中由于标记样本少,混合像元现象,地物识别正确率不高等问题。其步骤为:首先对样本进行预处理,并把样本分为训练样本与测试样本;其次计算出训练样本的图Laplacian矩阵;再次随机的产生网络的输入权值与隐藏层偏置,利用标记样本计算网络输出权值的初始值;然后交替计算每个未标记样本属于每类的概率与网络的输出权值矩阵,直到目标函数相邻两次的差值在容许误差内;最后利用优化的模型预测测试样本标签。本方法具有较强实用性与鲁棒性,实验结果说明该发明专利技术很适合高光谱地物分类。

【技术实现步骤摘要】
一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法
本专利技术属于机器学习
,可用于高光谱地物分类。具体涉及一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法。
技术介绍
利用高光谱所提供的丰富地面信息实现地物分类是近几年很热的一个研究课题。随着高光谱成像技术的进步,获取海量数据已经变得相当容易,而且代价较低,但是这些样本点都是未标记的。而要获得标记样本则代价较高,需要专家标记和实地考察等。而且有限的标记样本在空间分布上很可能不均匀,因此仅仅利用这些标记样本很难构造准确的分类器。另外,随着成像技术的高度发展,虽然高光谱数据的光谱分辨率得到大大提高,但是其空间分辨率没有得到相应的提高,因此,在高光谱数据中,一个像素点很可能由不同物质组成,即其中存在着混合像元。这就导致了同物异谱和同谱异物现象的出现。所谓的同物异谱,指的是处于不同位置的同一种物质,其光谱响应曲线差别很大;而同谱异物指的是,不同种类的物质有可能具有相同的光谱响应曲线。因此对于确定某一像素属于哪一类而不属于其它类变得更困难。传统的解决高光谱地物分类的方法有监督学习,半监督学习与无监督学习。监督学习的分类策略是通过训练大量的标记样本来构造精确的分类器,因而在标记样本很有限的前提下使用这种方法分类时往往很难正确的得到遥感图像中的地物统计分布。无监督学习在学习的过程中是直接依靠数据本身的特性进行模型的构建,因此没有利用到标记样本中所含的先验信息,所以分类精度也不理想。而半监督学习方法在学习过程中融合了标记样本和未标记样本的信息,既利用了标记样本的先验信息,又利用海量未标记样本所含的信息来修正学习过程,即同时利用标记样本和未标记样本来构造分类器,因此是目前高光谱地物分类的主流技术。常见的高光谱地物分类方法有:直推式支持向量机(TransductiveSupportVectorMachine,TSVM)、基于图的半监督分类方法等。TSVM是支持向量机(SVM)在半监督分类中的推广,但是由于部分训练样本的类标记缺失,所以求解TSVM的最优解是一个NP难问题,实际运用中所得到的常常是它的近似最优解。和TSVM方法相比,基于图的半监督分类方法具有很好的数学解释性和良好的学习性能,并且能够避免收敛到局部最优,但是该类方法没有考虑到前面所提到的混合像元问题。极速学习(ExtremeLearningMachine,ELM)算法是最近几年提出的一种新颖的机器学习算法,是以单隐层前馈神经网络为模型的。由于其输入层权值和隐藏层偏值随机设置,输出层权值能够以解析的形式求出来,所以在大规模数据分类中表现出运行速度快,分类正确率高,泛化性能好等特点。该方法属于监督学习模式。如何利用极速学习机的优势,并把它很好的应用在当下的高光谱地物分类问题中,是一个很值得研究的内容。但是目前这方面的工作很少。
技术实现思路
本专利技术综合利用了上述已有技术的优点,并克服一些技术中存在的缺点,即利用了极速学习机学习速度快并把它扩展到半监督学习领域,利用了半监督学习的优势克服了标记样本少的缺点,并且利用修正聚类假设解决混合像元问题,提出一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法,同时提高分类的效率与正确率。为实现上述目的,本专利技术的技术方案是:提供一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法,具体步骤包括:(1)预处理训练样本;用滑窗技术对所有样本进行预处理,窗口大小为5*5,随机选择40%的样本做为训练样本X,剩余的做测试样本Xt,其中X={x1,...,xl,xl+1...,xl+u},x1,...,xl为标记样本,xl+1...,xl+u为未标记样本,N=l+u为总的训练样本数,每个样本x=[x1,x2,…,xd],xi表示每个样本的第i个特征值,其中i=1,2,…d,d代表样本的特征维数。Yl=[y1,y2,...,yl]表示与训练样本中的标记样本x1,...,xl对应的标签,其中yi=[yi1,yi2,...,yim]T表示与第i个标记样本对应的标签向量,m是类别数,T表示转置符号。(2)计算训练样本的图Laplacian矩阵;(3)计算网络的输出权值矩阵初始值;(4)计算样本属于每类的概率P;其中pk(xj),k=1,...,m;j=l+1,...,N表示第j个未标记样本xj属于第k类的概率,m为类别数目,N=l+u为总的训练样本数,λ是正则参数,wjs代表像素xj与像素xs之间的相似度,f(xj)表示样本xj的预测值,是第k类的标准标签,即该向量中第k个元素为1,其余的元素为0。(5)计算新的输出权值矩阵β;Hl是标记样本的隐藏层输出矩阵,Iu是u×u的单位阵,其中每个Sk是一个m×u的矩阵,该矩阵的k行全为1,其余行全为0;是未标记样本属于各个类别的概率值,是对角矩阵,对角元素为P按行排列时位置值的平方,Hu是未标记样本的隐藏层输出矩阵。(6)判断目标函数变化是否小于ε;目标函数为如果相邻目标函数的差值大于ε,则从步骤4开始重复执行步骤4到步骤6;如果小于ε,则往下执行步骤7;(7)预测测试样本标签;按照下式计算其中表示对于测试样本的网络输出矩阵,yi=[yi1,yi2,...,yim]T表示每一个样本的输出向量,表示优化后的输出权值矩阵,Ht表示测试样本的隐藏层输出矩阵。上述步骤(2)的图Laplacian矩阵的计算步骤具体如下:2.1)首先计算图的权重矩阵W:其中E代表边集,表示样本间的某种相似性;边e(i,j)的权重为w(e)=wij,表示顶点i与顶点j,即样本i与样本j之间的相似度,并且wij=wji,边的权重计算公式如下:其中NB(xi)是以xi为中心的一个r*r的方形窗中的样本集,dij代表样本xi与样本xj之间的欧氏距离;2.2)再计算出图Laplacian矩阵L:L=I-D-1/2WD-1/2其中I是单位矩阵,D是由所有结点的度数构成的对角阵,图中结点的度数定义为与该结点相连的所有边的权值之和,即上述步骤(3)的网络输出权值矩阵初始值的计算步骤具体如下:3.1)随机产生网络的输入权值wi,本文档来自技高网
...
一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法

【技术保护点】
一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法,其特征在于: (1)预处理训练样本 用滑窗技术对所有样本进行预处理,窗口大小为5*5,随机选择40%的样本做为训练样本X,剩余的做测试样本Xt,其中X={x1,...,xl,xl+1...,xl+u},x1,...,xl为标记样本,xl+1...,xl+u为未标记样本,N=l+u为总的训练样本数,每个样本x=[x1,x2,…,xd],xi表示每个样本的第i个特征值,其中i=1,2,…d,d代表样本的特征维数。Yl=[y1,y2,...,yl]表示与训练样本中的标记样本x1,...,xl对应的标签,其中yi=[yi1,yi2,...,yim]T表示与第i个标记样本对应的标签向量,m是类别数,T表示转置符号; (2)计算训练样本的图Laplacian矩阵; (3)计算网络的输出权值矩阵初始值; (4)计算样本属于每类的概率P; 其中pk(xj),k=1,...,m;j=l+1,...,N表示第j个未标记样本xj属于第k类的概率,m为类别数目,N=l+u为总的训练样本数,λ是正则参数,wjs代表像素xj与像素xs之间的相似度,f(xj)表示样本xj的预测值,是第k类的标准标签,即该向量中第k个元素为1,其余的元素为0;(5)计算新的输出权值矩阵β; Hl是标记样本的隐藏层输出矩阵,Iu是u×u的单位阵,其中每个Sk是一个m×u的矩阵,该矩阵的k行全 为1,其余行全为0;是未标记样本属于各个类别的概率值,是对角矩阵,对角元素为P按行排列时位置值的平方,Hu是未标记样本的隐藏层输出矩阵;(6)判断目标函数变化是否小于ε; 目标函数为 如果相邻目标函数的差值大于ε,则从步骤4开始重复执行步骤4到步骤6;如果小于ε,则往下执行步骤7; (7)预测测试样本标签; 按照下式计算 其中表示对于测试样本的网络输出矩阵,yi=[yi1,yi2,...,yim]T表示每一个样本的输出向量,表示优化后的输出权值矩阵,Ht表示测试样本的隐藏层输出矩阵。...

【技术特征摘要】
1.一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法,其特征在于:(1)预处理训练样本用滑窗技术对所有样本进行预处理,窗口大小为5*5,随机选择40%的样本做为训练样本X,剩余的做测试样本Xt,其中X={x1,...,xl,xl+1...,xl+u},x1,...,xl为标记样本,xl+1...,xl+u为未标记样本,N=l+u为总的训练样本数,每个样本x=[x1,x2,…,xd],xi表示每个样本的第i个特征值,其中i=1,2,…d,d代表样本的特征维数;Yl=[y1,y2,...,yl]表示与训练样本中的标记样本x1,...,xl对应的标签,其中yi=[yi1,yi2,...,yim]T表示与第i个标记样本对应的标签向量,m是类别数,T表示转置符号;(2)计算训练样本的图Laplacian矩阵;(3)计算网络的输出权值矩阵初始值;(4)计算样本属于每类的概率P;其中pk(xj),k=1,...,m;j=l+1,...,N表示第j个未标记样本xj属于第k类的概率,m为类别数目,N=l+u为总的训练样本数,λ是正则参数,wjs代表像素xj与像素xs之间的相似度,f(xj)表示样本xj的预测值,是第k类的标准标签,即该向量中第k个元素为1,其余的元素为0;(5)计算新的输出权值矩阵β;Hl是标记样本的隐藏层输出矩阵,Iu是u×u的单位阵,其中每个Sk是一个m×u的矩阵,该矩阵的k行全为1,其余行全为0;是未标记样本属于各个类别的概率值,是对角矩阵,对角元素为P按行排列时位置值的平方,Hu是未标记样本的隐藏层输出矩阵;(6)判断目标函数变化是否小于ε;目标函数为如果相邻目标函数的差值大于ε,则从步骤4开...

【专利技术属性】
技术研发人员:杨淑媛焦李成靳红红刘红英刘芳马晶晶张向荣杨丽霞侯彪王爽乔宇
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利