基于高斯过程分类器协同训练算法的高光谱图像分类方法技术

技术编号:6601576 阅读:524 留言:0更新日期:2012-04-11 18:40
本发明专利技术提出了一种基于高斯过程分类器协同训练算法的高光谱图像分类方法,它属于图像处理技术领域,主要解决现有技术在高光谱数据有标记样本个数较少时,分类精度不够高的问题。其实现过程为:首先将样本的特征向量随机划分成个两个子特征向量,将这两个子特征向量作为样本的两个视角;然后利用部分无标记样本和已有有标记样本的这两个视角进行高斯过程分类器协同训练,得到两个最终高斯过程分类器;利用这两个最终高斯过程分类器对所有无标记样本的两个视角分别进行标记,并把概率较大的类别标记作为该无标记样本的分类结果。本发明专利技术应用于高光谱图像分类,在有标记样本个数少的情况下,能显著提高分类正确率。

【技术实现步骤摘要】

本专利技术属于图像处理
,涉及高光谱图像的分类,可用于遥感图像理解与解译。
技术介绍
高光谱遥感技术出现于20世纪80年代,它将反映目标辐射属性的光谱信息与反映目标空间和几何关系的图像信息有机地结合在一起,开创了成像光谱的概念。高光谱影像具有丰富的地物光谱信息,较之全色、多光谱影像在地物分类识别方面具有巨大的优势。 故而成为地图制图,植被调查,海洋遥感,军事情报获取等领域一种重要的技术手段。高光谱数据的分类实质上就是将高光谱图像的某一类特征在特征空间采用一定的分类方法将图像分为若干个不同属性的类,这种特征可以是光谱,亮度,空间结构,光谱形状等,最简单最直接的分类是采用各谱段的亮度特征进行基于单相元的分类。目前应用于高光谱图像分类领域的分类方法包括无监督、有监督和半监督学习算法。其中常用的无监督算法,包括K均值聚类,谱聚类等。由于无监督分类算法完全不利用样本的标记信息,在特征维数高且地物类别数多的高光谱图像分类应用中很难得到较好的结果。常用的有监督算法,包括k近邻、决策树、支持向量机SVM,高斯过程分类器GPC等。 其中支持向量机SVM是由Vapnik等提出的一种机器学习算法,拥有很好的泛化和推广能力,但是其在应用过程中需要手动调节参数,且参数调节范围无规律遵循,这就导致分类器训练时间较长。高斯过程分类器,是一种基于高斯过程的核分类器,其目标在于对给定数据点预测其类别标记的后验概率。由于其精确计算难以实现,经常采用基于蒙特卡洛采样的方法或者近似推导方法来实现,最常用的近似推导方法是拉普拉斯和期望传播算法。高斯过程分类器在给出类别标记预测的同时还可以得到隶属于此类别的概率,同时在参数调节方面它可以实现自动相关决策,而不需要手动调节参数。然而,高光谱地物分类的难点之一就是有标记数据非常少,在这种情况下上述有监督的分类器由于可利用的标记信息过少而很难达到满意的分类精度。半监督学习算法可以通过利用部分无标记样本的信息来弥补有标记样本过少这一问题。现有的半监督学习方法,包括自训练方法,基于图的方法,协同训练方法等。其中自训练方法,首先用有标记数据训练分类器,然后用训练好的分类器为无标记数据进行标记,再选取其中置信度最高的若干个无标记数据放入到标记数据训练集里,接着用新的训练集对前面的分类器再次训练,并不断重复此过程,直至达到某停止条件。这种自训练方法泛化性能较差,应用于类别数目较多的数据常常达不到预期效果。基于图的方法,其基本内容是构建一个图用来表征所有样本之间的相似性,已标记样本点的类别信息可以在带权图上传递,传递的结果可以为未标记样本提供有效的分类信息。基于图的方法在泛化性能上较之自训练算法有所提高。但是这种基于图的方法大多数在实现过程中计算量和存储量都很大,因而在处理大量高维的高光谱数据时对计算机内存要求较高,否则会造成内存溢出而无法处理。协同训练算法,首先假设数据集有两个不同视角,然后在两个视角上利用有标记样本分别训练出一个分类器,进而,在协同训练过程中,每个分类器从未标记样本中挑选出若干标记置信度较高的样本,并把这些样本连同其标记加入另一个分类器的有标记训练集中,以便对方利用这些新标记的样本进行更新。协同训练过程不断迭代进行,直到达到某个停止条件。目前,在协同训练算法中使用最广泛的分类器是朴素贝叶斯分类器。这种分类器虽然可操作性比较强,但其仅在数据训练集规模较大时处理得比较精确,当数据训练集较小时,分类正确率就难以保证。
技术实现思路
本专利技术的目的在于克服上述已有技术的不足,提出一种,以在有标记训练样本集规模较小的情况下,进一步提高分类精度。实现本专利技术目的的技术关键是将高斯过程分类器引入到协同训练算法中,利用此高斯过程分类器协同训练算法进行高光谱图像分类,其实现过程包括如下(1)输入高光谱图像,该高光谱图像包含无标记样本和m类有标记样本,其中, m ^ 2,每一个样本由一个特征向量表示,从所有无标记样本中选取ζ个无标记样本构成协同训练使用的无标记样本集合U ;(2)将每一个样本的特征向量随机划分成两个子特征向量,将这两个子特征向量分别作为协同训练的两个视角,记为第一视角和第二视角;(3)利用第一视角和第二视角进行高斯过程分类器协同训练3. 1)从协同训练使用的无标记样本集合U中随机选出η个无标记样本,构成待标记样本集合Vi,余下的(ζ-η)个无标记样本构成侯选样本集合Hi,并将所有m类有标记样本组成有标记样本集合Li,其中,i表示迭代次数,初始化为i = 1 ;3. 2)利用上述有标记样本集合Li中每个样本的第一视角,采用拉普拉斯近似推导方法构造高斯过程分类器Mi ;3. 3)利用高斯过程分类器Mi对待标记样本集合Vi中待标记样本的第一视角进行标记,得到所有待标记样本的类别标记及其隶属于此类别的概率,并从该类别标记中选出m 个隶属于每一类概率最大的类别标记,将该每一类概率最大的类别标记连同其相对应的m 个待标记样本,加入到有标记样本集合Li中,得到更新的有标记样本集合Li',并将上述m 个待标记样本从待标记样本集合\中删除,得到更新的待标记样本集合\ ‘;3.4)利用更新的有标记样本集合Li'中每个样本的第二视角,采用拉普拉斯近似推导方法构造高斯过程分类器h2i ;3. 5)利用高斯过程分类器Mi对更新的待标记样本集合Vi'中待标记样本的第二视角进行标记,得到所有待标记样本的类别标记及其隶属于此类别的概率,从该类别标记中选出m个隶属于每一类概率最大的标记,将该每一类概率最大的类别标记连同其相对应的m个待标记样本,加入到上述更新的有标记样本集合Li ‘中,得到有标记样本集合Li+1,并将上述m个待标记样本从更新的待标记样本集合Vi'中删除,得到二次更新的待标记样本集合Vi;3. 6)从候选样本集合Hi中选取P个样本,加入到二次更新的待标记样本集合Vi 中,得到待标记样本集合Vi+1,并将这ρ个样本从候选样本集合Hi中删除,得到候选样本集合Hi+1,其中,ρ彡2m;3. 7)更新变量 i = i+1 ;3.8)判断侯选样本集合Hi是否为空集,如果为空集则结束迭代,将此时的两个高斯过程分类器分别记为最终高斯过程分类器hlk,h2k,其中,k为迭代结束时i的值,然后执行步骤(4),如果Hi不为空集转至步骤3. 2);(4)利用最终高斯过程分类器hlk和h2k,对高光谱图像中每个无标记样本的第一视角和第二视角分别进行标记,得到其类别标记及其隶属于此类别的概率,并把隶属于此类别概率较大的类别标记作为该无标记样本的最终分类结果。本专利技术与现有的技术相比具有以下优点1.分类精确度高本专利技术通过将高斯过程分类器引入到协同训练算法中,在有标记样本规模较小的情况下,提高了对待标记样本标记的准确度,进而提高了协同训练算法的性能,应用于高光谱图像分类时所需有标记样本个数少,分类精确度高。2.对图像的大小限制小本专利技术使用的高斯过程分类器协同训练算法,模型简单,存储量小,可用来处理大规模的高光谱图像而不会存在内存不足的问题。附图说明图1是本专利技术的总流程图;图2是本专利技术进行高斯过程分类器协同训练的子流程图;图3是本专利技术仿真使用的Botswana高光谱图像;图4是本专利技术与现有两种算法应用于高光谱图像分类时的性能比较图。具体实施本文档来自技高网
...

【技术保护点】
1.一种基于高斯过程分类器协同训练算法的高光谱图像分类方法,包括:(1)输入高光谱图像,该高光谱图像包含无标记样本和m类有标记样本,其中,m≥2,每一个样本由一个特征向量表示,从所有无标记样本中选取z个无标记样本构成协同训练使用的无标记样本集合U;(2)将每一个样本的特征向量随机划分成两个子特征向量,将这两个子特征向量分别作为样本的两个视角,记为第一视角和第二视角;(3)利用第一视角和第二视角进行高斯过程分类器协同训练:3.1)从协同训练使用的无标记样本集合U中随机选出n个无标记样本,构成待标记样本集合Vi,余下的(z-n)个无标记样本构成侯选样本集合Hi,并将所有m类有标记样本组成有标记样本集合Li,其中,i表示迭代次数,初始化为i=1;3.2)利用上述有标记样本集合Li中每个样本的第一视角,采用拉普拉斯近似推导方法构造高斯过程分类器h1i;3.3)利用高斯过程分类器h1i对待标记样本集合Vi中待标记样本的第一视角进行标记,得到所有待标记样本的类别标记及其隶属于此类别的概率,并从该类别标记中选出m个隶属于每一类概率最大的类别标记,将该每一类概率最大的类别标记连同其相对应的m个待标记样本,加入到有标记样本集合Li中,得到更新的有标记样本集合Li′,并将上述m个待标记样本从待标记样本集合Vi中删除,得到更新的待标记样本集合Vi′;3.4)利用更新的有标记样本集合Li′中每个样本的第二视角,采用拉普拉斯近似推导方法构造高斯过程分类器h2i;3.5)利用高斯过程分类器h2i对更新的待标记样本集合Vi′中待标记样本的第二视角进行标记,得到所有待标记样本的类别标记及其隶属于此类别的概率,从该类别标记中选出m个隶属于每一类概率最大的标记,将该每一类概率最大的类别标记连同其相对应的m个待标记样本,加入到上述更新的有标记样本集合Li′中,得到有标记样本集合Li+1,并将上述m个待标记样本从更新的待标记样本集合Vi′中删除,得到二次更新的待标记样本集合Vi″;3.6)从候选样本集合Hi中选取p个样本,加入到二次更新的待标记样本集合Vi″中,得到待标记样本集合Vi+1,并将这p个样本从候选样本集合Hi中删除,得到候选样本集合Hi+1,其中,p≥2m;3.7)更新变量i=i+1;3.8)判断侯选样本集合Hi是否为空集,如果为空集则结束迭代,将此时的两个高斯过程分类器分别记为最终高斯过程分类器h1d,h2d,其中,d为迭代结束时i的值,然后执行步骤(4),如果Hi不为空集转至步骤3.2);(4)利用最终高斯过程分类器h1d和h2d,对高光谱图像中每个无标记样本的第一视角和第二视角分别进行标记,得到其类别标记及其隶属于此类别的概率,并把隶属于此类别概率较大的类别标记作为该无标记样本的最终分类结果。...

【技术特征摘要】
1.一种基于高斯过程分类器协同训练算法的高光谱图像分类方法,包括(1)输入高光谱图像,该高光谱图像包含无标记样本和m类有标记样本,其中,2, 每一个样本由一个特征向量表示,从所有无标记样本中选取ζ个无标记样本构成协同训练使用的无标记样本集合U;(2)将每一个样本的特征向量随机划分成两个子特征向量,将这两个子特征向量分别作为样本的两个视角,记为第一视角和第二视角;(3)利用第一视角和第二视角进行高斯过程分类器协同训练3. 1)从协同训练使用的无标记样本集合U中随机选出η个无标记样本,构成待标记样本集合Vi,余下的(ζ-η)个无标记样本构成侯选样本集合Hi,并将所有m类有标记样本组成有标记样本集合Li,其中,i表示迭代次数,初始化为i = 1 ;3. 2)利用上述有标记样本集合Li中每个样本的第一视角,采用拉普拉斯近似推导方法构造高斯过程分类器hli;3. 3)利用高斯过程分类器Mi对待标记样本集合Vi中待标记样本的第一视角进行标记,得到所有待标记样本的类别标记及其隶属于此类别的概率,并从该类别标记中选出m 个隶属于每一类概率最大的类别标记,将该每一类概率最大的类别标记连同其相对应的m 个待标记样本,加入到有标记样本集合Li中,得到更新的有标记样本集合Li',并将上述m 个待标记样本从待标记样本集合\中删除,得到更新的待标记样本集合\ ‘;3.4)利用更新的有标记样本集合Li'中每个样本的第二视角,采用拉普拉斯近似推导方法构造高斯过程分类器h2i ;3.5)利用高斯过程分类器Mi对更新的待标记样本集合Vi'中待标记样本的第二视角进行标记,得到所有待标记样本的类别标记及其隶属于此类别的概率,从该类别标记中选出m个隶属于每一类概率最大的标记,将该每一类概率最大的类别标记连同其相对应的 m个待标记样本...

【专利技术属性】
技术研发人员:张向荣焦李成王文娜侯彪吴家骥公茂果刘若辰马文萍
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:87

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1