一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法技术

技术编号：10243460 阅读：186 留言：0更新日期：2014-07-23 17:00

本发明专利技术属于机器学习技术领域，可用于高光谱地物分类，具体公开了一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法，主要解决了高光谱地物分类中由于标记样本少，混合像元现象，地物识别正确率不高等问题。其步骤为：首先对样本进行预处理，并把样本分为训练样本与测试样本；其次计算出训练样本的图Laplacian矩阵；再次随机的产生网络的输入权值与隐藏层偏置，利用标记样本计算网络输出权值的初始值；然后交替计算每个未标记样本属于每类的概率与网络的输出权值矩阵，直到目标函数相邻两次的差值在容许误差内；最后利用优化的模型预测测试样本标签。本方法具有较强实用性与鲁棒性，实验结果说明该发明专利技术很适合高光谱地物分类。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法
本专利技术属于机器学习
，可用于高光谱地物分类。具体涉及一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法。
技术介绍
利用高光谱所提供的丰富地面信息实现地物分类是近几年很热的一个研究课题。随着高光谱成像技术的进步，获取海量数据已经变得相当容易，而且代价较低，但是这些样本点都是未标记的。而要获得标记样本则代价较高，需要专家标记和实地考察等。而且有限的标记样本在空间分布上很可能不均匀，因此仅仅利用这些标记样本很难构造准确的分类器。另外，随着成像技术的高度发展，虽然高光谱数据的光谱分辨率得到大大提高，但是其空间分辨率没有得到相应的提高，因此，在高光谱数据中，一个像素点很可能由不同物质组成，即其中存在着混合像元。这就导致了同物异谱和同谱异物现象的出现。所谓的同物异谱，指的是处于不同位置的同一种物质，其光谱响应曲线差别很大；而同谱异物指的是，不同种类的物质有可能具有相同的光谱响应曲线。因此对于确定某一像素属于哪一类而不属于其它类变得更困难。传统的解决高光谱地物分类的方法有监督学习，半监督学习与无监督学习。监督学习的分类策略是通过训练大量的标记样本来构造精确的分类器，因而在标记样本很有限的前提下使用这种方法分类时往往很难正确的得到遥感图像中的地物统计分布。无监督学习在学习的过程中是直接依靠数据本身的特性进行模型的构建，因此没有利用到标记样本中所含的先验信息，所以分类精度也不理想。而半监督学习方法在学习过程中融合了标记样本和未标记样本的信息，既利用了标记样本的先验信息，又利用海量未标记样本所含的...
一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法

【技术保护点】
一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法，其特征在于： (1)预处理训练样本用滑窗技术对所有样本进行预处理，窗口大小为5*5，随机选择40％的样本做为训练样本X，剩余的做测试样本Xt，其中X＝{x1,...,xl,xl+1...,xl+u}，x1,...,xl为标记样本，xl+1...,xl+u为未标记样本，N＝l+u为总的训练样本数，每个样本x＝[x1,x2,…,xd]，xi表示每个样本的第i个特征值，其中i＝1,2,…d，d代表样本的特征维数。Yl＝[y1,y2,...,yl]表示与训练样本中的标记样本x1,...,xl对应的标签，其中yi＝[yi1,yi2,...,yim]T表示与第i个标记样本对应的标签向量，m是类别数，T表示转置符号； (2)计算训练样本的图Laplacian矩阵； (3)计算网络的输出权值矩阵初始值； (4)计算样本属于每类的概率P；其中pk(xj),k＝1,...,m；j＝l+1,...,N表示第j个未标记样本xj属于第k类的概率，m为类别数目，N＝l+u为总的训练样本数，λ是正则参数，wjs代表像素xj与像素xs之间的相似度，f(x...

【技术特征摘要】
1.一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法，其特征在于：(1)预处理训练样本用滑窗技术对所有样本进行预处理，窗口大小为5*5，随机选择40％的样本做为训练样本X，剩余的做测试样本Xt，其中X＝{x1,...,xl,xl+1...,xl+u}，x1,...,xl为标记样本，xl+1...,xl+u为未标记样本，N＝l+u为总的训练样本数，每个样本x＝[x1,x2,…,xd]，xi表示每个样本的第i个特征值，其中i＝1,2,…d，d代表样本的特征维数；Yl＝[y1,y2,...,yl]表示与训练样本中的标记样本x1,...,xl对应的标签，其中yi＝[yi1,yi2,...,yim]T表示与第i个标记样本对应的标签向量，m是类别数，T表示转置符号；(2)计算训练样本的图Laplacian矩阵；(3)计算网络的输出权值矩阵初始值；(4)计算样本属于每类的概率P；其中pk(xj),k＝1,...,m；j＝l+1,...,N表示第j个未标记样本xj属于第k类的概率，m为类别数目，N＝l+u为总的训练样本数，λ是正则参数，wjs代表像素xj与像素xs之间的相似度，f(xj)表示样本xj的预测值，是第k类的标准标签，即该向量中第k个元素为1，其余的元素为0；(5)计算新的输出权值矩阵β；Hl是标记样本的隐藏层输出矩阵，Iu是u×u的单位阵，其中每个Sk是一个m×u的矩阵，该矩阵的k行全为1，其余行全为0；是未标记样本属于各个类别的概率值，是对角矩阵，对角元素为P按行排列时位置值的平方，Hu是未标记样本的隐藏层输出矩阵；(6)判断目标函数变化是否小于ε；目标函数为如果相邻目标函数的差值大于ε，则从步骤4开...

【专利技术属性】
技术研发人员：杨淑媛，焦李成，靳红红，刘红英，刘芳，马晶晶，张向荣，杨丽霞，侯彪，王爽，乔宇，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人