一种基于正交指数局保投影的高光谱图像特征提取方法技术

技术编号:21914557 阅读:28 留言:0更新日期:2019-08-21 12:36
本发明专利技术公开了一种基于正交指数局保投影的高光谱图像特征提取方法。本发明专利技术如下:一、将被提取高光谱数据集分为拟定样本集和扩展样本集。二、根据训练样本集构建k近邻域图。三、分别构建类内权重矩阵集合和类间权重矩阵。四、构建目标函数。五、归一化相似度矩阵。六、计算两个归一化相似度矩阵的矩阵指数。七、确认投影矩阵。八、获取正交投影矩阵。九、训练SVM模型,并验证正交投影矩阵是否可靠。十、利用正交投影矩阵将具有高维度的扩展样本集映射到维数为d的低维空间中。将降维后的扩展样本集放入训练好的SVM模型中进行分类识别。本发明专利技术引入了矩阵指数来获取更丰富有效的样本信息,有效地解决了“小样本”问题。

A hyperspectral image feature extraction method based on orthogonal exponential locally preserved projection

【技术实现步骤摘要】
一种基于正交指数局保投影的高光谱图像特征提取方法
本专利技术属于高光谱遥感图像分类
,具体涉及一种基于正交指数局保投影的高光谱图像特征提取方法。
技术介绍
与多光谱相比,高光谱遥感图像具有“图谱合一”的特点,如实时性、地物信息丰富和覆盖面积广等,目前已经成功应用于监测环境、探寻矿物质、军事监视、海洋检测、精细农业等众多领域。如何准确地识别高光谱图像中的地物类别,目前研究者提出了很多方法,但仍有诸多问题需要完善,如数据冗余、标记的样本数量少、特征维数和光谱信息重复性高等。这些问题往往会造成训练得到的分类模型很不理想,并且容易产生“Hughes现象”。提高高光谱图像的分类精度,关键在于对其分类之前先进行特征提取。特征提取不仅能减少数据维度,去除大量冗余信息,而且能保留有效信息,从而提高分类精度。主成分分析(PCA)和局部保留投影(LPP)是最常用的特征提取方法,PCA用更少维数的向量来概括图像最重要的特征,从而取代原始特征维数。不同于PCA考虑的是数据的全局特征信息,LPP则考虑局部特征结构,它是一种流形学习方法,其本质上是通过保留局部结构来寻找原始数据的非线性特征。PCA和LPP都是无监督的降维方法,前者只考虑了全局结构,后者只考虑了局部结构。之后有研究者在LPP的基础上又提出了一种有监督的降维算法—判别局保投影法(DLPP),其充分利用了样本的全局标签信息和局部特征信息。但高光谱图像分类问题中依旧存在小样本问题。
技术实现思路
本专利技术的目的在于提供一种基于正交指数局保投影的高光谱图像特征提取方法。本专利技术的具体步骤如下:步骤一、将被提取高光谱数据集分为拟定样本集和扩展样本集。通过实地检测,确认拟定样本集中各样本点的类别。将拟定样本集分为训练样本集和测试样本集。训练样本集内共有C个类别。确定参数t的值为1。设定维度d。设定SVM模型中参数c和g的范围和步长。步骤二、根据训练样本集X=(x1,x2,...,xM)构建k近邻域图。步骤三、分别构建类内权重矩阵集合W和类间权重矩阵B。类内权重矩阵集合W的第i行第j列为Wij,其表达式如式(1)所示;类间权重矩阵B的第i行第j列为Bij,其表达式如式(2)所示。i=1,2,…,M,j=1,2,…,M。式(1)和(2)中,||xi-xj||2为(xi-xj)的二范数;为的二范数;为高光谱图像样本集X的第i个样本xi所在类别内所有样本的均值;为高光谱图像样本集X的第j个样本xj所在类别内所有样本的均值。步骤四、构建目标函数a如式(3)所示:式(3)中,为矩阵中所有元素的最小值。SL为第一相似度矩阵,其表达式为SL=XLXT;SH为第二相似度矩阵,其表达式为XT为训练样本集X的转置矩阵;为训练样本集的转置矩阵。L=D-W,H=E-B,两者均为拉普拉斯矩阵;D及E均为对角矩阵,矩阵D的第i行第i列的元素等于类内权重矩阵集合W内第i列所有元素之和;矩阵E的第i行第i列的元素等于类间权重矩阵B内第i列所有元素之和;为第s个类别各样本的均值,s=1,2,…,C;步骤五、归一化相似度矩阵SL和SH。步骤六、建立矩阵指数的表达式如(4)所示;式(4)中:exp(Z)称为矩阵Z的矩阵指数。根据式(4),分别求出SL和SH的矩阵指数exp(SL)和exp(SH)。步骤七、确认投影矩阵A。投影矩阵A=(a1,a2,...,ad)由矩阵exp(SH)-1exp(SL)按其特征值从大到小排序后的前d个值所对应的特征向量(a1,a2,...,ad)构成。步骤八、获取正交投影矩阵P=(p1,p2,...,pd)。正交投影矩阵P中,p1=a1,p2,p3,...,pd的表达式如式(5)所示。式(5)中,h=2,3,…,d。之后,进入步骤九。步骤九、训练SVM模型,并验证正交投影矩阵P是否可靠。9-1.利用正交投影矩阵P将具有高维度的训练样本集映射到维数为d的低维空间中。并用降维后的训练样本集训练SVM模型,通过5折交叉验证法及网格参数寻优法确定SVM模型的最佳参数c和g,得到训练好的SVM模型。9-2.利用正交投影矩阵P将具有高维度的测试样本集映射到维数为d的低维空间中。将降维后的测试样本集放入训练好的SVM模型中进行分类识别。9-3.通过对比“步骤9-2的分类结果”与“步骤一获取的测试样本集中各样本点的类别”,得到分类精度。若所得分类精度小于阈值,则修改参数t和维度d的值,并重复执行步骤二至八;否则,进入步骤十。步骤十、利用正交投影矩阵P将具有高维度的扩展样本集映射到维数为d的低维空间中。将降维后的扩展样本集放入训练好的SVM模型中进行分类识别。进一步地,步骤一中,c和g的初始范围均设定为2-6~28,步长设定为2。进一步地,步骤二中,k的值取5。本专利技术具有的有益效果是:本专利技术引入了矩阵指数来获取更丰富有效的样本信息,有效地解决了“小样本”问题;另外,本专利技术对投影矩阵采取正交化方法,优化了特征冗余造成的问题。本专利技术提高了高光谱图像的分类速度和总体分类精度,优化效果较为明显。附图说明图1为本专利技术验证时使用的IndianPines遥感图像数据伪彩色图;图2为本专利技术验证时使用的IndianPines遥感图像数据地物的真实类别标记图;图3a为本专利技术验证时使用的IndianPines遥感图像数据在抽取5%训练样本时所得的总体分类精度曲线图。图3b为本专利技术验证时使用的IndianPines遥感图像数据在抽取10%训练样本时所得的总体分类精度曲线图。图3c为本专利技术验证时使用的IndianPines遥感图像数据在抽取15%训练样本时所得的总体分类精度曲线图。图4a为用PCA方法对IndianPines遥感图像数据在取10%训练样本情况下所得的获得最高总体分类精度效果图,所得OA=67.20%;图4b为用LPP方法对IndianPines遥感图像数据在取10%训练样本情况下所得的获得最高总体分类精度效果图,所得OA=66.87%;图4c为用DLPP方法对IndianPines遥感图像数据在取10%训练样本情况下所得的获得最高总体分类精度效果图,所得OA=73.10%;图4d为用本专利技术对IndianPines遥感图像数据在取10%训练样本情况下所得的获得最高总体分类精度效果图,所得OA=76.73%;图5为通过本专利技术进行处理时IndianPines遥感图像数据总体分类精度曲线图。具体实施方式以下结合附图对本专利技术作进一步说明。如图1所示,一种基于正交指数局保投影的高光谱图像特征提取方法,具体步骤如下:本专利技术的基础思想为:获取高维空间有高光谱图像样本集X=(x1,x2,...,xM),其中(x1,x2,...,xM)∈RD。确定样本类别数为C。之后寻求一个正交投影矩阵P=(p1,p2,...,pd),进而将高维空间的高光谱图像样本集映射到一个低维特征空间,所对应的样本点表示为Y=(y1,y2,...,yM),其中(y1,y2,...,yM)∈Rd,(d<D),Y=PTX。具体提取方法步骤如下:步骤一、将被提取高光谱数据集分为拟定样本集和扩展样本集。通过实地检测,确认拟定样本集中各样本点的类别。将拟定样本集分为训练样本集和测试样本集。训练样本集内共有C个类别。确定参数t的值为1。设定维度d。设定SVM模型中参本文档来自技高网...

【技术保护点】
1.一种基于正交指数局保投影的高光谱图像特征提取方法,其特征在于:步骤一、将被提取高光谱数据集分为拟定样本集和扩展样本集;通过实地检测,确认拟定样本集中各样本点的类别;将拟定样本集分为训练样本集和测试样本集;训练样本集内共有C个类别;确定参数t的值为1;设定维度d;设定SVM模型中参数c和g的范围和步长;步骤二、根据训练样本集X=(x1,x2,…,xM)构建k近邻域图;步骤三、分别构建类内权重矩阵集合W和类间权重矩阵B;类内权重矩阵集合W的第i行第j列为Wij,其表达式如式(1)所示;类间权重矩阵B的第i行第j列为Bij,其表达式如式(2)所示;i=1,2,…,M,j=1,2,…,M;

【技术特征摘要】
1.一种基于正交指数局保投影的高光谱图像特征提取方法,其特征在于:步骤一、将被提取高光谱数据集分为拟定样本集和扩展样本集;通过实地检测,确认拟定样本集中各样本点的类别;将拟定样本集分为训练样本集和测试样本集;训练样本集内共有C个类别;确定参数t的值为1;设定维度d;设定SVM模型中参数c和g的范围和步长;步骤二、根据训练样本集X=(x1,x2,…,xM)构建k近邻域图;步骤三、分别构建类内权重矩阵集合W和类间权重矩阵B;类内权重矩阵集合W的第i行第j列为Wij,其表达式如式(1)所示;类间权重矩阵B的第i行第j列为Bij,其表达式如式(2)所示;i=1,2,…,M,j=1,2,…,M;式(1)和(2)中,||xi-xj||2为(xi-xj)的二范数;为的二范数;为高光谱图像样本集X的第i个样本xi所在类别内所有样本的均值;为高光谱图像样本集X的第j个样本xj所在类别内所有样本的均值;步骤四、构建目标函数a如式(3)所示:式(3)中,为矩阵中所有元素的最小值;SL为第一相似度矩阵,其表达式为SL=XLXT;SH为第二相似度矩阵,其表达式为XT为训练样本集X的转置矩阵;为训练样本集的转置矩阵;L=D-W,H=E-B,两者均为拉普拉斯矩阵;D及E均为对角矩阵,矩阵D的第i行第i列的元素等于类内权重矩阵集合W内第i列所有元素之和;矩阵E的第i行第i列的元素等于类间权重矩阵B内第i列所有元素之和;为第s个类别各样本的均值,s=1,2,…,C;步骤五、归一化相似度矩阵SL和SH;步骤六、建立矩阵指数的表达式如(4)所示;式(4)中:exp(Z)称为矩阵Z的矩阵指数;根据式(4),分别求出S...

【专利技术属性】
技术研发人员:祝磊胡奇峰王棋林
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1