基于双支路卷积自编码器的高光谱图像分类方法技术

技术编号:26033265 阅读:19 留言:0更新日期:2020-10-23 21:11
本发明专利技术提出了一种基于双支路卷积自编码器的高光谱图像分类方法,主要解决现有技术中对高光谱数据特征提取不充分导致的分类精度偏低的问题,实现步骤为:获取高光谱数据的有监督训练样本集、有监督训练样本标签向量集、无监督训练样本集和测试样本集;构建构建双支路卷积自编码器;对双支路卷积自编码器进行迭代训练;获取高光谱图像分类结果。本发明专利技术采用的基于双支路卷积自编码器的分类方法,综合利用无监督学习和有监督学习两种方式对高光谱数据进行特征提取,充分考虑了高光谱图像的数据信息,有效提高了高光谱图像的分类精度,可用于农业监测、地质勘探、灾害环境评估等领域地物的区分和辨别。

【技术实现步骤摘要】
基于双支路卷积自编码器的高光谱图像分类方法
本专利技术属于图像处理
,涉及一种高光谱图像分类方法,具体涉及一种基于双支路卷积自编码器的高光谱图像分类方法,可用于对高光谱图像的地物进行分类。
技术介绍
光谱分辨率在101数量级范围内的光谱图像称为高光谱图像,其最显著的特点就是其丰富的光谱信息。相较于普通的二维图像,高光谱数据可表示为高光谱数据立方体,是三维数据结构。高光谱数据在保证空间分辨率的同时还包含着大量的光谱维度特征,因此可以提供空间域信息和光谱域信息,具有“图谱合一”的特点。基于这些特点,高光谱图像可以实现对地物精确的辨别与细节提取,对人类认识客观世界提供了有利条件。高光谱遥感在各方面都具有巨大应用潜力,如:环境变化监测、气象预测预报化、城市变迁分析化、林业生态监测化、精准农业、地质资源勘探以及现代化军事等。分类是高光谱遥感影像处理和应用的一项重要内容,利用影像信息对观测场景中的不同地物进行精准识别,从而将复杂现象简化为少量的一般类别,再进一步进行其它应用。高光谱图像的分类是多种遥感技术应用的重要一步,具有重要意义。衡量高光谱分类性能的指标主要有三个:整体正确率(OA)、平均正确率(AA)和卡方系数(KAPPA)。OA表示正确分类的本占所有样本的比例,值越大,说明分类效果越好。AA表示每一类分类精度的平均值,值越大,说明分类效果越好。Kappa表示混淆矩阵中不同的权值,值越大,说明分类效果越好。高光谱图像分类的关键在于对图像信息的挖掘,深度学习方法在提取数据特征和挖掘数据信息方面具有重要优势,因此,许多基于深度学习的分类方法被用于高光谱图像分类。深度学习方法主要分为有监督学习、无监督学习和半监督学习三大类。有监督学习方法往往能提取具有判别力的特征,无监督学习方法通常能够挖掘数据的结构特征,半监督学习能综合前二者的特点,并且半监督方法的设计方式更加灵活。目前代表性的深度学习方法有栈式自编码器(SAE)和卷积神经网络(CNN)等。SAE属于典型的无监督方法,通过最小化输入层和重构层之间的误差来学习输入数据的特征。SAE通常会与其他分类方法结合,比如支持矢量机(SVM)等,将SAE编码器学习到的特征输入SVM等分类器进行分类。CNN属于有监督的深度学习方法,通常包含特征提取网络和分类器两大部分。CNN通过模仿动物的视觉通路,在特征提取网络中逐层学习输入样本的特征,并将学到的特征送入全连接网络组成的分类器进行分类,得到输入样本的预测标签。有监督的深度学习方法需要大量的有标签样本来训练网络,而高光谱图像中的有标签样本往往数量十分有限,因此,无监督和半监督的深度学习方法在高光谱图像分类中具有独特的优势。例如:ShaohuiMei,JingyuJi,YunhaoGeng,ZhiZhang,XuLi和QianDu等人在2019年TGARS期刊发表的《UnsupervisedSpatial–SpectralFeatureLearningby3DConvolutionalAutoencoderforHyperspectralClassification》中,提出了一种基于单支路卷积自编码器和SVM的高光谱图像分类方法。该方法首先获取无监督训练集、有监督训练集和测试集,然后构建包括依次级联的编码器和解码器的卷积自编码器,以及一个多分类的SVM分类器;将无监督训练集的样本输入卷积自编码器中,通过编码-解码的方式对卷积自编码器进行多次无监督训练,得到训练好的卷积自编码器;将有监督训练集输入训练好的卷积自编码器的编码器中,通过逐层特征提取的方式得到编码器输出的编码特征,利用有监督训练集的特征图和对应的标签训练SVM分类器,得到训练好的SVM分类器;最终将测试样本集输入到训练好的编码器中进行逐层特征提取,得到测试样本集的编码特征,将测试样本集的编码特征输入到SVM中进行分类,得到测试集样本的预测标签。该方法虽然较为有效地利用无标签样本提取高光谱图像特征,但是其卷积自编码网络的训练过程是完全的无监督过程,难以保证得到的卷积自编码器学习到的数据信息对分类结果有积极作用。且单支路的卷积自编码器自身对有判别力特征的提取能力比较有限,因此模型的分类表现还有一定的提升空间。
技术实现思路
本专利技术的目的在于针对上述现有技术存在的不足,提出了一种基于双支路卷积自编码器高光谱图像分类方法,用于解决现有技术存在的分类精度较低的技术问题。为实现上述目的,本专利技术采取的技术方案包括如下步骤:(1)获取高光谱数据的有监督训练样本集Sn、有监督训练样本标签向量集无监督训练样本集Su和测试样本集St:(1a)输入一幅大小为W×H×B高光谱图像和对应的大小为W×H标签图,W和H表示高光谱图像和标签图的行和列像素点的个数,B代表高光谱图像的波段个数;(1b)以高光谱图像中与标签图每个值不为0的像素的位置相同的点为中心,分别划定大小为WS×WS×B的空间立方体,得到空间立方体集合S={S1,S2,…,Si,…,SN}和对应的整体样本标签集合Y={Y1,Y2,…,Yi,…,YN},其中WS>0且为整数,Si表示第i个样本,Yi表示第i个空间立方体标签值,N表示空间立方体的数目,N≥1000;(1c)对每个空间立方体Si进行归一化,并随机选取半数以上的归一化空间立方体作为测试样本集St,再从其余的归一化空间立方体中随机挑选半数以上作为无监督训练样本集Su,剩余的归一化空间立方体作为有监督训练样本集Sn;(1d)从Y中取出与Sn中所有样本对应的标签值组成集合并将第r个样本的标签值转化为C维的one-hot向量得到标签向量集合其中l表示Yn中标签的个数,l≥100,C表示样本的类别个数,C≥10;(2)构建双支路卷积自编码器A:构建包括并行排布的无监督卷积自编码器A1和有监督卷积网络A2的双支路卷积自编码器A,其中无监督卷积自编码器A1包括依次级联的编码器和解码器;有监督卷积网络支路A2包括依次级联的编码器、解码器、多个卷积-池化组合和分类器,编码器包括多个层叠的下采样卷积层,解码器包括多个层叠的逆卷积层,卷积-池化组合包括层叠的卷积层和池化层,分类器为全连接层,且A1中编码器的各下采样卷积层与A2中编码器对应位置的各下采样卷积层级联;(3)对双支路卷积自编码网络A进行迭代训练:(3a)设迭代次数为t,最大迭代次数为T,T≥100,当前双支路卷积自编码器、无监督卷积自编码器和有监督卷积网络分别为At、和并令t=0,At=A,(3b)将从Su中随机选取的k个无监督样本作为的输入,并采用编码—解码的方式对输入的无监督样本进行重构,得到k个重构图,然后采用均方误差函数,通过k个无监督样本和k个重构图,计算对当前k个无监督样本的损失值(3c)将从Sn中随机选取的k个有监督样本分别作为和的输入,并采用编码—解码的方式对输入到中的有监督样本进行重构,得到k个重构图和k×m个中编码器卷积层产生的特征图;同时对输入的有监督样本进行逐层特征提取并将中编码器卷积层产生的k×m个特征图逐层级联到中编码器对应本文档来自技高网
...

【技术保护点】
1.一种基于双支路卷积自编码器的高光谱图像分类方法,其特征在于,包括如下步骤:/n(1)获取高光谱数据的有监督训练样本集S

【技术特征摘要】
1.一种基于双支路卷积自编码器的高光谱图像分类方法,其特征在于,包括如下步骤:
(1)获取高光谱数据的有监督训练样本集Sn、有监督训练样本标签向量集Yn*、无监督训练样本集Su和测试样本集St:
(1a)输入一幅大小为W×H×B高光谱图像和对应的大小为W×H标签图,W和H表示高光谱图像和标签图的行和列像素点的个数,B代表高光谱图像的波段个数;
(1b)以高光谱图像中与标签图每个值不为0的像素的位置相同的点为中心,分别划定大小为WS×WS×B的空间立方体,得到空间立方体集合S={S1,S2,…,Si,…,SN}和对应的整体样本标签集合Y={Y1,Y2,…,Yi,…,YN},其中WS>0且为整数,Si表示第i个样本,Yi表示第i个空间立方体标签值,N表示空间立方体的数目,N≥1000;
(1c)对每个空间立方体Si进行归一化,并随机选取半数以上的归一化空间立方体作为测试样本集St,再从其余的归一化空间立方体中随机挑选半数以上作为无监督训练样本集Su,剩余的归一化空间立方体作为有监督训练样本集Sn;
(1d)从Y中取出与Sn中所有样本对应的标签值组成集合并将第r个样本的标签值转化为C维的one-hot向量得到标签向量集合其中l表示Yn中标签的个数,l≥100,C表示样本的类别个数,C≥10;
(2)构建双支路卷积自编码器A:
构建包括并行排布的无监督卷积自编码器A1和有监督卷积网络A2的双支路卷积自编码器A,其中无监督卷积自编码器A1包括依次级联的编码器和解码器;有监督卷积网络支路A2包括依次级联的编码器、解码器、多个卷积-池化组合和分类器,编码器包括多个层叠的下采样卷积层,解码器包括多个层叠的逆卷积层,卷积-池化组合包括层叠的卷积层和池化层,分类器为全连接层,且A1中编码器的各下采样卷积层与A2中编码器对应位置的各下采样卷积层级联;
(3)对双支路卷积自编码器A进行迭代训练:
(3a)设迭代次数为t,最大迭代次数为T,T≥100,当前双支路卷积自编码网络、无监督卷积自编码器和有监督卷积网络分别为At、和并令t=0,At=A,
(3b)将从Su中随机选取的k个无监督样本作为的输入,并采用编码—解码的方式对输入的无监督样本进行重构,得到k个重构图,然后采用均方误差函数,通过k个无监督样本和k个重构图,计算对当前k个无监督样本的损失值k≥10;
(3c)将从Sn中随机选取的k个有监督样本分别作为和的输入,并采用编码—解码的方式对输入到中的有监督样本进行重构,得到k个重构图和k×m个中编码器卷积层产生的特征图;同时对输入的有监督样本进行逐层特征提取并将中编码器卷积层产生的k×m个特征图逐层级联到中编码器对应卷积层产生的特征图上,前m-1层中每层级联后的特征图作为当前卷积层的输出和中下一卷积层的输入,第m层产生的级联后的特征图作为第一个逆卷积层的输入,通过后续多个逆卷积层和多个卷积-池化组合继续进行逐层特征提取,得到k个特征向量,利用全连接层对k个特征向量进行分类,得到k个无监督样本的预测标签向量,m表示中编码器内卷积层的个数,m≥1;
(3d)采用均方误差函数,并通过输入的k个无监督样本和得到的k个重构图,计算对输入的有监督样本的重构误差损失同时采用交叉熵损失函数,并通过k个无监督样本的预测标签向量和标签向量集中与k个无监督样本对应的k个真实标签向量,计算的对输入的k个有监督样本的交叉熵分类损失采用公式对和进行合并,得到At对输入的k个无监督样本和k个有监督样本的整体损失值Lt,α和β为调整最终损失值的两个常数,0<α≤1,0<β≤1;
(3e)采用反向传播算法...

【专利技术属性】
技术研发人员:冯婕叶湛伟梁宇平李杰焦李成张向荣尚荣华刘若辰
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1