System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于冗余消除的自监督高光谱图像分类方法技术_技高网
当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于冗余消除的自监督高光谱图像分类方法技术

技术编号:40972008 阅读:2 留言:0更新日期:2024-04-18 21:21
本发明专利技术提供了一种基于冗余消除的自监督高光谱图像分类方法。首先采集高光谱数据,进行预处理,得到样本补丁,再进行数据增强得到样本对;将样本对按批次输入到双分支主干网络中,经过编码器和映射器得到高层特征,对分支间特征计算冗余消除损失函数,反向传递更新网络权重,达到迭代次数后保存编码器的输出作为提取到的特征。将特征划分为训练集和测试集,训练SVM分类器实现分类。本发明专利技术设计了适合高光谱数据的自监督学习主干网络和消除冗余的损失函数,鼓励模型更好地关注关键信息,减少冗余信息的干扰,提取更有代表性的特征,有效实现了对分类效果的提高。

【技术实现步骤摘要】

本专利技术属于高光谱图像分类领域,更具体地,涉及一种基于冗余消除的自监督高光谱图像分类方法


技术介绍

1、高光谱图像收集从可见光到近红外波长范围的电磁波谱,一般具有数百甚至上千个波段。高光谱图像中的每个像素可以视作一个向量,对应于同一块区域在不同特定波长下的光谱反射率或吸收率,可以称为光谱。高光谱图像蕴含丰富的光谱信息,能够区分光谱的细微差异。

2、高光谱图像分类是将像素点根据其光谱特征划分到不同的类别中,通常涉及特征提取、特征选择和分类器构建等步骤,旨在从高维的数据中提取出有用的信息,并实现准确的分类结果。高光谱图像分类可以应用于环境监测、农业、遥感等领域。除了光谱信息外,高光谱图像也含有空间信息,即邻近像素之间通常具有关联性,能为目标像素的分类提供参考,现有的很多研究会将空间信息也作为光谱分类的重要依据。

3、较早的高光谱分类算法往往不会区分特征提取和训练分类器步骤,包括最小距离分类器(minimum distance classifier)、最大似然分类器(maximum likelihoodclassifier),支持向量机(support vector machine,svm),随机森林(random forest)等。由于计算资源的限制,他们的流程简单,复杂度低,提取到的特征会丢失较多信息,难以达到较高的精度。随着计算机技术进步和高光谱数据质量的提高,学者们开始意识到将特征提取和分类器训练分开的重要性。通过明确区分这两个步骤,可以更好地利用大规模数据和更复杂的算法,提取更具有区分度和代表性的特征,然后训练分类器来优化分类性能。

4、基于传统机器学习的特征提取方法包括线性判别分析(linear discriminantanalysis,lda)、主成分分析(principal component analysis,pca)、独立成分分析(independent component analysis,ica)等,他们能够有效降低数据维度,保留高光谱图像的关键信息,但这些简单的线性方法没有充分利用信息,较难在复杂的深层数据中得到好的效果。

5、随着深度学习方法的发展,基于深度学习的高光谱图像特征提取展现了强烈的竞争力。基于深度学习的特征提取方法可以根据是否需要标签分为有监督方法和无监督方法。无监督深度学习方法不需要借助标签,弥补了高光谱领域标签制作不易的不足。被使用较多的无监督方法包括生成对抗网络(generative adversarial networks,gan)、自动编码器(autoencoder,ae)、深度置信网络(deep belief network,dbn)等,以及他们的衍生方法。

6、自监督学习也属于无监督学习,自监督学习的目标是通过最大化预测或恢复的准确性来优化模型的参数,以便学习到数据的高级表示。其优势是无需昂贵的人工标注标签,而是利用数据本身提供的信息进行学习,这能一定程度上弥补高光谱数据标签制作成本高带来的样本稀少问题。对比学习是常见的自监督学习,通过比较两个或者多个样本的特征表示,使得相似的样本在特征空间中更接近,不相似的样本则更远离,可以学习到更具区分性的特征表示。许多学者提出了一系列有效的对比学习算法和框架,如moco、simclr、byol、simsiam,它们或者是通过负样本对、或者是通过不对称结构和不同步的参数更新,来防止网络学习到的特征是常数,即避免坍缩。jeffrey barlow等人提出了barlow twins算法,通过最大化同类特征之间的相关性,并消除不同特征之间的相关性,鼓励网络学习到互补的特征表示,与其他对比学习方法相比,结构更加简洁,不需要依靠预测头、梯度停止和缓慢移动平均,具有更好的解释性和鲁棒性。


技术实现思路

1、针对高光谱图像存在大量冗余信息、现有深度学习方法依赖于标签等问题,本专利技术提出一种基于冗余消除的自监督高光谱图像分类方法来解决这些问题。

2、本专利技术提出的基于冗余消除的自监督高光谱图像分类方法,其包括以下步骤:

3、步骤1,采集高光谱数据;

4、步骤2,将高光谱图像用主成分分析降维,再用滑窗逐像素切割成样本补丁,对每个样本补丁进行两次独立的数据增强得到生成两个视图作为样本对;

5、步骤3,将样本对按批次输入到自监督模型双分支主干网络的两个分支中,分别经过编码器和映射器,得到高层特征,对分支间特征计算包含不变项和冗余消除项的损失函数,反向传递更新网络权重,达到迭代次数后保存编码器的输出作为提取到的特征;

6、步骤4,将步骤3得到的特征进行部分作标注并作为训练集训练svm分类器;

7、步骤5,对于待分类的高光谱图像,顺次通过步骤2进行预处理和步骤3提取得到特征,将特征输入给经步骤4训练得到的svm分类器进行分类,得到分类结果。

8、所述双分支主干网络包括结构相同的两个分支用于分别提取两张输入视图的特征,其中,每个分支包括顺次连接的三个三维卷积层、一个二维卷积层和三个全连接层;层与层之间都用批量标准化和relu激活函数连接,其中全连接层先对特征进行压缩,再恢复特征,并将特征压缩后的嵌入作为输出特征,其中各分支中,最后一层全连接层作为映射器,前面的所有层作为编码器。

9、进一步的,三个三维卷积层随着层数递进,卷积核尺寸减小,数量增多;三个全连接层随着层数递进,尺寸减小。

10、进一步的,根据两个分支输出的特征计算包含不变项和冗余消除项的总损失,用总损失迭代更新参数,达到设定迭代次数后保存编码器及映射器参数,并将编码器的输出作为特征,输入到下游svm分类器。

11、进一步的,所述损失函数为:

12、lhyperbt=linv+lred

13、

14、

15、其中,lhyperbt为总损失,linv为不变损失,lred为冗余消除损失,bii为同一批样本所得的互相关矩阵b的对角线元素,bij为同一批样本所得的互相关矩阵b的非对角线元素,dij为同一批样本所得的互协方差矩阵d的非对角线元素。

16、总而言之,通过本专利技术构思的技术方案与现有技术相比,具有下列优点:

17、(1)针对高光谱图像存在大量冗余信息,难以提取关键特征的问题,本专利技术设计了一种把冗余消除作为训练目的的双分支自监督结构用于高光谱图像的特征提取,减少了不同输入样本之间的相关性,提取了更具代表性的空谱特征。

18、(2)本专利技术通过使用互相关矩阵对角项作为损失函数的不变项,互相关矩阵非对角项和互协方差矩阵的非对角项作为冗余消除项,来组成损失函数,鼓励模型在梯度下降的过程中更充分地消除冗余并提取更关键的特征。

19、(3)本专利技术确定了该结构合适的超参数,包括损失函数各项的系数、编码器输出尺寸和映射器输出尺寸等,使该结构能够将分类结果精度提高到新的高度。

本文档来自技高网...

【技术保护点】

1.一种基于冗余消除的自监督高光谱图像分类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于冗余消除的自监督高光谱图像分类方法,其特征在于,所述的步骤2具体为:对原始高光谱数据X进行主成分分析,降低维度,压缩光谱信息;取前d张主成分图,用滑动窗口将整块的数据切割成s*s*d大小的补丁,s为滑窗宽度,补丁中心像素的标签代表了该补丁类别,滑窗的边缘用“0”填充;对补丁做两次相互独立的数据增强,生成两个视图,用于后续输入到自监督学习的双分支主干网络。

3.根据权利要求1或2所述的基于冗余消除的自监督高光谱图像分类方法,其特征在于,所述的数据增强采用的实现方式为:随机裁剪、色彩畸变、随机翻转、随机灰度或添加高斯噪声。

4.根据权利要求1所述的基于冗余消除的自监督高光谱图像分类方法,其特征在于,所述步骤3中的双分支主干网络包括结构相同的两个分支用于分别提取两张输入视图的特征,

5.根据权利要求4所述基于冗余消除的自监督高光谱图像分类方法,其特征在于,根据两个分支输出的特征计算包含不变项和冗余消除项的总损失,用总损失迭代更新参数,达到设定迭代次数后保存编码器及映射器参数,并将编码器的输出作为特征,输入到下游SVM分类器。

6.根据权利要求4所述基于冗余消除的自监督高光谱图像分类方法,其特征在于,所述包含不变项和冗余消除项的损失函数为:

...

【技术特征摘要】

1.一种基于冗余消除的自监督高光谱图像分类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于冗余消除的自监督高光谱图像分类方法,其特征在于,所述的步骤2具体为:对原始高光谱数据x进行主成分分析,降低维度,压缩光谱信息;取前d张主成分图,用滑动窗口将整块的数据切割成s*s*d大小的补丁,s为滑窗宽度,补丁中心像素的标签代表了该补丁类别,滑窗的边缘用“0”填充;对补丁做两次相互独立的数据增强,生成两个视图,用于后续输入到自监督学习的双分支主干网络。

3.根据权利要求1或2所述的基于冗余消除的自监督高光谱图像分类方法,其特征在于,所述的数据增强采用的实现方式为:随机裁剪...

【专利技术属性】
技术研发人员:厉小润黎金辉王晶陈淑涵
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1