结合空谱域自适应与集成学习的高光谱图像分类方法技术

技术编号：35751444 阅读：10 留言：0更新日期：2022-11-26 18:57

本发明专利技术公开了一种结合空谱域自适应与集成学习的高光谱图像分类方法，属于图像分类技术领域。该方法依次执行输入源域中有标记数据、目标域中无标记数据和少量有标记数据，通过空谱注意力模型对源域和目标域进行特征提取，其中空谱注意力模型引入了大核注意力(LKA)，可以利用图像的局部结构信息、捕获长距离依赖并且具有空间维度和光谱维度的适应性；然后将特征提取后的数据输入鉴别器并对源域数据聚类以形成聚类中心，再将目标域数据向各类聚类中心迭代映射；最后通过XGBoost进行分类来缓解模型计算速度慢和单分类器可信度低的问题，有效地提升了高光谱图像地物分类的准确度，为跨场景高光谱图像分类的后续研究以及相关应用提供新的参考思路。相关应用提供新的参考思路。相关应用提供新的参考思路。

全部详细技术资料下载

【技术实现步骤摘要】
结合空谱域自适应与集成学习的高光谱图像分类方法

[0001]本专利技术结合空谱域自适应与集成学习的高光谱图像分类方法属于图像分类

技术介绍

[0002]高光谱图像是由成像光谱仪获取的，成像光谱仪为每个像元提供数十至数百个窄波段光谱信息，产生一条完整而连续的光谱曲线。高光谱图像丰富的光谱信息和空间信息具有“图谱合一”的特点，更加有助于区分不同的土地覆盖类型，在农林监测、城市遥感等领域具有重要应用。因此，高光谱图像分类一直是图像处理领域研究的热点。
[0003]在过去的几十年中，多种基于神经网络的分类算法得到了大量地研究，例如2D卷积、3D卷积和图卷积。虽然取得了巨大的突破，但其存在着很大弊端——模型训练需要大量有标记样本。然而，由于高光谱图像的复杂性，手工标注难度大，导致标记样本有限。因此，如何在训练样本有限的条件下使得模型具有较好的泛化性能便成为了亟待解决的问题。域自适应技术是解决标记缺乏的重要方法，其思想是使一个领域(源领域)的知识适配另一领域(目标领域)，可在高光谱图像分类任务中用来减小跨场景图像之间的光谱偏移。根据目标域是否有少量标记数据，域自适应又可以分为无监督域自适应和有监督域自适应。无监督域自适应的主要策略是通过最小化源和目标特征之间的分布差异来引导特征学习。为此，对抗学习是无监督域自适应中常常用到的方法。由概率论知识可知，单一分类器的置信度不及多分类器集成。另外，高光谱图像特征较多，神经网络参数量较大，导致模型速度较慢。这些同样是本专利技术需要解决的问题。

技术实现思路

>[0004]针对上述问题，本专利技术将无监督域自适应与有监督域自适应相结合，提出了三层域自适应方案。除此之外，本专利技术在对抗域自适应的生成器中设计了大核注意力，并对大核进行了分解，保证网络在增大感受野的同时拥有较小参数量。本专利技术还引入了以快速和高效著称的XGBoost集成分类器，来解决计算速度慢和单分类器可信度低的问题。
[0005]本专利技术的目的是这样实现的：
[0006]步骤a、输入待分类的高光谱数据集；
[0007]步骤b、对输入的高光谱数据集进行划分：源域数据集命名为S(Source)，目标域数据集命名为T(Target)；
[0008]步骤c、在源域数据集中选取训练集，在目标域数据集中选取不相交的有标签训练集和无标签训练集；
[0009]步骤d、将源域训练集和目标域无标签训练集分别输入到源域特征提取器(Source Extractor，SE)和目标域特征提取器(Target Extractor，TE)中，进行特征提取，其中源域特征提取器和目标域特征提取器均采用空谱注意力模型结构；
[0010]步骤e、将特征提取后的数据送入鉴别器中，利用鉴别器区分源域与目标域数据，
通过鉴别器与目标域特征提取器(生成器)互相对抗，不断博弈来提高目标域特征提取器的特征迁移能力；
[0011]步骤f、将有少量标签的目标域样本输入到目标域特征提取器中，使目标域特征提取器学习目标域数据的真实分布；
[0012]步骤g、将源域和目标域数据映射到同一个公共域空间，利用源域数据的聚类中心对目标域数据进行聚类；
[0013]步骤h、利用XGBoost集成分类器对提取后的特征进行分类，获得最终的分类结果；
[0014]根据权利要求1所述的结合空谱域自适应与集成学习的高光谱图像分类方法，其特征在于，步骤c具体为：
[0015]步骤c1、在源域数据集中，每个类随机选取180个尺寸为5
×5×
ch的源域样本，ch为光谱波段，保留标签作为源域训练集，命名为带标签的源域数据SLS(Source labeled samples)；
[0016]步骤c2、在目标域数据集中，每个类随机选取20个尺寸为5
×5×
ch的目标域样本，保留标签作为目标域有标签训练集，命名为带标签的目标域数据TLS(Target labeled samples)；
[0017]步骤c3、在目标域数据集中，每个类随机选取200个尺寸为5
×5×
ch的目标域样本，去除标签后作为目标域无标签训练集，命名为不带标签的目标域数据TUS(Target unlabeled samples)。
[0018]根据权利要求1所述的结合空谱域自适应与集成学习的高光谱图像分类方法，其特征在于，步骤d具体为：
[0019]步骤d1、将源域训练集与目标域无标签训练集送入深度超参数模型后进行平均池化；
[0020]步骤d2、将d1处理后的数据输入大核注意力模型(LKA)，然后利用全连接展平数据；
[0021]根据权利要求1所述的结合空谱域自适应与集成学习的高光谱图像分类方法，其特征在于，步骤e具体为：
[0022]步骤e1、构建全连接层
‑
ReLU激活函数
‑
全连接层
‑
ReLU激活函数
‑
全连接层
‑
Softmax激活函数结构的鉴别器，第一层输入数据尺寸为1
×
128、第二层和第三层输入数据尺寸为1
×
64，第四层及输出数据尺寸为1
×
2。
[0023]步骤e2、空谱注意力模型特征迁移能力地提高通过优化损失函数实现，公式如下：
[0024][0025]其中，为目标域无标签训练样本TUS，α为目标域特征提取器的参数，β是鉴别器的参数，SLS是源域训练样本，SE(
·
)为源域特征提取器，TE(
·
)为目标域特征提取器。D
β
(
·
)是对抗学习中的鉴别器，用以区分输入特征是来自源域还是目标域。
[0026]根据权利要求1所述的结合空谱域自适应与集成学习的高光谱图像分类方法，其特征在于，在步骤f中，用目标域有标签训练集对步骤e训练完毕的空谱注意力模型进行调整，使得空谱注意力模型能够进一步学习目标域样本的条件概率分布。该层以均方误差作为损失函数，其优化公式为：
[0027][0028]其中，为目标域有少量标签的样本TLS，x是训练数据集，y是标签集。
[0029]根据权利要求1所述的结合空谱域自适应与集成学习的高光谱图像分类方法，其特征在于，步骤g具体为：
[0030]步骤g1、使源域有标签数据经过空谱注意力模型映射到一个公共域空间，取平均值得到源域的聚类中心；
[0031]步骤g2、将目标域无标签数据同样映射到同一个公共域空间，并在公共域空间利用源域的聚类中心对目标数据进行聚类，为了能够尽可能缩小公共域空间中源域和目标域的分布差异，引入映射聚类损失，用来衡量公共域空间内同类样本的聚集程度。通过迭代映射，优化聚类损失，使源域和目标域的聚类中心距离不断减小，全部类别的映射聚类损失优化公式为：
[0032][0033]其中，C
k
表示第k类样本的聚类中心，其值为第本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.结合空谱域自适应与集成学习的高光谱图像分类方法，其特征在于，包括以下步骤：步骤a、输入待分类的高光谱数据集；步骤b、对输入的高光谱数据集进行划分：源域数据集命名为S(Source)，目标域数据集命名为T(Target)；步骤c、在源域数据集中选取训练集，在目标域数据集中选取不相交的有标签训练集和无标签训练集；步骤d、将源域训练集和目标域无标签训练集分别输入到源域特征提取器(Source Extractor，SE)和目标域特征提取器(Target Extractor，TE)中，进行特征提取，其中源域特征提取器和目标域特征提取器均采用空谱注意力模型结构；步骤e、将特征提取后的数据送入鉴别器中，利用鉴别器区分源域与目标域数据，通过鉴别器与目标域特征提取器(生成器)互相对抗，不断博弈来提高目标域特征提取器的特征迁移能力；步骤f、将有少量标签的目标域样本输入到目标域特征提取器中，使目标域特征提取器学习目标域数据的真实分布；步骤g、将源域和目标域数据映射到同一个公共域空间，利用源域数据的聚类中心对目标域数据进行聚类；步骤h、利用XGBoost集成分类器对提取后的特征进行分类，获得最终的分类结果。2.根据权利要求1所述的结合空谱域自适应与集成学习的高光谱图像分类方法，其特征在于，步骤c具体包括以下步骤：步骤c1、在源域数据集中，每个类随机选取180个尺寸为5
×5×
ch的源域样本，ch为光谱波段，保留标签作为源域训练集，命名为带标签的源域数据SLS(Source labeled samples)；步骤c2、在目标域数据集中，每个类随机选取20个尺寸为5
×5×
ch的目标域样本，保留标签作为目标域有标签训练集，命名为带标签的目标域数据TLS(Target labeled samples)；步骤c3、在目标域数据集中，每个类随机选取200个尺寸为5
×5×
ch的目标域样本，去除标签后作为目标域无标签训练集，命名为不带标签的目标域数据TUS(Target unlabeled samples)。3.根据权利要求1所述的结合空谱域自适应与集成学习的高光谱图像分类方法，其特征在于，步骤d具体包括以下步骤：步骤d1、将源域训练集与目标域无标签训练集送入深度超参数模型后进行平均池化；步骤d2、将d1处理后的数据输入大核注意力模型(LKA)，然后利用全连接展平数据。4.根据权利要求1所述的结合空谱域自适应与集成学习的高光谱图像分类方法，其特征在于，步骤e具体包括以下步骤：步骤e1、构建全连接层
‑
ReLU激活函数
‑
全连接层
‑
ReLU激活函数
‑

【专利技术属性】
技术研发人员：王爱丽，丁姗姗，赵妍，刘和，刘城洋，
申请(专利权)人：哈尔滨理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人