基于自训练和域对抗的高光谱图像域自适应分类方法技术

技术编号:39819158 阅读:11 留言:0更新日期:2023-12-22 19:38
本发明专利技术公开了一种基于自训练和域对抗的高光谱图像域自适应分类方法,主要解决现有技术伪标签噪声大

【技术实现步骤摘要】
基于自训练和域对抗的高光谱图像域自适应分类方法


[0001]本专利技术属于图像处理
,更进一步涉及一种高光谱图像分类方法,可用于国土规划

生态保护

市政建设中的地物目标识别


技术介绍

[0002]高光谱图像具有较高的空间分辨率和光谱分辨率,其包含着数十乃至数百个波段,可以捕获大量的光谱细节,从而更准确地进行地物分类

这在自然图像或者多光谱图像中是无法做到的,因此高光谱图像被广泛应用于农业,环境保护等领域

近年来,许多深度学习算法如卷积神经网络

循环神经网络和注意力机制等被广泛应用于高光谱图像分类任务中,然而大多数深度学习分类算法需要大量的有标签数据集,这需要费时费力的标签工作

此外,由于收集地点

采集条件如光照

季节的变化

传感器的差异等因素,不同高光谱数据集间存在着波段偏移,这不符合传统深度学习模型中训练集与测试集独立同分布的假设,因此降低了模型的分类精度和鲁棒性,限制了模型的迁移泛化能力

无监督域自适应期望实现从有标签的源域数据集到无标签的目标域数据集的迁移,其核心在于从降低数据集间的分布差异

基于统计对齐

对抗学习

半监督算法的无监督域自适应算法都取得了不错的性能

然而上述域自适应方法都没有试图将各类方法结合
——
利用域对抗方法进行域对齐的同时利用半监督自训练伪标签自步地训练模型,导致域间对齐不充分或者伪标签带噪,造成分类性能不佳

[0003]中国矿业大学在申请号为
CN202211235431.7
的专利文献中公开了“一种基于虚拟分类器的高光谱图像领域自适应方法”,其首先通过聚类算法将源域和目标域的样本分别聚成若干簇;然后通过对齐源域和目标域的簇中心,降低对齐离群源域样本与目标域样本的风险;接着,使用相似度矩阵来计算软原型对比损失,从而减轻噪声伪标签的影响

此外,该方法还构建了一个虚拟分类器来执行基于特征相似性度量的分类,通过减少真实和虚拟分类器之间的分歧,鼓励具有相似特征的跨域样本被分到同一类中;最后,通过领域对抗策略减少域间整体分布差异

该方法优势在于对齐目标域样本和源域的簇中心,降低对齐离群源域样本与目标域样本的风险;同时能为每个正负样本分配相应的置信系数,从而减轻噪声伪标签的影响

但是,该方法由于使用相似度矩阵来计算软原型对比损失,因而需要计算大量的相似度矩阵,计算复杂度较高;同时由于该方法仅仅基于置信度计算出伪标签,伪标签因而含有大量的噪声,最终降低分类性能

[0004]Chen
等人在论文“Debiased Self

Training for Semi

Supervised Learning”(《Advances in Neural Information Processing Systems》

2022)
中提出了一种新的半监督算法,其通过去偏自训练,旨在减少自训练过程中的偏差问题,并设计了三个分类器:
K
分类器

伪标签分类器和最差情况估计分类器

一方面解耦伪标签的生成和利用:用
K
分类器生成伪标签,伪标签分类器利用伪标签更新模型,以达到仅用可信样本训练模型的目的,减少了训练偏差;另一方面,为了减少数据偏差,去偏自训练通过估计训练偏差的最坏情况来优化表示,从而提高伪标签的质量

该算法虽说可以减少自训练过程中的偏差问题,提高
模型的稳定性和性能平衡

但由于其去偏自训练并没有去减小域偏移,无法对齐域间不变特征,也无法做到跨数据集知识迁移,因此该半监督算法并不能直接用于无监督域自适应


技术实现思路

[0005]本专利技术的目的在于针对上述现有技术的不足,提出一种基于自训练和域对抗的高光谱图像域自适应分类方法,以缓解伪标签带噪问题,实现源域与目标域的域对齐,提升高光谱域自适应分类精度

[0006]实现本专利技术目的的技术思路是:一方面通过去偏自训练最小化训练偏差和数据偏差,缓解伪标签带噪问题,另一方面通过将域对抗方法与自训练方法相结合,对源域与目标域进行联合分布对齐,利用学习源域与目标域间的不变性特征,在域间实行有效的知识迁移

[0007]根据上述思路,本专利技术的技术方案包括如下步骤:
[0008](1)
在公开网站获取源域和目标域数据集,并对其图像进行高光谱数据预处理,得到预处理后的源域

目标域;
[0009](2)
构造包括特征提取器

三个分类器和梯度反转层这三部分的去偏自训练域对抗自适应模型;
[0010](3)
构建去偏自训练域对抗自适应损失函数
L
total

[0011][0012]其中为第一分类器
C1的源域交叉熵损失,为第二分类器
C2的基于置信度的自训练损失;
L
worst
为第三分类器
C3的最差情况对抗损失;
L
domain
为第三分类器
C3的域混淆损失;
λ1和
λ2为平衡损失值的超参数;
[0013](4)
训练去偏自训练域对抗自适应模型;
[0014](4a)
设迭代轮数初始值为0,将源域和目标域数据输入到去偏自训练域对抗自适应模型中,利用域对抗自适应损失函数
L
total
计算其损失值;
[0015](4b)
将损失值代入链式法则,计算出去偏自训练域对抗自适应模型各个参数的梯度,更新该模型的参数;
[0016](4c)
迭代轮数加1,返回
(4a)

[0017](4c)
重复
(4b)

(4c)
,不断更新模型的参数

减小损失值
L
total
,直到迭代轮数达到指定轮数,得到训练好的去偏自训练域对抗自适应模型;
[0018](5)
将目标域数据集输入到训练好的去偏自训练域对抗自适应模型中,得到目标域高光谱图像的分类结果

[0019]本专利技术与现有技术相比,具有如下优点:
[0020]第一,本专利技术由于构造了包括特征提取器

三个分类器和梯度反转层这三部分组成的去偏自训练域对抗自适应模型,可通过
K
分类器
C1推理源域数据并生本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
基于自训练和域对抗的高光谱图像域自适应分类方法,其特征在于,包括如下:
(1)
在公开网站获取源域和目标域数据集,并对其图像进行高光谱数据预处理,得到预处理后的源域

目标域;
(2)
构造包括特征提取器

三个分类器和梯度反转层这三部分的去偏自训练域对抗自适应模型;
(3)
构建去偏自训练域对抗自适应损失函数
L
total
:其中为第一分类器
C1的源域交叉熵损失,为第二分类器
C2的基于置信度的自训练损失;
L
worst
为第三分类器
C3的最差情况对抗损失;
L
domain
为第三分类器
C3的域混淆损失;
λ1和
λ2为平衡损失值的超参数;
(4)
训练去偏自训练域对抗自适应模型;
(4a)
设迭代轮数初始值为0,将源域和目标域数据输入到去偏自训练域对抗自适应模型中,利用域对抗自适应损失函数
L
total
计算其损失值;
(4b)
将损失值代入链式法则,计算出去偏自训练域对抗自适应模型各个参数的梯度,更新该模型的参数;
(4c)
迭代轮数加1,返回
(4a)

(4c)
重复
(4b)

(4c)
,不断更新模型的参数

减小损失值
L
total
,直到迭代轮数达到指定轮数,得到训练好的去偏自训练域对抗自适应模型;
(5)
将目标域数据集输入到训练好的去偏自训练域对抗自适应模型中,得到目标域高光谱图像的分类结果
。2.
根据权利要求1所述的方法,其特征在于,步骤
(1)
中对获取的源域和目标域数据集图像进行高光谱数据预处理,实现步骤包括如下:
(1a)
对源域和目标域数据集图像的每个像素,提取其周围像素大小为
27
×
27
像素的像素块,将源域与目标域的像素块与其中心像素对应的标签组成新数据集;
(1b)
去除新数据集中背景类与冗余类数据和其对应的标签;
(1c)
对去除标签后的新数据集进行
Z

Score
正则化,将数据转化为标准正态分布:其中
X
为输入数据集,
X'

Z

Score
正则化后的输出数据集,
μ

X
的平均值,
σ

X
的标准差
。3.
根据权利要求1所述的方法,其特征在于,步骤
(2)
中构造包括特征提取器

三个分类器和梯度反转层组成的去偏自训练域对抗自适应模型,实现步骤包括如下:
(2a)
构造包括四层卷积层

四层批归一化层

一层一维展平层的特征提取器
FE
,其结构为:第1卷积层

第1批归一化层

第2卷积层

第2批归一化层

第3卷积层

第3批归一化层

第4卷积层

第4批归一化层

一维展平层;所有卷积层参数采用
Kaiming
初始化;所有批归一化层权重初始化为1,偏差为0;
(2b)
构造三个分类器,即
K
分类器
C1、
伪标签分类器
C2、
对抗分类器
C3,每个分类器包括四层级联的全连接层;
(2c)
构造梯度反转层,用于在数据特征传递给后续层时将梯度乘以一个负的权重,以在反向传播过程中逆向更新特征;
(2d)
将特征提取器
FE
分别与
K
分类器
C1和伪标签分类器
C2级联,并通过梯度反转层与对抗分类器
C3级联,组成三路并行的去偏自训练域对抗自适应模型
。4.
根据权利要求3所述的方法,其特征在于,步骤
(2a)
中四层卷积层,其参数结构参数如下:所述第1卷积层的卷积核个数为
64
,卷积核大小3×3,步长为2×2,像素填充1×1,激活函数为
ReLU
函数;所述第2卷积层的卷积核个数为
128
,卷积核大小3×3,步长为2×2,像素填充1×1,激活函数为
ReLU
函数;所述第3卷积层的卷积核个数为
256
,卷积核大小3×3,步长为2×2,像素填充1×1,激活函数为
ReLU
函数;所述第4卷积层的卷积核个数为
512
...

【专利技术属性】
技术研发人员:冯婕张天舒尚荣华张向荣张骏鹏焦李成
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1