一种基于双分类器对抗增强网络的高光谱图像分类方法技术

技术编号:34107991 阅读:15 留言:0更新日期:2022-07-12 00:49
本发明专利技术公开了一种基于双分类器对抗增强网络的高光谱图像分类方法,首先将原始HSI的源域和目标域数据进行向量化并输入BCAAN进行训练,使用源域数据预训练整个网络;然后固定特征生成器,使用目标域数据训练两分类器,使其差异最大;然后固定两分类器,使用目标域数据优化特征生成器,使两分类器差异最小;使用预训练的网络获取目标域数据的伪标签,每个样本对应两个伪标签;把两伪标签相同且输出概率皆大于区分阈值的目标域数据选为可靠样本。使用随机置零的方式对可靠样本进行数据增强,后将可靠的目标域和增强后的数据添加到源域数据中。最后,训练一个epoch后重新采样,基于分类器差异在对抗的过程中对齐源域和目标域,直到模型收敛。到模型收敛。到模型收敛。

【技术实现步骤摘要】
一种基于双分类器对抗增强网络的高光谱图像分类方法


[0001]本专利技术涉及模式识别
,主要涉及一种基于双分类器对抗增强网络的高光谱图像分类方法。

技术介绍

[0002]随着遥感技术的不断发展,越来越多的高光谱图像被研究者更加容易的获取。然而面对海量的高光谱图像,有效地标定样本往往需要相关专家耗费大量精力。高光谱图像分类作为遥感领域关键问题之一,受到广大研究人员的关注且被成功应用于城市规划、矿产鉴定和农业生产等多个领域。大量机器学习算法被成功应用于高光谱图像分类,例如支持向量机、稀疏表示及随机森林等。相较于深度学习算法,以上传统机器学习算法的分类精度较低。深度学习算法因其强大的特征表达能力,被大量应用于高光谱图像分类。
[0003]然而基于深度学习的高光谱分类方法的强分类能力往往需要大量标记样本作为支撑。现有技术中提出了很多方法,用于解决上述问题,大致分为主动学习方法、数据增强方法和领域适应方法。主动学习方法可通过从未标记样本中主动选择信息量最大的样本进行人工标注来增加训练样本量,以此扩充深度网络的训练集。以上方法仅能解决同场景的高光谱图像分类问题。在真实的高光谱图像分类应用中,不使用场景内标记样本学习出泛化能力强的分类模型是一个挑战。跨场景分类是仅利用相似场景内的标记样本完成对不同场景样本的分类。跨场景分类问题多是基于领域适应方法,领域适应作为迁移学习的一种特殊形式,能够将某个领域(源域)上学习到的知识应用于不同但相关的领域(目标域),从而使模型在目标域分类任务上取得较高精度。
[0004]将领域适应技术和深度学习相结合而提出的深度领域适应网络,仅利用源域少量标记样本完成跨场景高光谱图像分类。

技术实现思路

[0005]专利技术目的:针对上述
技术介绍
中存在的问题,本专利技术提供了一种基于双分类器对抗增强网络的高光谱图像分类方法,能够仅利用源域标记样本完成对目标域无标签样本的分类。
[0006]技术方案:为实现上述目的,本专利技术采用的技术方案为:
[0007]一种基于双分类器对抗增强网络的高光谱图像分类方法,包括以下步骤:
[0008]步骤S1、将原始高光谱图像HSI的源域数据和目标域数据进行向量化处理后输入至双分类器对抗增强网络BCAAN进行训练,使用源域数据预训练整个网络;
[0009]步骤S2、固定特征生成器G
f
,使用目标域数据训练两分类器C1和C2,使两分类器的差异最大;然后固定两分类器C1和C2,使用目标域数据优化特征生成器G
f
,使两分类器差异最小;
[0010]步骤S3、使用预训练的网络获取目标域数据的伪标签,其中每个样本对应两个伪标签;把两个伪标签相同且输出概率大于区分阈值的目标域数据选为可靠样本;
[0011]步骤S4、使用光谱波段随机置零的方式对可靠样本进行数据增强后,将可靠的目标域和增强后的样本集添加到源域数据中;
[0012]步骤S5、训练一个epoch后,重新采样,基于分类器差异在对抗的过程中对齐源域和目标域,直至模型收敛;最后使用收敛的模型对目标域样本进行分类,得到分类结果。
[0013]进一步地,步骤S2中具体训练及优化方法包括:
[0014]设定x
s
为一个来自源域高光谱图像{X
s
,Y
s
}的标记样本,对应标签为y
s
,x
t
为一个来自目标域高光谱图像X
t
的未标记样本;和分别为经向量化后的源域和目标域数据;通过最大化两分类器在目标域上的输出差异,然后最小化这种差异;考虑任务特征决策边界,以对抗的方式对齐两域分布;特征提取器G
f
包括一维卷积层和非线性层,用于提取原始HSI深度特征;分类器C1和C2包括全连接层、非线性层以及Softmax层,用于样本类别的预测和检测输出差异;
[0015]使用交叉熵作为分类损失;交叉熵函数定义如下:
[0016][0017][0018]其中,p为预测概率输出矩阵,r为标签信息,R(
·
)选择Softmax激活函数,c代表类别,V
i
表示预测值矩阵中第i维的值;
[0019]将两个分类器概率输出差值的绝对值作为差异损失:
[0020][0021]其中,d(
·
,
·
)表示差异损失,p
1c
和p
2c
依次表示两分类器在第c类的概率输出值;
[0022]两分类器的分类分歧的目标函数对应为:
[0023][0024]其中,n
t
为目标域样本总数。
[0025]进一步地,步骤S3中可靠样本选择具体步骤包括:
[0026]步骤S3.1、使用协同训练从不同视角对目标域数据进行分类,得到更加准确的目标域的伪标签;在训练过程中对两分类器的模型参数进行约束,加入正则项如下:
[0027][0028]其中,和分别由两分类器的全连接层参数进行向量化得到;
[0029]步骤S3.2、从得到的伪标签中挑选出可靠部分;
[0030]当两分类器在目标域上的分类结果同时符合下面标准时,将挑选出来的伪标签对应的样本挑选为可靠样本:
[0031](1)当两分类器对同一目标域样本分类结果相同时,即P1=P2;
[0032](2)p
1c
(y|x
t
)≥α且p
2c
(y|x
t
)≥α;其中α为预设的区分阈值。
[0033]进一步地,所述步骤S4中采用光谱波段随机置零的方法,将所有可靠样本部分波段进行随机置零,生成样本扩充集;具体地,选择b个波段进行随机置零,则b满足以下条件:
[0034][0035]其中N
b
为目标域数据波段数;为防止过拟合,每训练一个epoch均需重新选择扩充集。
[0036]进一步地,所述步骤S5中训练一个epoch具体步骤包括:
[0037]算法总损失函数如下:
[0038]L=L
cls1
(X
s
)+L
cls2
(X
s
)

λL
D
(X
t
)+βL
r
[0039]其中λ和β为损失重要性超参数;
[0040]步骤L1、训练两分类器C1和C2,使分类器能够正确对源域数据进行分类,通过最小化分类误差学习模型参数,更新方式如下:
[0041][0042]步骤L2、保持G
f
的模型参数不变,训练两分类器C1和C2作为一个判别器;最小化源域的分类损失,最大化目标域上的分类分歧损失;目标如下:
[0043][0044]步骤L3、固定两分类器的模型参数不变,通过最小化目标域上的分类分歧损失,训练特征生成器G
f<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于双分类器对抗增强网络的高光谱图像分类方法,其特征在于,包括以下步骤:步骤S1、将原始高光谱图像HSI的源域数据和目标域数据进行向量化处理后输入至双分类器对抗增强网络BCAAN进行训练,使用源域数据预训练整个网络;步骤S2、固定特征生成器G
f
,使用目标域数据训练两分类器C1和C2,使两分类器的差异最大;然后固定两分类器C1和C2,使用目标域数据优化特征生成器G
f
,使两分类器差异最小;步骤S3、使用预训练的网络获取目标域数据的伪标签,其中每个样本对应两个伪标签;把两个伪标签相同且输出概率大于区分阈值的目标域数据选为可靠样本;步骤S4、使用光谱波段随机置零的方式对可靠样本进行数据增强后,将可靠的目标域和增强后的样本集添加到源域数据中;步骤S5、训练一个epoch后,重新采样,基于分类器差异在对抗的过程中对齐源域和目标域,直至模型收敛;最后使用收敛的模型对目标域样本进行分类,得到分类结果。2.根据权利要求1所述的一种基于双分类器对抗增强网络的高光谱图像分类方法,其特征在于,步骤S2中具体训练及优化方法包括:设定x
s
为一个来自源域高光谱图像{X
s
,Y
s
}的标记样本,对应标签为y
s
,x
t
为一个来自目标域高光谱图像X
t
的未标记样本;和分别为经向量化后的源域和目标域数据;通过最大化两分类器在目标域上的输出差异,然后最小化这种差异;考虑任务特征决策边界,以对抗的方式对齐两域分布;特征提取器G
f
包括一维卷积层和非线性层,用于提取原始HSI深度特征;分类器C1和C2包括全连接层、非线性层以及Softmax层,用于样本类别的预测和检测输出差异;使用交叉熵作为分类损失;交叉熵函数定义如下:使用交叉熵作为分类损失;交叉熵函数定义如下:其中,p为预测概率输出矩阵,r为标签信息,R(
·
)选择Softmax激活函数,c代表类别,V
i
表示预测值矩阵中第i维的值;将两个分类器概率输出差值的绝对值作为差异损失:其中,d(
·
,
·
)表示差异损失,p
1c
和p
2c
依次表示两分类器在第c类的概率输出值;两分类器的分类分歧的目标函数对应为:其中,n
t
为目标域样本总...

【专利技术属性】
技术研发人员:王浩宇程玉虎王雪松
申请(专利权)人:中国矿业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1