基于小样本学习的高光谱图像半监督分类方法技术

技术编号:30085849 阅读:19 留言:0更新日期:2021-09-18 08:45
本发明专利技术公开了一种基于小样本学习的高光谱图像半监督分类方法,主要解决现有技术在小样本场景下分类网络易出现过拟合和自训练过程中不可靠的“伪标记”样本对分类网络训练过程中造成不良影响的问题。其实现方案为:1)从高光谱数据库中获得五个高光谱数据集,并进行预处理;2)从预处理后的数据集中采集出训练集和测试集;3)构建包括两个卷积层和一个全连接层的高光谱图像原型分类网络;4)利用训练集,通过对其各类别原型进行迭代更新,完成对该分类网络的训练;5)将测试集输入到训练好的网络最优模型中,得到测试数据分类结果。本发明专利技术解决了现有小样本场景下存在的过拟合问题,提高了分类精度,可应用于地质勘探、城市遥感和海洋探测。洋探测。洋探测。

【技术实现步骤摘要】
基于小样本学习的高光谱图像半监督分类方法


[0001]本专利技术属于图像处理
,进一步涉及一种高光谱图像分类方法,可用于地质勘探、城市遥感和海洋探测。

技术介绍

[0002]高光谱图像分类是图像处理领域研究的重点。高光谱图像具有数据量大、波段多、波段间相关性强的特性,这些特点虽然给分类过程带来了诸多便利,但由于其标记样本少而会导致模型容易过拟合,使得高光谱图像在实际分类和识别应用中面临许多挑战。
[0003]现有的高光谱图像分类方法按照无标记样本是否参与训练,分为无监督型、半监督型和监督型分类方法。半监督分类方法从无标记样本参与训练方式不同可以分为五类:基于图的方法、生成式方法、协同学习方法、半监督聚类方法和自训练方法。
[0004]基于图的方法,是利用图的数据形式建模个体之间的连接关系,其主要包括图卷积神经网络和标签传播两种方法。基于图的高光谱图像分类方法利用图模型表示样本之间的相似性关系,可以获得较高的分类精度,但存在运算量大的问题。
[0005]生成式模型,顾名思义就是生成一种可观测数据的模型。典型的生成模型包括生成对抗网络GAN、变分自编码器等。生成式方法能够通过潜在模型的参数将未标记样本与学习目标联系起来,但此类方法假定样本数据服从一个潜在分布,需要充分可靠的先验知识建模,使用门槛较高。
[0006]协同训练方法,是指通过两个相互独立分类器,为彼此选择较为可靠的样本来扩展训练集,达到提高分类精度目的。该方法简单,但分类器相互独立的假设条件在实际应用中很难满足,训练前期容易将错误标签引入到另一分类器中。
[0007]半监督聚类方法中最典型的算法是直推式支持向量机,本质上属于支持向量机的推广形式,其目的仍然是寻找一个超平面用于对未标记样本的划分。该方法可以处理大的和高维的数据集,操作容易,但容易陷入局部最优解而非全局最优解。
[0008]自训练方法,是另一种高效学习方法。其首先使用标记样本数据训练一个分类器;其次,利用训练好的分类器对未标记样本生成“伪标签”;再次,将“伪标记”数据和标记样本数据结合,重新训练标记样本;最后,使用经过训练的分类器来预测测试样本的类标签,完成分类过程。这种学习方法,由于简单有效,不需要特定的假设条件,得到广泛应用,但当足够多的“伪标签”不正确时,会强化糟糕的分类决策,而分类器的性能实际上会变得更糟。针对这一问题,学者们提出了不同的技术方案。
[0009]Lu等人在A novel synergetic classification approach for hyperspectral and panchromatic images based on self

learning中提出一种自训练方法,该方法结合了标准的主动学习和基于主动学习的图像分割模型,学习时根据空

谱特征和来自光谱分类器的预测信息自动选择未标记样本,参与训练并完成分类过程。本专利技术虽然操作简单,但由于其光谱相似度的阈值和未标记样本的数量是人工确定的,很难取到学习过程中的最优解。
[0010]Li等人在Semisupervised hyperspectral image classification using soft sparse multinomial logistic regression提出一种基于软标签稀疏多项式逻辑回归模型,其对未标记样本依次分配硬标签和多个软标签,经过多次迭代后最终确定未标记样本标签类别。该方法使用了多个软标签,虽然可以减缓“伪标签”不正确的问题,但实验结果可能会出现不稳定的问题。
[0011]Fang等人在Multiscale CNNs Ensemble Based Self

Learning for Hyperspectral Image Classification提出一种基于多尺度卷积神经网络集成的自学习方法。该方法首先从有限的标记训练样本中提取不同尺度的空间信息,然后训练多个CNN模型,最后利用训练好的多尺度神经网络对未标记样本进行分类。该方法使用了多个分类器,虽然可以缓解标签部分不正确的问题,但时间和内存损耗较大。

技术实现思路

[0012]本专利技术的目的在于针对上述现有自训练方法的不足,提供一种基于小样本学习的高光谱图像半监督分类方法,以减小参与训练过程中置信度较低的“伪标记”样本对模型的影响,使得模型更好的表示数据的类别分布,缓解在小样本场景下容易出现过拟合问题,提高网络的分类性能。
[0013]本专利技术的技术思路是:使用原型网络为基本模型,将通过设置阈值选择最可信的未标记样本及其预测的标签反复添加到训练集中,更新类别原型并完成分类。其实现方案包括:
[0014]获取五个公开的高光谱数据集;分别对数据集进行预处理;采用非重复采样方法得到训练集和测试集;构建一个高光谱图像原型分类网络并设置各层参数;训练高光谱图像原型分类网络;将测试集输入到训练好的高光谱图像原型分类网络中,利用查询集修正类别原型,使用原型对查询集的类别进行预测,其实现包括如下:
[0015](1)从高光谱数据库中挑选出Indian Pines、KSC、Salinas、Pavia University和Botswana五个数据集,分别进行读取,得到每个数据集中的三维矩阵数据域为m
×
n
×
h,标签域为二维矩阵m
×
n,其中h代表高光谱图像的光谱维度,(m,n)表示某一光谱上像元的位置;
[0016](2)对(1)中获取的五个数据集,分别利用每个数据集中三维矩阵数据域进行数据归一化处理、去除背景类和降维操作的预处理,以消除噪声和冗余信息带来的影响;
[0017](3)划分训练集和测试集:在预处理后的五个数据集中,随机选择一个数据集作为测试集;从剩余四个数据集中随机抽取出ζ个类别作为训练集,ζ的取值根据不同的训练集分别设置;
[0018](4)构建依次由输入数据

第一卷积层

第一线性整流函数RELU操作

第二卷积层

第二线性整流函数RELU操作

全连接层组成的高光谱图像原型分类网络;
[0019](5)对高光谱图像原型分类网络进行训练,即将训练集中未标记样本到各个原型欧氏距离的负对数形式作为损失函数,使用随机梯度下降方法迭代更新损失函数对网络进行优化,直到损失函数值最小,得到训练好的分类网络;
[0020](6)对测试集进行预测,完成分类:
[0021](6a)将测试集中所有共K个类别分别选取3个样本作为测试支持集S2,剩余样本作
为测试查询集Q2;
[0022](6b)计算每一类中测试支持集经过网络映射后的重心c
k
,并将其作为每一类测试支持集原型的初始值c
k

[0023](6c)对测试查询集中每一个数据到所有测试支本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于小样本学习的高光谱图像半监督分类方法,其特征在于,包括:(1)从高光谱数据库中挑选出Indian Pines、KSC、Salinas、Pavia University和Botswana五个数据集,分别进行读取,得到每个数据集中的三维矩阵数据域为m
×
n
×
h,标签域为二维矩阵m
×
n,其中h代表高光谱图像的光谱维度,(m,n)表示某一光谱上像元的位置;(2)对(1)中获取的五个数据集,分别利用每个数据集中三维矩阵数据域进行数据归一化处理、去除背景类和降维操作的预处理,以消除噪声和冗余信息带来的影响;(3)划分训练集和测试集:在预处理后的五个数据集中,随机选择一个数据集作为测试集;从剩余四个数据集中随机抽取出ζ个类别作为训练集,ζ的取值根据不同的训练集分别设置;(4)构建依次由输入数据

第一卷积层

第一线性整流函数RELU操作

第二卷积层

第二线性整流函数RELU操作

全连接层组成的高光谱图像原型分类网络;(5)对高光谱图像原型分类网络进行训练,即将训练集中未标记样本到各个原型欧氏距离的负对数形式作为损失函数,使用随机梯度下降方法迭代更新损失函数对网络进行优化,直到损失函数值最小,得到训练好的分类网络;(6)对测试集进行预测,完成分类:(6a)将测试集中所有共K个类别分别选取3个样本作为测试支持集S2,剩余样本作为测试查询集Q2;(6b)计算每一类中测试支持集经过网络映射后的重心c
k
,并将其作为每一类测试支持集原型的初始值c
k
;(6c)对测试查询集中每一个数据到所有测试支持集原型c
k
的距离做softmax逻辑回归操作,得到所有测试查询集数据的类别概率(6d)在类别概率中通过设置的阈值筛选出具有高置信度的测试查询集数据,并计算筛选出的测试查询集与测试支持集经过网络映射后的重心,作为修正后的测试支持集原型(6e)对未被筛选的测试查询集中的每个数据,分别计算其到所有原型的距离,并依次进行softmax逻辑回归与argmax操作,得到预测类别标签完成分类。2.根据权利要求1所述的方法,其特征在于:所述(2)中数据归一化处理,其实现如下:(2a)将(1)中获得的三维矩阵数据域m
×
n
×
h变换为二维矩阵[(m
×
n),h];(2b)采用Max

Min归一化操作,遍历h个光谱,再将每一个光谱中的m
×
n个数据,都映射到[0,1]范围内,得到归一化后的像元值x
ijs

:其中,s表示高光谱图像中的一个光谱段,(i,j)表示光谱段s中的一个像元的坐标,x
ijs
表示光谱段s中的一个像元值,x
‑‑
smax
,x
‑‑
smin
分别表示在光谱段s中所有像元的最大值和最小值。3.根据权利要求1所述的方法,其特征在于:所述(2)中去除背景类操作,是将数据集中
类别为0的样本与标签去除掉。4.根据权利要求1所述的方法,其特征在于:所述(2)中的降维操作,是对去除背景类后的五个数据集进行主成分分析,得到三维矩阵m
×
n
×
p
n
,其中p
n
设置为50。5.根据权利要求1所述的方法,其特征在于:所述(4)中高光谱图像原型分类网络的各层参数设置如下:第一卷积层的特征映射图总数为50,卷积核大小为3
×
3,卷积步长为1,填充值为1;第二卷积层的特征映射图总数为100,卷积核大小为3
×
3,卷积步长为1,填充值为0;全连接层的输入宽度为200,输出宽度为9。6.根据权利要求1所术的方法,其特征在于,所述(5)中使用随机梯度下降方法迭代更新损失函数对网络进行优化,实现如下:(5a)在训练集中,分别从ζ个类别中挑选3个样本作为训练支持集S1,剩余样本作为训练查询集Q1;(5b)利用训练支持集S1计算训练支持集的原型c
ξ
:其中,x
i
...

【专利技术属性】
技术研发人员:侯思康茹颖田牧歌李翔翔丁火平曹向海
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1