一种基于主动学习和卷积神经网络的遥感图像分类方法技术

技术编号:24889832 阅读:32 留言:0更新日期:2020-07-14 18:16
本发明专利技术请求保护一种基于主动学习和卷积神经网络的遥感图像分类方法,该方法包括:通过主成分分析方法对高光谱遥感图像进行波段处理,随后将图像处理成块。将数据按照一定比例分为训练集、未标记样本集、验证集和测试集。使用训练集对卷积神经网络进行训练,对未标记样本集中样本的所属类别进行预测,引入主动学习对样本进行评估。然后将其评估的结果进行排序,挑选出其中置信度低的样本,专家赋予其标签,对于置信度高的样本计算机自动赋予其标签。通过调节预测标签系数来构建高质量的训练样本集,使用挑选出的训练样本集迭代优化分类器模型。满足停止条件便停止迭代,输出最终的分类结果。

【技术实现步骤摘要】
一种基于主动学习和卷积神经网络的遥感图像分类方法
本专利技术属于遥感图像分类的领域。具体涉及一种基于卷积神经网络,引入主动学习挑选出置信度低的样本,专家赋予其标签,挑选出置信度高的样本,计算机自动赋予其标签,并通过调节预测标签系数来构建高质量的样本集,进一步通过分类器模型进行高光谱遥感图像分类的方法。
技术介绍
遥感图像分类是目前遥感技术中的热门研究内容,遥感图像分类是将图像中的每个像素判定为其所属的地物类别,因此,研究遥感图像分类技术具有很大的价值。遥感图像应用十分广泛,可以应用于农业、环境监测、军事等领域。如何准确高效地进行遥感图像分类,已经成为遥感领域的一个重要的研究内容。近年来,随着深度学习的发展,深度学习模型已经被逐渐应用于遥感图像分类,并表现出了很好的分类效果。已经有学者将稀疏自编码器、深度信念网络应用于遥感图像分类。然而,这两种分类方法需要将数据处理成一维向量输入模型,因此,无法提取图像的空间信息。而且,这两种无监督模型不需要标签样本的参与,并且需要大量的参数,使得该方法缺乏一定的可靠性。卷积神经网络作为监督学习的方法,近年来在深度学习领域取得了令人兴奋的分类效果。依靠充足的标签样本,卷积神经网络可以直接从像元中提取出特征。而且,由于卷积神经网络具有稀疏连接、权值共享等特点,使得卷积神经网络需要较少的参数便能提取图像的光谱与空间信息。然而,卷积神经网络属于监督分类方法,需要大量的标记样本才能达到较高的分类精度,而标签样本的获取不仅费时费力还十分昂贵。目前,将卷积神经网络应用于遥感图像分类只关注于随机初始化训练集进行模型的训练,很少有学者考虑构建高质量的训练集。因此,如何利用更少的标签样本来达到较高的分类精度是目前需要解决的问题。主动学习是机器学习领域的一个热门研究问题,通过主动学习可以减少训练集的数量,提高训练集的质量。
技术实现思路
本专利技术旨在解决以上现有技术的问题。本专利技术引入了主动学习算法来挑选有价值的样本进行标注,构建高质量的训练集。首先,初始化少量的标记样本,作为训练集建立初始分类器模型。根据采样策略从未标记样本集中找出最有价值(比如信息量最大)的样本。然后,专家给挑选出的样本赋予标签,并将其从未标记样本集中移除,加入到训练集中,用于训练分类器。主动学习是一个迭代的过程,直到它达到停止准则才停止迭代。因此本专利技术提出了一种基于主动学习和卷积神经网络的遥感图像分类方法,在卷积神经网络中引入主动学习算法,挑选出置信度低的样本,专家赋予其标签,挑选出置信度高的样本,计算机自动赋予其标签,通过调节预测标签系数构建高质量的样本集,通过卷积层的卷积运算增强原始数据的特性,在池化层中进行下采样操作,以减少数据量并保留有用的信息。经过卷积、池化等操作提取数据的深层特征,进而进行高光谱遥感图像分类。鉴于此,本专利技术采用的技术方案如下,一种基于主动学习和卷积神经网络的遥感图像分类方法,包括以下步骤:步骤S1,对高光谱遥感图像数据进行主成分分析,并将其处理成数据块的形式。步骤S2,将步骤S1处理后的数据分为训练集、未标记样本集、验证集和测试集。步骤S3,将训练集输入卷积神经网络中进行训练,并对未标记样本集中样本的所属类别进行预测。步骤S4,使用主动学习对未标记样本集中的样本进行评估,并对样本的置信度进行排序,根据初始预测标签系数挑选出置信度低的样本,同时挑选出置信度高的样本。步骤S5,分别对置信度低的样本和置信度高的样本赋予标签,然后将其加入训练集,同时将其从未标记样本集中移除。步骤S6,调节预测标签系数,重复步骤S3-S5,直到满足停止条件便停止迭代。步骤S7,将得到的训练集输入卷积神经网络中进行模型的训练。步骤S8,使用步骤S7训练好的模型对遥感图像进行分类。本专利技术的优点及有益效果如下:在遥感图像分类领域中,目前大多数使用卷积神经网络对高光谱遥感图像进行分类。然而,卷积神经网络往往需要大量的标签样本进行训练,才能取得较好的分类结果。在实际应用中,高光谱遥感图像标签样本的获得往往费时费力,而且十分的昂贵。针对标签样本获取困难的问题,将主动学习引入卷积神经网络中进行研究是很有意义的。首先考虑到了高光谱遥感图像丰富的光谱特性,由于光谱波段间的相关性强,容易造成信息冗余、维数灾难等问题,本专利技术对高光谱遥感图像进行了降维操作,使用主成分分析方法对其进行了处理。为了提取高光谱遥感图像的光谱空间特征,本专利技术使用了三维卷积神经网络。将高光谱遥感图像处理成了图像块,块的中心像素的标签即为该块的标签。然后根据卷积神经网络的输出机制,利用主动学习的采样策略对未标记样本的价值进行评估。通过挑选出有价值的样本,赋予其标签后加入样本集中对分类器模型进行训练。这样可以改善样本的质量,提升分类效果。除此之外,目前应用于高光谱遥感图像分类中的主动学习算法并没有将未标记样本充分利用起来。往往只挑选出了信息量大的样本进行人工标注,忽略了置信度高的样本。本专利技术在将主动学习引入卷积神经网络进行高光谱遥感图像分类的过程中,不仅评估出了置信度低的未标记样本,还评估了置信度高的未标记样本。对于置信度低的未标记样本,专家赋予其标签;对于置信度高的未标记样本,计算机代替专家赋予其预测标签。这样不仅充分利用了大量的未标记样本,而且可以减少人工标注成本。另外,本专利技术设计了一个预测标签系数,通过调节预测标签系数来构建高质量的训练样本集。这里的预测标签系数指的是自动标注样本量与每次迭代标记样本总量之比。一开始训练样本量较少,此时并不能很好地对卷积神经网络进行训练,对未标记样本置信度评估的可信度并不高。因此,一开始我们的预测标签系数较小,可以从0开始。当预测标签为0时表示挑选出的未标记样本全部由专家进行标注。随着迭代次数的增加,分类模型的训练能力得到了提高,对未标记样本置信度评估的可信度增强。此时,预测标签系数也随之增大。即专家标记样本量减少,计算机自动赋予未标记样本标签的数量增多,如此可以进一步减少人工标注成本。附图说明图1是本专利技术提供优选实施例在高光谱遥感图像中基于主动学习和卷积神经网络进行分类的方法流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅是本专利技术的一部分实施例。参见图1,本专利技术的具体步骤为:(1)根据需求获取高光谱遥感数据;(2)对高光谱遥感数据进行主成分分析,并将其处理成数据块的形式;(3)按照一定比例将数据分为训练集、未标记样本集、验证集和测试集;(4)将训练样本输入卷积神经网络中进行训练,并对未标记样本集中样本的所属类别进行预测;(5)使用主动学习对未标记样本集中的样本进行评估,并对样本的置信度进行排序,根据预测标签系数分别挑选出置信度高的样本和置信度低的样本;(6)对挑选出的置信度低的样本,专家赋予其标签,对挑选出的置信度高的样本,计算机自动赋予其标签,然后将标签样本加入训练集本文档来自技高网
...

【技术保护点】
1.一种基于主动学习和卷积神经网络的遥感图像分类方法,其特征在于,包括以下步骤:/n步骤S1,对高光谱遥感图像数据进行主成分分析,并将其处理成数据块的形式;/n步骤S2,将步骤S1处理后的数据分为训练集、未标记样本集、验证集和测试集;/n步骤S3,将训练集输入卷积神经网络中进行训练,并对未标记样本集中样本的所属类别进行预测;/n步骤S4,使用主动学习对未标记样本集中的样本进行评估,并对样本的置信度进行排序,根据初始预测标签系数挑选出置信度低的样本,同时挑选出置信度高的样本;/n步骤S5,分别对置信度低的样本和置信度高的样本赋予标签,然后将其加入训练集,同时将其从未标记样本集中移除;/n步骤S6,调节预测标签系数,重复步骤S3-S5,直到满足停止条件便停止迭代;/n步骤S7,将得到的训练集输入卷积神经网络中进行模型的训练;/n步骤S8,使用步骤S7训练好的模型对遥感图像进行分类。/n

【技术特征摘要】
1.一种基于主动学习和卷积神经网络的遥感图像分类方法,其特征在于,包括以下步骤:
步骤S1,对高光谱遥感图像数据进行主成分分析,并将其处理成数据块的形式;
步骤S2,将步骤S1处理后的数据分为训练集、未标记样本集、验证集和测试集;
步骤S3,将训练集输入卷积神经网络中进行训练,并对未标记样本集中样本的所属类别进行预测;
步骤S4,使用主动学习对未标记样本集中的样本进行评估,并对样本的置信度进行排序,根据初始预测标签系数挑选出置信度低的样本,同时挑选出置信度高的样本;
步骤S5,分别对置信度低的样本和置信度高的样本赋予标签,然后将其加入训练集,同时将其从未标记样本集中移除;
步骤S6,调节预测标签系数,重复步骤S3-S5,直到满足停止条件便停止迭代;
步骤S7,将得到的训练集输入卷积神经网络中进行模型的训练;
步骤S8,使用步骤S7训练好的模型对遥感图像进行分类。


2.根据权利要求1所述一种基于主动学习和卷积神经网络的遥感图像分类方法,其特征在于:所述对高光谱遥感图像数据进行主成分分析,保留了信息量高的波段,然后将图像处理成块,块的中心像素的标签即为该块的标签。


3.根据权利要求1所述一种基于主动学习和卷积神经网络的遥感图像分类方法,其特征在于:所述训练集、未标记样本集、验证集和测试集的划分:训练集+未标记样本集占全部样本的50%,验证集+测试集占全部样本的50%,其中每个类初始化5个样本作为训练集,其余为未标记样本集,验证集占5%,测试集占95%。


4.根据权利要求1所述一种基于主动学习和...

【专利技术属性】
技术研发人员:胡力心罗小波魏宇帆
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1