当前位置: 首页 > 专利查询>安徽大学专利>正文

一种新的高光谱图像数据半监督分类算法制造技术

技术编号:21300879 阅读:19 留言:0更新日期:2019-06-12 08:15
本发明专利技术公开了一种新的高光谱图像数据半监督分类算法,该方法为,首先获取到所有的高光谱数据,并将其作为初始数据;其次使用稀疏子空间聚类作为聚类方法来聚合所有的初始数据,并获取所有初始数据的伪标签;其次在CNN1中对所有的初始数据及其伪标签进行预训练;对于CNN1中分类层中的目标函数,提出了基于度量学习的新的目标函数;之后利用CNN1除去最后的分类层,再加上全连接层构成了CNN2;之后将带标签的数据以及它们的已知真实标签对CNN2进行微调。本发明专利技术是通过利用伪标签进行高光谱图像分类的半监督深度学习机制;用两段式训练,扩展了训练信息;为了更好的掌握高光谱样本结构特征的问题,在预训练阶段提出了新的目标函数。

A new semi-supervised classification algorithm for hyperspectral image data

The invention discloses a new semi-supervised classification algorithm for hyperspectral image data, which firstly obtains all hyperspectral data as initial data, secondly aggregates all initial data using sparse subspace clustering as clustering method, and obtains pseudo-labels of all initial data, and secondly carries out all initial data and pseudo-labels in CNN1. Pre-training; For the objective function of classification layer in CNN1, a new objective function based on metric learning is proposed; then CNN1 is used to remove the final classification layer, and the full connection layer is added to form CNN2; then the tagged data and their known real tags are fine-tuned to CNN2. The present invention is a semi-supervised deep learning mechanism for hyperspectral image classification by using pseudo-labels, expands the training information by using two-stage training, and proposes a new objective function in the pre-training stage to better grasp the structural characteristics of hyperspectral samples.

【技术实现步骤摘要】
一种新的高光谱图像数据半监督分类算法
本专利技术属于高光谱图像分类领域,涉及数据半监督分类技术,具体是一种新的高光谱图像数据半监督分类算法。
技术介绍
经过20世纪后半叶的发展,遥感技术在理论、技术及应用方面发生了重大的变化。其中,高光谱图像遥感技术无疑是遥感技术重大变化中十分重要的一个方面。高光谱图像遥感技术,利用高光谱传感器/成像光谱仪以数十至数百个连续细分的波段对目标区域同时成像,将图像与光谱结合,同时获取空间及光谱信息,得到以像素为单位的高光谱图像。该图像含有大量的光谱信息,能够采集目标在电磁波谱的紫外、可见光、近红外和中红外区域的辐射或反射信息。高光谱遥感数据包含了丰富的空间信息和光谱信息。高光谱图像最主要的特点就是可以同时获得地物的连续光谱和地表空间图像,将光谱维信息和传统的空间维图像信息融合在了一起。高光谱图像分类的过程就是根据图像像元的光谱特征信息和空间特性信息,对每个像元或比较匀质的像元组划分类别的过程。
技术实现思路
本专利技术提出了一种高光谱图像数据半监督分类算法,该算法在概率框架中集成了光谱信息和空间信息;先通过稀疏子空间聚类获得全部数据的伪标签进行预训练,并在预训练阶段加了度量学习正则化项来构造新的目标函数;然后用带标签的数据及其标签进行微调;然后使用马尔可夫随机场作为图像后处理,进一步利用空间信息。本专利技术的目的在于提供一种新的高光谱图像数据半监督分类算法。本专利技术的目的可以通过以下技术方案实现:一种新的高光谱图像数据半监督分类算法,该方法包括下述步骤:步骤一:获取到所有的高光谱数据,并将其作为初始数据;步骤二:使用稀疏子空间聚类作为聚类方法来聚合所有的初始数据,并获取所有初始数据的伪标签;初始数据的伪标签是通过稀疏子空间聚类直接获得;步骤三:在CNN1中对所有的初始数据及其伪标签进行预训练;对于CNN1中分类层中的目标函数,提出了基于度量学习的新的目标函数;步骤四:利用CNN1除去最后的分类层,再加上全连接层构成了CNN2;步骤五:将带标签的数据以及它们的标签在CNN2上进行微调;步骤六:在分类层之后,通过马尔可夫随机场,利用高光谱图像的空间信息,进一步对分类结果进行后处理,提高分类精度。进一步地,所述初始数据包括标记高光谱数据和未标记高光谱数据;同时利用标记高光谱数据和未标记高光谱数据对CNN1进行训练。进一步地,所述步骤三中CNN1是指代初始的深层卷积神经网络。进一步地,所述步骤三中预训练是指把全部的初始数据及其伪标签,放入神经网络CNN1中进行训练;预训练可以通过大量初始数据来预先训练网络CNN1并获得一组适当的参数,可以学习到特征;因为初始数据中标记的数据少,这里用到了未标记的高光谱数据和标记的高光谱数据。进一步地,所述步骤四中CNN2是指代新的深层卷积神经网络;它是由CNN1去除了最后的分类层,再加全连接层构成的;对于CNN2中分类层的目标函数,就是softmax交叉熵损失函数。进一步地,所述步骤五中微调是指带有真实标签的数据及其标签作为初始数据,放到CNN2中进行训练。进一步地,所述步骤六中通过马尔可夫随机场进一步利用其空间信息,具体表现为在图像分类任务中,马尔可夫随机场鼓励相邻像素具有相同的类标签;这可以进一步提高高光谱图像分类任务的分类准确率;马尔可夫随机场的作用是假设相邻像素更可能属于同一类,鼓励邻近像素属于同类标签。本专利技术的有益效果:本专利技术是通过利用伪标记进行高光谱图像分类的半监督深度学习机制;用两段式训练,来扩展训练信息。同时本专利技术提出了通过优化新的目标损失函数,加入了刻画高光谱数据特征的度量学习正则化条件项;最后通过马尔可夫随机场对分类结果进行后处理,能够做到进一步利用高光谱图像的空间信息,从而实现了对高光谱数据的空间信息和光谱信息的联合提取,即“空谱合一”,因此有效地提高了最终的分类效果。附图说明为了便于本领域技术人员理解,下面结合附图对本专利技术作进一步的说明。图1为本专利技术高光谱图像数据半监督分类算法流程图;图2为本专利技术半监督深度学习框架的结构图;图3为本专利技术预训练和微调阶段的框架图。具体实施方式如图1-3所示,一种新的高光谱图像数据半监督分类算法,该方法包括下述步骤:步骤一:获取到所有的高光谱数据,并将其作为初始数据;所述初始数据包括标记高光谱数据和未标记高光谱数据;步骤二:使用稀疏子空间聚类作为聚类方法来聚合所有的初始数据,并获取所有初始数据的伪标签;其中,初始数据的伪标签是通过稀疏子空间聚类直接获得;稀疏子空间聚类算法主要思想是,任意一个样本可以由其他样本点实现无限多的可能表示,那么来自于同一个子空间的样本才能进行彼此的表示,才有表示系数,意味着在这无限多的表示中,大部分系数是0,是无关的样本,才产生了稀疏表示;步骤三:在CNN1中对所有的初始数据及其伪标签进行预训练;预训练是指把全部的初始数据及其伪标签,放入神经网络CNN1中进行训练。预训练可以通过大量数据来预先训练网络CNN1并获得一组适当的参数,可以学习到特征;因为高光谱中标记的数据少,这里预训练采用的大量数据也用到了未标记的数据;对于CNN1中分类层中的目标函数,提出了基于度量学习的新的目标函数;其中新的目标函数指的是图3中的J;CNN1是指代初始的深层卷积神经网络;步骤四:利用CNN1除去最后的分类层,再加上全连接层构成了CNN2;CNN2是指代新的深层卷积神经网络;它是由CNN1去除了最后的分类层,再加全连接层构成的。对于CNN2中分类层的目标函数,是softmax交叉熵损失函数。步骤五:将带标签的数据以及它们的标签在CNN2进行微调;微调是指带有真实标签的数据及其标签作为初始数据,放到CNN2中进行训练。步骤六:在高光谱图像进行分类步骤之后,通过马尔可夫随机场进一步利用其空间信息。本专利技术的具体原理可解释为,高光谱图像分类的过程就是根据图像像元的光谱特征信息和空间特性信息,对每个像元或比较匀质的像元组划分类别的过程;首先,因为高光谱数据标记的样本少,只有少量标记的数据用于训练,所以我们使用稀疏子空间聚类作为聚类方法来聚合所有初始数据并获得所有数据的伪标签,所有的初始数据包括没有标记的高光谱数据和带标记的高光谱数据,因为稀疏子空间聚类是一种优秀的基于稀疏表达的聚类方法,在很多领域具有很好的应用效果;接下来,所有初始数据及其伪标签用于预训练深层卷积神经网络;与仅使交叉熵损失最小化的传统CNN模型不同,我们提出的模型是通过优化新的判别性目标函数来训练的;为此,除了最小化softmax交叉熵损失函数之外,我们还加入了一个度量学习正则化项;度量学习正则化项是指利用度量学习中的对比损失,然后把它与交叉熵相结合,构造出在预训练阶段CNN1中新的目标函数;度量学习,学习的对象通常是样本特征向量的距离,度量学习的目的是通过训练和学习,减小或限制同类样本之间的距离,同时增大不同类别样本之间的距离。因为高光谱图像中存在不同物体具有相同光谱且相同物体具有不同光谱的现象。类内多样性和类间相似性仍然是两大挑战,这些挑战一般会使高光谱图像分类的性能退化。通过加入度量学习正则化项之后能够使类内聚拢,类间分散。然后,我们从预先训练的网络中删除最后一层,并添加全连接的层和softmax分类层来构建新的深度网络CNN2本文档来自技高网...

【技术保护点】
1.一种新的高光谱图像数据半监督分类算法,其特征在于,该方法包括下述步骤:步骤一:获取到所有的高光谱数据,并将其作为初始数据;步骤二:使用稀疏子空间聚类作为聚类方法来聚合所有的初始数据,并获取所有初始数据的伪标签;初始数据的伪标签是通过稀疏子空间聚类直接获得;步骤三:在CNN1中对所有的初始数据及其伪标签进行预训练;对于CNN1中分类层中的目标函数,提出了基于度量学习的新的目标函数;步骤四: 利用CNN1除去最后的分类层,再加上全连接层构成了CNN2;步骤五:将带标签的数据以及它们的标签在CNN2上进行微调;步骤六:在分类层之后,通过马尔可夫随机场,利用高光谱图像的空间信息,进一步对分类结果进行后处理,提高分类精度。

【技术特征摘要】
1.一种新的高光谱图像数据半监督分类算法,其特征在于,该方法包括下述步骤:步骤一:获取到所有的高光谱数据,并将其作为初始数据;步骤二:使用稀疏子空间聚类作为聚类方法来聚合所有的初始数据,并获取所有初始数据的伪标签;初始数据的伪标签是通过稀疏子空间聚类直接获得;步骤三:在CNN1中对所有的初始数据及其伪标签进行预训练;对于CNN1中分类层中的目标函数,提出了基于度量学习的新的目标函数;步骤四:利用CNN1除去最后的分类层,再加上全连接层构成了CNN2;步骤五:将带标签的数据以及它们的标签在CNN2上进行微调;步骤六:在分类层之后,通过马尔可夫随机场,利用高光谱图像的空间信息,进一步对分类结果进行后处理,提高分类精度。2.根据权利要求1所述的一种新的高光谱图像数据半监督分类算法,其特征在于,所述初始数据包括标记高光谱数据和未标记高光谱数据;同时利用标记高光谱数据和未标记高光谱数据对CNN1进行训练。3.根据权利要求1所述的一种新的高光谱图像数据半监督分类算法,其特征在于,所述步骤三中CNN1是指代初始的深层卷积神经网络。4.根据权利要求1所述的一种新的高光谱图像数据半监督分类...

【专利技术属性】
技术研发人员:阎庆张凯琳丁云张晶晶寻丽娜
申请(专利权)人:安徽大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1