【技术实现步骤摘要】
基于随机半监督特征提取模型的遥感图片分类方法
[0001]本专利技术涉及一种基于随机半监督特征提取模型的遥感图片分类方法。
技术介绍
[0002]随着遥感数据空间分辨率的提高,场景分类任务成为遥感图像分类任务的研究热点。遥感图像场景分类是对给定场景图像进行预定义语义类别的正确标注。现有技术中,普遍采用基于深度学习的方法进行图片分类。该方法在生活场景的图片分类任务中广泛应用,并且已经达到或超越了人类的水平。但是,基于深度学习的遥感场景分类算法主要以监督学习为主,这就需要大量的标注数据。然而遥感图片相比生活场景图片类内差异性大,类间可分性小,目标多尺度,且遥感数据样本标注成本高、专业性强,呈现海量弱标注的特点,从而使得遥感图片分类任务面临较大的挑战。
[0003]现有的基于深度学习的方法主要分为三类:基于卷积神经网络CNN的方法、基于变分自编码器VAE的方法和基于生成对抗网络GAN的方法。面对大量的遥感图像,基于CNN的方法需要使用大量标记的样本来训练模型或对预先训练的卷积神经网络进行微调。但是,遥感数据样本标注成本高、 ...
【技术保护点】
【技术特征摘要】
1.一种基于随机半监督特征提取模型的遥感图片分类方法,包括以下步骤:a、建立遥感场景图片数据库;b、构建随机半监督特征提取模型;c、构建分类网络;d、建立随机半监督特征提取模型的优化目标;e、博弈交替训练随机半监督特征提取模型;f、训练分类器;g、完成遥感图片分类任务。2.根据权利要求1所述的方法,其特征在于,在所述步骤(a)中,收集遥感场景图片数据,并按土地利用类型进行标注,然后按照是否具备类别标签将所有数据划分为有标注数据集和无标注数据集,其中有标注数据集的一部分作为测试数据,不参与训练,剩余的部分和所有无标注数据构成训练数据集,最后对训练数据集通过水平翻转、垂直翻转和旋转90度的方式进行数据增强。3.根据权利要求1所述的方法,其特征在于,所述步骤(b)中构建随机半监督特征提取模型包括构建随机生成网络G和半监督特征提取网络D;随机生成网络G包括输入噪声层、随机层、重采样层、反卷积层和输出图片层;半监督特征提取网络D包括输入图片层、卷积层、特征层、全连接层和输出层;随机生成网络G的优化目标为寻找α*使得:其中,p
z
是输入变量z服从的预定义分布,∈为随机层的中间变量,服从高斯分布N(0,I),随机层的输出变量服从高斯先验分布,α为待训练参数,f(
·
)表示图片经过半监督特征提取网络D的输出特征,E为关于变量的数学期望,x为输入图片;半监督特征提取网络D的优化目标为寻找η*使得:其中,η为特征提取网络的待训练参数;y
i
表示标签y的第i维分量;D
i
(
·
)表示网络输出的第i维分量,K为分类任务的总类别数;构建随机生成网络G包括以下步骤:
b11、从预定义分布中随机采样噪声作为随机生成网络G的输入;b12、根据具体任务难度设定随机层、重采样层、反卷积层的宽度和深度,其中随机层的输出变量服从高斯先验分布;b13、输出与原始数据相同尺寸的伪数据,并且作为半监督特征提取网络D的输入;构建半监督特征提取网络D时:在博弈训练阶段,输入图片包括真实有标注数据、真实无标注数据和生成伪数据,输出值包括真伪逻辑输出和图片类别输出;在分类器训练阶段,半监督特征提取网络D的输入是有标注数据,输出为对应的高维特征,作为分类器的输入;在实现遥感分类任务阶段,半监督特征提取网络D的输入是待分类遥感图片,输出为对应的高维特征;随机生成网络G共包含9层,第一层为输入层;第二层为随机层,由两个相同的全连接网络组成,用于学习该层输出变量所服从的高斯先验分布的均值和方差;第三层为重采样层;后续五层为反卷积层,其中卷积核的大小为4
×
4,步长为2;最后一层为输出层,输出大小为256
×
256的3通道图片;其中,反卷积层均采用ReLU形式的激活函数,输出层采用tanh类型的激活函数;半监督特征提取网络D包含9层,第一层为图片输入层,输入的图片包括有标注的真图片、无标注的真图片以及生成图片;后续六层为卷积层,其中卷积核的大小为5
×
5,步长为2,激活函数为leakyReLU,参数为0.2;特征层联合了之前三层的特征信息;最后一层为全连接层,输出图片的类别或真伪信息。4.根据权利要求1所述的方法,其特征在于,所述步骤(c)中采用线性支持向量机网络构建分类网络,正则化参数C为1000。5.根据权利要求1所述的方法,其特征在于,在所述步骤(d)中,建立随机半监督特征提取模型的优化目标为博弈一个关于随机生成网络G和半监督特征提取网络D的极大极小值,由监督学习损失和无监督学习损失两部分组成,如下式:其中,p是真实的遥感数据分布;p
G
是随机生成网络G的生成数据分布;p
D
(y|x,y≤K)表示输入图片x被判断...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。