当前位置: 首页 > 专利查询>三峡大学专利>正文

一种遥感影像场景分类方法技术

技术编号:39322142 阅读:13 留言:0更新日期:2023-11-12 16:02
本申请提供一种遥感影像场景分类方法,该方法基于可控多样性生成对抗网络,即CD

【技术实现步骤摘要】
一种遥感影像场景分类方法


[0001]本专利技术涉及遥感影像场景分类
,具体地指基于可控多样性生成对抗网络的一种遥感影像场景分类方法。

技术介绍

[0002]遥感影像场景分类技术可以将遥感影像块自动划分为不同的类目,在城市规划、环境监测、土地资源管理等方面均有着巨大的应用价值。随着人工智能技术的进步,以卷积神经网为代表的深度模型的分类技术已经成为遥感场景分类方法的标准方法。利用CNN(Convolutional Neural Network,CNN)可以提取出遥感场景中更高层次的属性信息,并获得远超传统浅层模型的分类精度;同时基于CNN结构在场景分类中还可以加入注意力机制、记忆机制来不断提高场景分类精度。
[0003]CNN等深度模型需要大量的样本来进行训练,然而在实际工作中往往会遇到研究区范围较小或待分类对象数量本身就较少的情况,此时会遇到困难:要么提供极少的样本,分类模型无法得到充分训练,进而无法有效分类;要么将几乎所有需区分的对象加入到样本集,此时已经不需要进行自动分类了。因此,在实际场景分类应用中CNN需要应对小样本的问题。
[0004]不同于传统模型,CNN参数量较大足够"记住"所有的少量样本中所有细节,所以在样本量较少的情况下CNN易于拟合与场景中的特异差异。为了提高CNN小样本情况下的表现,目前在遥感和图像识别领域主要采取的手段是:利用几何变换方式对样本影像进行一定方向和尺度上的变换来提高样本数量;这种方式在有较大的通用数据集上表现较好,但是在样本较少的情况下可能会引发类目混淆的特征被放大的情况。
[0005]生成对抗网络(Generative Adversarial Networks,GAN)为解决小样本的问题提供了新的思路。生成对抗网络包含生成器G和辨别器D,通过两个模型的对抗训练GAN可以识别出样本中的关键特征;GAN可以有效的克服过度拟合、噪声和样本交叠等问题的影响,并有效的生成可用于放大(augmentation)样本集的影像数据。在遥感场景分类领域GAN得到了较多的关注,在识别关键特征方面,GAN可以有效的处理高维度(如使用高光谱影像)和低样本量之间的关系并发现类目的关键特征。在样本集放大方面:Xu等构造了线性指数结构来增强传统的GAN生成高分辨场景影像的能力;Ma等实现了基于GAN在线高多样场景样本生成,获得的分类模型精度高于传统几何变换增强的模型。利用GAN进行遥感影像生成并提高分类精度的关键是提高空间信息的多样性,通过GAN可以提高空间形成更多的空间内容组合而避免出现几何变换中常出现的混淆属性被放大的情况。生成对抗网络制造的遥感样本的空间多样性来自于输入的随机串z,此时对于z可能会遇到两个问题:1)随机性降低:部分随机性可能在G神经网前几层别看做噪声处理掉从而丧失一部分随机内容;2)不可控性:从随机串到随机空间结构完全由权重来控制,而权重的训练具有随机性,难以确定串的特定位置控制了哪些结构。这一问题直接导致了在利用GAN生成遥感样本的时候陷入两难境地:为保证单个样本质量许引入更多层次结构,这会显著降低空间多样性;而为提高空间多样
性减少网络层数反而会降低单个样本质量。这使得基于GAN的场景分类方法生成的样本空间多样性有限,且非常难于控制与实验。
[0006]在中国专利文献CN111767800A中记载了一种遥感影像场景分类得分融合方法,利用生成对抗网络模型对卫星影像数据集进行训练,并将模型迁移到航拍影像数据集上生成合成波段,通过多种波段组合方式训练场景分类模型,并对分类概率进行融合,从而提高高分辨率遥感影像场景分类的准确率。但该方法未对生全程对抗网络模型进行改进,未实现空间多样性的可控性,这种随机性可能在G神经网的最初几层被吸收,从而使得G生成的影像集中于有限的几种甚至一种空间结构。

技术实现思路

[0007]本专利技术的目的就是解决上述背景中空间多样性不足够的问题,提出一种遥感影像场景分类方法,通过CD

GAN模型生成具备足够空间多样性的样本来促进CNN的训练过程。CD

GAN包含三个组成部分:空间张量生成器(Spatial Tensor generator,T),生成器(Generator,G)和分辨器(Discriminator,D)。T用于随机生成一个空间描述z,G接收一个z来生成伪场景图像G(z)。对于输入图像x,D的决策结果为D(x)(图像x是真实的来自于tr
i
或伪造的G(z))。D和G具有对抗性关系。
[0008]优选的方案中,所述方法整体流程如下:输入训练遥感场景样本集TR;对于每一个类目tr
i
,CD

GAN训练并发现样本中的高层次空间特征的组合;T利用TGOA算法生成随机张量,并利用G转换为对应的生成影像集合tg
i
,此时可以构建构成了一组对应于类别i的增强样本td
i
={tr
i
,tg
i
},在处理完所有类目之后可以获得多样性增强的训练样本集TD={td1,td2...,tdNcategory};利用TD可以训练一个CNN分类模型Mcnn,此时Mcnn具有更加稳定的空间特征识别能力。
[0009]优选的方案中,张量生成器T首先构建一组“原子张量”形成原子张量池T
atom
,然后构建张量输出网络随机选取T
atom
中的元素加入到输出网络之中,最终对整个输出网络归一化获得输出张量z;每次T调用TGOA将生成一个二维的随机张量z,这个张量将驱动生成器G生成对应的遥感场景影像。
[0010]优选的方案中,分辨器D负责区分输入的影像来自于真实数据还是模型G的生成数据。
[0011]优选的方案中,CD

GAN模型的目标公式是:
[0012][0013]其中E是期望算子,真实影像的分布是p(x),生成器产生的z对应分布为p(z),描述T、G和D的对抗过程,使得G生成的影像逐步接近于真实的遥感场景。
[0014]优选的方案中,G的结构采用先编码再反编码两个阶段。
[0015]优选的方案中,通过逐渐优化公式(1),G生成的图像越来越逼近真实图像,此时对于一个场景影像类目i对抗模型CD

GAN可以表示为一个生成过程:
[0016]CD

GAN(tr
i
)

tg
i

ꢀꢀꢀꢀꢀ
(2)
[0017]此时CD

GAN具备了发现tr
i
中的关键空间特征,并以随机方式生成一系列影像td
i
的能力,迭代的应用CD

GAN的训练和生成过程就可以实现对原始样本集TR在空间信息上的
增强。
[0018]优选的方案中,编码阶段G采用4组图层,每组包含一个卷积层和一个Batch norm本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种遥感影像场景分类方法,其特征在于,所述方法包括可控多样性生成对抗网络CD

GAN,CD

GAN模型包含三个组成部分:空间张量生成器T、生成器G、和分辨器D,其中,T用于随机生成一个二维张量z;G接收一个z来生成伪场景图像G(z);对于输入图像x,D的决策结果为D(x);D和G具有对抗性关系。2.根据权利要求1所述遥感影像场景分类方法,其特征在于,所述方法整体流程如下:输入训练遥感场景样本集TR;对于每一个类目tr
i
,CD

GAN训练并发现样本中的高层次空间特征的组合;T利用TGOA算法生成随机张量,并利用G转换为对应的生成影像集合tg
i
,此时可以构建构成了一组对应于类别i的增强样本td
i
={tr
i
,tg
i
},在处理完所有类目之后可以获得多样性增强的训练样本集TD={td1,td2...,tdNcategory};利用TD可以训练一个CNN分类模型Mcnn,此时Mcnn具有更加稳定的空间特征识别能力。3.根据权利要求1所述遥感影像场景分类方法,其特征在于,所述张量生成器T首先构建一组“原子张量”形成原子张量池T
atom
,然后构建张量输出网络随机选取T
atom
中的元素加入到输出网络之中,最终对整个输出网络归一化获得输出张量z;每次T调用TGOA将生成一个二维的随机张量z,这个张量将驱动生成器G生成对应的遥感场景影像。4.根据权利要求1所述遥感影像场景分类方法,其特征在于,所述分辨器D负责区分输入的影像来自于真实数据还是模型G的生成数据。5.根据权利要求1所述遥感影像场景分类方法,其特征...

【专利技术属性】
技术研发人员:赵涛李晓峰朱士江钟韵郝琨孙爱华徐文王亚林杨超李虎朱瑾
申请(专利权)人:三峡大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1