基于终身学习的遥感影像解译方法技术

技术编号:37460646 阅读:14 留言:0更新日期:2023-05-06 09:33
本发明专利技术公开了一种基于终身学习的遥感影像解译方法,涉及遥感影像处理领域,包括:S1 构建组合模型;S2 获取训练样本对组合模型进行预训练,得到第一场景分类结果;S3 获取待解译遥感影像,并进行均匀裁剪;S4 将裁剪后的待解译遥感影像依次输入组合模型,得到第二场景分类结果和解译信息;S5 计算得到场景差异值;S6 计算得到解译损失值;S7 基于场景差异值和解译损失值设置选择策略,根据选择策略对动态可扩展解译子模型进行重训练、扩展的选择,得到最终的组合模型;S8 通过最终的组合模型对新解译遥感影像进行解译。本发明专利技术实现了基于动态可扩展网络的面向遥感解译的终身学习,避免了终身学习中常见的灾难性遗忘问题。了终身学习中常见的灾难性遗忘问题。了终身学习中常见的灾难性遗忘问题。

【技术实现步骤摘要】
基于终身学习的遥感影像解译方法


[0001]本专利技术涉及遥感影像处理领域,具体涉及一种基于终身学习的遥感影像解译方法。

技术介绍

[0002]进入21世纪以来,我们通过卫星、无人机、数码相机、成像光谱仪与航天飞机等多种设备,多角度对高分辨率遥感影像进行采集,并将其应用在不同的领域中。如何快速有效的处理大量的遥感影像数据是遥感领域迫切需要解决的问题。显然,人工处理遥感影像,虽然精度高,但效率低下,且需要大量的成本去投入,这种方法是不可取的。传统遥感影像方法利用物体几何形状和空间位置等信息进行目标的特征提取,也可以通过颜色、阴影、纹理等特征信息,结合LiDAR或SAR对三维数据提取有效特征。采用以上单一的方法进行特征提取存在着一定的不足之处,比如分类效果不够明显、分类错误较多等问题,无法在可辩别性和鲁棒性之间保持一个良好的平衡点。然而,日益成熟的机器学习技术可以应用在我们生活中的多个领域,尤其是深度学习方式对网络进行训练,最终让模型对未知样本能够准确预测。遥感技术提供的大量且可靠数据,为深度学习模型发展奠定基础。而深度学习可以应用在遥感影像的分类、语义分割和检测等领域,为遥感技术更好的发展起到一定的推动作用。
[0003]目前应用于遥感影像解译的深度学习方法都面临着一个常见的问题,即面对不同的解译任务时,为了达到较高的解译精度需要构建全新的深度学习模型并进行全新的训练,这导致了工程实施上庞大的工程量和低下的模型训练效率、对于现有遥感影像数据和已构建模型的极低的有效利用率和复用率,限制了大规模的工程实施。为了解决这一问题并推动遥感影像解译的自动化发展,研究者尝试使用在线学习和持续学习的方法来对现有的模型和已经学习到的知识在新的遥感解译任务中进行复用。现有的多种持续学习方法中,最简单的方法是通过新任务提供的新训练数据来训练原网络从并实现网络微调。然而,这种简单的重训练方法会同时降低原网络对于新任务和旧任务的解译效果。如果新任务与旧任务之间的相关性很低,例如两个任务是对两种不同种类的地物,如小麦和建筑物进行分类,这时网络从旧任务学习到的特征就可能对于新任务起不到任何作用。另一个会遇到的问题是灾难性遗忘问题,原网络在学习到了新的知识后会遗忘掉之前学习到的内容,这是由以下两点所导致的:(1)因为深度学习的结构一旦确定,在训练过程中很难调整,神经网络的结构直接决定学习模型的容量。固定结构的神经网络意味着模型的容量也是有限的,在容量有限的情况下,神经网络为了学习一个新的任务,就必须擦除旧有的知识;(2)其次,深度学习的隐含层的神经元是全局的,单个神经元的细小变化能够同时影响整个网络的输出结果。另外,所有前馈网络的参数与输入的每个维度都相连,新数据很大可能改变网络中所有的参数。对于本身结构就已经固定的神经网络,参数是关于知识的唯一变化量。如果变化的参数中包含与历史知识相关性很大的参数,那么最终的效果就是,新知识覆盖了旧的知识。
[0004]对于遥感领域,如何保证在新的解译任务上取得较好的效果的同时能不降低模型在旧解译任务上原有的能力,以及如何克服灾难性遗忘问题是当前遥感终身学习技术发展中需要解决的重要问题。

技术实现思路

[0005]本专利技术提出一种基于终身学习的遥感影像解译方法,该方法通过结合遥感影像场景分类模型和动态可扩展遥感影像解译模型的组合模型实现了适应于遥感影像解译的终身学习方法。通过遥感影像场景分类来识别已知的和未知的任务,并进一步通过对解译网络的扩展和重训练来实现面对新的未知任务时模型容量的扩充以及对未知任务的学习,进而实现知识持续不断地更新。将学习到的知识充分运用于新的遥感解译任务,在不降低解译精度的同时有效避免了灾难性遗忘问题,提高了对现有模型和数据的利用率。
[0006]为实现上述技术目的,本专利技术的技术方案如下:
[0007]一种基于终身学习的遥感影像解译方法,该方法包括以下步骤:
[0008]S1 构建组合模型,组合模型包括动态可扩展解译子模型和场景分类子模型,场景分类子模型包括场景分类器和存储器;
[0009]S2 在样本库中获取训练样本,将裁剪后的训练样本对组合模型进行预训练,将得到的预训练结果作为第一场景分类结果并存储于存储器中;
[0010]S3 获取多幅待解译遥感影像,对待解译遥感影像进行均匀裁剪,每幅待解译遥感影像上包含已标注地物样本和未标注目标解译样本,其中,已标注地物样本包含真实标签;
[0011]S4 将裁剪后的待解译遥感影像依次输入组合模型,得到第二场景分类结果和解译信息,其中,解译信息包括已标注地物样本的解译信息和未标注目标解译样本的解译信息;
[0012]S5 将第二场景分类结果与第一场景分类结果进行计算,得到场景差异值;
[0013]S6 将已标注地物样本的解译信息与已标注地物样本的真实标签进行计算,得到解译损失值;
[0014]S7 基于场景差异值和解译损失值设置选择策略,根据选择策略对动态可扩展解译子模型进行重训练、扩展的选择,得到最终的组合模型;
[0015]S8 通过最终的组合模型对新遥感影像进行解译。
[0016]于本专利技术一实施例中,步骤S7中,选择策略为:
[0017]第一种:当场景差异值小于第一预设阈值,且解译损失值小于第二预设阈值时,保持动态可扩展解译子模型的当前结构,并得到最终的组合模型;
[0018]第二种:当场景差异值小于第一预设阈值,且解译损失值大于第二预设阈值时,重训练动态可扩展解译子模型,对组合模型进行更新,并转至步骤S4;
[0019]第三种:当场景差异值大于第一预设阈值,且解译损失值小于第二预设阈值时,重训练动态可扩展解译子模型,对组合模型进行更新,并转至步骤S4;
[0020]第四种:当场景差异值大于第一预设阈值,且解译损失值大于第二预设阈值时,扩展动态可扩展解译子模型,以对组合模型进行更新,并转至步骤S4。
[0021]于本专利技术一实施例中,动态可扩展解译子模型包括卷积神经网络和扩展器,其中卷积神经网络用于完成解译任务,扩展器用于对卷积神经网络进行扩展。
[0022]于本专利技术一实施例中,扩展动态可扩展解译子模型包括增加卷积神经网络的神经元,并对增加的神经元进行训练;
[0023]重训练动态可扩展解译子模型包括选择性对部分网络参数进行调整。
[0024]于本专利技术一实施例中,扩展动态可扩展解译子模型包括:
[0025]对每层神经网络增加预设数量的神经元;
[0026]使用组稀疏正则化去除新增的无效神经元;
[0027]对最终增加的神经元进行训练:
[0028][0029]其中,l表示神经网络的第l层,D
t
为解译数据,W为神经网络权重,L为损失函数,μ和γ为正则项参数,t为当前任务,t

1为前一次任务,g为由每个神经元的输入权值定义的一个组。
[0030]于本专利技术一实施例中,重训练动态可扩展解译子模型包括:
[0031]当接收到新本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于终身学习的遥感影像解译方法,其特征在于,包括如下步骤:S1 构建组合模型,组合模型包括动态可扩展解译子模型和场景分类子模型,场景分类子模型包括场景分类器和存储器;S2 在样本库中获取训练样本,将裁剪后的训练样本对组合模型进行预训练,将得到的预训练结果作为第一场景分类结果并存储于存储器中;S3 获取多幅待解译遥感影像,对待解译遥感影像进行均匀裁剪,每幅待解译遥感影像上包含已标注地物样本和未标注目标解译样本,其中,已标注地物样本包含真实标签;S4 将裁剪后的待解译遥感影像依次输入组合模型,得到第二场景分类结果和解译信息,其中,解译信息包括已标注地物样本的解译信息和未标注目标解译样本的解译信息;S5 将第二场景分类结果与第一场景分类结果进行计算,得到场景差异值;S6 将已标注地物样本的解译信息与已标注地物样本的真实标签进行计算,得到解译损失值;S7 基于场景差异值和解译损失值设置选择策略,根据选择策略对动态可扩展解译子模型进行重训练、扩展的选择,得到最终的组合模型;S8 通过最终的组合模型对新遥感影像进行解译。2.根据权利要求1所述的基于终身学习的遥感影像解译方法,其特征在于,步骤S7中,选择策略为:第一种:当场景差异值小于第一预设阈值,且解译损失值小于第二预设阈值时,保持动态可扩展解译子模型的当前结构,并得到最终的组合模型;第二种:当场景差异值小于第一预设阈值,且解译损失值大于第二预设阈值时,重训练动态可扩展解译子模型,对组合模型进行更新,并转至步骤S4;第三种:当场景差异值大于第一预设阈值,且解译损失值小于第二预设阈值时,重训练动态可扩展解译子模型,对组合模型进行更新,并转至步骤S4;第四种:当场景差异值大于第一预设阈值,且解译损失值大于第二预设阈值时,扩展动态可扩展解译子模型,以对组合模型进行更新,并转至步骤S4。3.根据权利要求2所述的基于终身学习的遥感影像解译方法,其特征在于,动态可扩展解译子模型包括卷积神经网络和扩展器,其中卷积神经网络用于完成解译任务,扩展器用于对卷积神经网络进行扩展。4.根据权利要求3所述的基于终身学习的遥感影像解译方法,其特征在于:扩展动态可扩展解译子模型包括增加卷积神经网络的神经元,并对增加的神经元进行训练;重训练动态可扩展解译子模型包括选择性对部分网络参数进行调整。5.根据权利要求4所述的基于终身学习的遥感影像解译方法,其特征在于,扩展动态可扩展解译子模型包括:对每层神经网络增加预设数量的神经元;使用组稀疏正则化去除新增的无效神经元;对最终增加的神经元进行训练:
其中,l表示神经网络的第l层,D
t
为解译数据,W为神经网络权重,L为损失函数,μ和γ为正则项参数,t为当前任务,t

1为前一次任...

【专利技术属性】
技术研发人员:张广益陈宇鲁锦涛吴皓张玥珺李洁邹圣兵
申请(专利权)人:北京数慧时空信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1