基于双网络的遥感影像分类模型样本增量学习方法技术

技术编号:37880982 阅读:12 留言:0更新日期:2023-06-15 21:09
本发明专利技术公开了一种基于双网络的遥感影像分类模型样本增量学习方法,属于数据识别领域,包括用D0训练分类模型,得到识别N种遥感影像类别的分类模型M0;构造样本增量学习的数据流D1~D

【技术实现步骤摘要】
基于双网络的遥感影像分类模型样本增量学习方法


[0001]本专利技术涉及一种影像分类方法,尤其涉及一种基于双网络的遥感影像分类模型样本增量学习方法。

技术介绍

[0002]遥感影像分类是遥感影像解译的最基础任务之一。传统遥感影像分类工作主要基于手工设计特征,如尺度不变特征变换和视觉词袋模型。然而,由于遥感影像具有复杂的几何结构和差异的空间模式,手工设计的特征可能无法获取遥感影像的高级语义信息。近年来,在卷积神经网络(CNN)的推动下,遥感影像分类取得了重大进展。其中Xue等利用预先训练好的CNN作为特征提取器来提取遥感图像的高级特征。许夙晖等利用CNN提取图像的多尺度特征,并使用多核支持向量机实现遥感影像分类。宋中山等提出利用主动旋转聚合来融合不同尺度的特征,并通过特征融合补偿卷积神经网络(FAC

CNN),并将其应用于遥感影像分类来提升模型的泛化能力。屈震等提出了一种基于有效通道注意力(Efficient Channel Attention,ECA)机制的遥感影像分类新模型进一步提高模型的分类准确率与泛化能力。
[0003]然而,随着新的遥感影像数据持续采集,基于深度神经网络的遥感影像分类模型需要不断学习新数据中的新知识。为了提高遥感影像的识别性能,模型在学习新知识的同时保持旧知识的记忆是至关重要的。假设旧数据是可用的,一个最简单的方法是在新的数据和旧的数据上用联合训练方法(Joint)进行训练。然而,这种方法需要存储历史数据,导致存储和计算资源的浪费。在实际应用中,这显然是低效的。若不存储及使用旧数据,直接使用新数据在模型上微调,该方法英文Fine

tuning,简写FT。这种方法会出现知识遗忘,从而导致模型的整体分类性能下降。

技术实现思路

[0004]本专利技术的目的就在于提供一种解决上述问题,在不断学习新的数据的过程中,不会忘记以前训练过的数据的能力,不需要存储历史数据,大大节省存储空间,且能整体能提高遥感影像整体分类性能的,基于双网络的遥感影像分类模型样本增量学习方法。
[0005]为了实现上述目的,本专利技术采用的技术方案是这样的:一种基于双网络的遥感影像分类模型样本增量学习方法,包括以下步骤;(1)利用原始训练数据集D0训练分类模型,得到能识别N种遥感影像类别的分类模型M0;所述D0中的训练样本为带有遥感影像类别标签的遥感图像,D0的类别集为C={C1,C2,

,C
N
},N为遥感影像类别总数;(2)构造用于样本增量学习的数据流D={D1,D2,

,D
t
},t=1,2,

,第t次增量学习的训练集为D
t
,学习得到的模型为M
t
,D
t
中训练样本的类别集和D0相同;(3)依次进行增量学习,第t次增量学习的过程包括(31)~(33)(31)构造一双网络模型,包括第一网络模型M
t1
和第二网络模型M
t2
,二者均由t

1次增量学习得到的模型M
t
‑1初始化得到,当t=1时,M
t
‑1为M0;
(32)用D
t
训练第一网络模型M
t1
,采用知识蒸馏方法计算M
t1
与M
t
‑1的蒸馏损失L
kd
;用D
t
训练第二网络模型M
t2
,计算M
t2
和M
t1
的一致性损失L
con
;(33)知识协同学习;根据第一网络模型M
t1
的输出,计算其分类损失L
ce
;计算第一网络模型M
t1
的完整损失函数L
all
,通过识协同策略更新M
t2
的权重,再将M
t2
作为本次学习得到的模型M
t

[0006]式中,λ和β分别为L
kd
和L
ce
的权重。
[0007]作为优选:对训练集D
t
,,式中x
i
为D
t
中第i个训练样本,y
i
为x
i
的遥感影像类别标签,n为D
t
中的样本总数。
[0008]作为优选:步骤(2)中,所述D1训练的分类模型为ResNet网络模型。
[0009]作为优选:所述步骤(32)中,通过下式计算蒸馏损失L
kd

[0010]式中,n为D
t
中的样本总量,和是分别是M
t
‑1中和M
t1
中第i个训练样本对应的带温度参数T的softmax函数;应的带温度参数T的softmax函数;
[0011]其中和分别为D
t
中第i个训练样本在M
t
‑1中和M
t1
中的输出概率,k=1~N,表示第k个遥感影像类别。
[0012]作为优选:通过下式计算一致性损失L
con

[0013]其中和表示第i个训练样本在M
t1
和M
t2
中的输出概率,MSE(.)为和间的期望距离。
[0014]作为优选:步骤(33)中,通过下式计算M
t1
的分类损失L
ce

[0015]式中,n为D
t
中训练样本的总数,x
i
为D
t
中第i个训练样本,y
i
为x
i
的遥感影像类别标签,为x
i
在M
t1
中的输出概率。
[0016]作为优选:步骤(33)中通过识协同策略更新M
t
的权重具体为,通过下式更新M
t
的权重;
[0017]式中,j表示第t次增量学习中的第j轮训练,α是平滑系数超参数,和分别表示为第一网络模型M
t1
、第二网络模型M
t2
的内部权重。
[0018]与现有技术相比,本专利技术的优点在于:现有技术中样本增量,都是通过不断学习新的数据集去学习新的分类,故由于知识遗忘,会降低遥感影像模型对旧数据的识别性能,但本专利技术和现有技术完全不同,本专利技术是在每个不断学习的数据集中的样本类别相同的基础上,提出了一种双网络结构与原有样本增量学习得到的模型协同工的方法,每次学习不在于增加类别数量,而是不断的提高分类效率和分类精度。本专利技术还能有效克服知识遗忘问题,不需要存储历史数据,从而大大节省存储空间。因此,用于遥感影像分类的增量学习算法应用前景广阔。
[0019]其中,关于第一网络模型:设置的目的是为了旧知识的保留,若本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于双网络的遥感影像分类模型样本增量学习方法,其特征在于:包括以下步骤;(1)利用原始训练数据集D0训练分类模型,得到能识别N种遥感影像类别的分类模型M0;所述D0中的训练样本为带有遥感影像类别标签的遥感图像,D0的类别集为C={C1,C2,

,C
N
},N为遥感影像类别总数;(2)构造用于样本增量学习的数据流D={D1,D2,

,D
t
},t=1,2,

,第t次增量学习的训练集为D
t
,学习得到的模型为M
t
,D
t
中训练样本的类别集和D0相同;(3)依次进行增量学习,第t次增量学习的过程包括(31)~(33);(31)构造一双网络模型,包括第一网络模型M
t1
和第二网络模型M
t2
,二者均由t

1次增量学习得到的模型M
t
‑1初始化得到,当t=1时,M
t
‑1为M0;(32)用D
t
训练第一网络模型M
t1
,采用知识蒸馏方法计算M
t1
与M
t
‑1的蒸馏损失L
kd
;用D
t
训练第二网络模型M
t2
,计算M
t2
和M
t1
的一致性损失L
con
;(33)知识协同学习;根据第一网络模型M
t1
的输出,计算其分类损失L
ce
;计算第一网络模型M
t1
的完整损失函数L
all
,通过识协同策略更新M
t2
的权重,再将M
t2
作为本次学习得到的模型M
t
;式中,λ和β分别为L
kd
和L
ce
的权重。2.根据权利要求1所述的基于双网络的遥感影像分类模型样本增量学习方法,其特征在于:对训练集D
t
,,式中x
i
为D<...

【专利技术属性】
技术研发人员:姚光乐李雪王洪辉李军孙思源周皓然叶绍泽陈才华徐晓宇
申请(专利权)人:成都理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1