基于课程学习的无监督域自适应遥感图像语义分割方法技术

技术编号:34694664 阅读:14 留言:0更新日期:2022-08-27 16:29
本发明专利技术涉及一种基于课程学习的无监督域自适应遥感图像语义分割方法,利用课程学习思想,通过线性增长的占比k

【技术实现步骤摘要】
基于课程学习的无监督域自适应遥感图像语义分割方法


[0001]本专利技术涉及图像分割
,具体而言,涉及一种基于课程学习的无监督域自适应遥感图像语义分割方法。

技术介绍

[0002]语义分割即对图像中每一个像素点进行分类,确定每个点的类别,从而进行区域划分;语义分割的目的是预测像素级的语义标签。随着遥感领域的发展,遥感卫星可以获取到大量的遥感图像数据,对遥感图像进行有效的语义分割可以对地物类别进行像素级分类,在路网提取、土地覆盖等方面都有广泛的应用,在更新基础地理数据、自主农业、智能交通、城市规划和可持续发展等方面有重要的意义,具有广泛的实用价值;但是遥感图像语义分割存在两个问题:分辨率高尺度大,标注需要花费巨大的人力和时间;而且不同地区地形地貌和建筑风格等方面存在较大的差异,将训练好的模型应用到不同地理空间区域时其分割效果往往不尽人意;例如:在城市和农村地区,土地覆盖的表现形式在类别分布、物体尺度和像元光谱上差异很大。
[0003]无监督域自适应方法可以较好的解决上述问题,尽可能利用有标注的源域数据,在不针对目标数据集进行重新标注的情况下,在不可见的目标数据集上取得较好的语义分割结果。无监督域自适应是假定所有的测试数据都没有标注,无监督域自适应的目标是即使在训练图像和测试图像之间存在较大的领域差异时也能生成高质量的分割,现有技术中,为了提高卷积神经网络(CNN)的泛化能力,常用方法之包括利用伽马校正、随机对比度变化等多种数据增强技术来丰富训练数据;此外,基于对抗的特征对齐方法采用生成对抗网络(GAN)来尽可能缩小源域和目标域特征表示之间的距离,其中鉴别器可以在多个层次上使用。另外,基于图像风格迁移的方法则是在保留图像内容的条件下,将源域图像的风格变换到目标域,从而利用源域图像的标签进行训练,这类方法也大多采用生成对抗网络实现。
[0004]现有技术中也有采用自步训练的方式训练目标域数据生成伪标签,但是,由于自步训练过程中会不断更新训练模型,而目标域的验证集不可见,从而无法对更新的训练模型进行筛选,导致训练过程不稳定,进而导致生成的伪标签噪声大。

技术实现思路

[0005]本专利技术解决的问题是如何减少伪标签在训练过程中的噪声影响,使得训练过程稳定,实现高精度的语义分割。
[0006]为解决上述问题,本专利技术提供基于课程学习的无监督域自适应遥感图像语义分割方法,其特征在于,包括:
[0007]步骤1、采集具有标签的源域数据D
s
={X
s
,Y
s
}和无标签的目标域数据 D
t
={X
t
};其中,X
s
为源域图像,Y
s
为对应源域图像X
s
的标签;X
t
是目标域图像;源域数据D
s
和目标域数据D
t
共享标签空间;
[0008]步骤2、构建交叉熵损失函数,根据交叉熵损失函数在源域数据D
s
上预训练教师模型M
T
,并保留预训练的权重参数;
[0009]步骤3、构建与教师模型M
T
相同的学生模型M
S
,并基于教师模型M
T
和预训练的权重参数初始化学生模型M
S

[0010]步骤4、使用教师模型M
T
对目标域数据D
t
进行预测,预测得到每个目标域像素属于某类别的概率的置信度图,并根据置信图统计每个类别的像素数目及占比;
[0011]步骤5、采用类别平衡的方式对占比k
i
的目标域像素数目进行筛选,得到目标域伪标签
[0012]步骤6、将源域数据和将占比k
i
的目标域数据及其伪标签采用交叉熵损失训练学生模型,计算并输出交叉熵损失曲线,根据交叉熵损失曲线判断交叉熵损失训练是否趋于稳定,若是,则进入步骤7,否则,继续通过源域数据和将占比k
i
的目标域数据训练学生模型;
[0013]步骤7、k
i
=k
i
+M,M为使得k
i
呈线性递增的常数;判断k
i
是否小于等于K;若是,则返回步骤5;若否,则进入步骤8;
[0014]步骤8、将目标域数据D
t
输入保存的学生模型M
S
进行测试,提取图像的特征,采用平均交并比mIoU作为评价指标评价训练后的学生模型M
S
,计算 mIoU并将像素类别进行可视化,得到语义分割的结果。
[0015]本专利技术的有益效果是:利用课程学习思想,通过线性增长的占比k
i
的目标域像素数目和类别平衡的伪标签筛选策略,使得教师模型M
T
以不同置信阈值生成伪标签,结合源域数据D
s
预训练的教师模型M
T
直接应用于置信度阈值的计算和伪标签的生成,使得训练过程更稳定;同时,训练过程中伪标签的数量呈线性增加,从而动态修改实现对目标域数据生成由易得到难的伪标签,实现稳定有效的训练。
[0016]作为优选,所述步骤2中的交叉熵损失函数为:
[0017][0018]式中,是置信度图,是源域图像的标签;h和w分别是图像的长和宽,c为类别数目。
[0019]作为优选,所述步骤4中将占比k
i
的目标域像素数目输入教师模型M
T
中,生成置信度图,并根据置信图统计每个类别的像素数目及占比σ
c

[0020][0021]σ
c
=N
c
/N
t
[0022]N
c
为目标域数据中第c个类别的像素数,N
t
是目标域数据的总像素数作为优选,所述步骤5中具体包括:
[0023]步骤501、对每个类别内按照置信度从高到低排序,并选择c类中置信度最高的前N
c
个像素作为伪标签的样本;第N
c
个像素的置信度即为置信阈值τ
c

[0024]步骤502、选择对应类别c中且置信度高于该类置信阈值τ
c
的像素进行标注,忽略低于该类置信阈值τ
c
像素,得到目标域伪标签
[0025][0026]其中,为目标域数据中i行j列的像素预测置信度,i=1,2,

,h,j= 1,2,

w。
[0027]作为优选,所述步骤6中的交叉熵损失训练函数为:
[0028][0029]L=L
s
+λ*L
t
[0030]式中,λ为常数,用于控制目标域的损失占比。
[0031]作为优选,所述步骤8中平均交并比mIoU为:
[0032][0033]式中,n本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于课程学习的无监督域自适应遥感图像语义分割方法,其特征在于,包括:步骤1、采集具有标签的源域数据D
s
={X
s
,Y
s
}和无标签的目标域数据D
t
={X
t
};其中,X
s
为源域图像,Y
s
为对应源域图像X
s
的标签;X
t
是目标域图像;源域数据D
s
和目标域数据D
t
共享标签空间;步骤2、构建交叉熵损失函数,根据交叉熵损失函数在源域数据D
s
上预训练教师模型M
T
,并保留预训练的权重参数;步骤3、构建与教师模型M
T
相同的学生模型M
S
,并基于教师模型M
T
和预训练的权重参数初始化学生模型M
S
;步骤4、使用教师模型M
T
对目标域数据D
t
进行预测,预测得到每个目标域像素属于某类别的概率的置信度图,并根据置信图统计每个类别的像素数目及占比;步骤5、采用类别平衡的方式对占比k
i
的目标域像素数目进行筛选,得到目标域伪标签步骤6、将源域数据和将占比k
i
的目标域数据及其伪标签采用交叉熵损失训练学生模型,计算并输出交叉熵损失曲线,根据交叉熵损失曲线判断交叉熵损失训练是否趋于稳定,若是,则进入步骤7,否则,继续通过源域数据和将占比k
i
的目标域数据训练学生模型;步骤7、k
i
=k
i
+M,M为使得k
i
呈线性递增的常数;判断k
i
是否小于等于K;若是,则返回步骤5;若否,则进入步骤8;步骤8、将目标域数据D
t
输入保存的学生模型M
S
进行测试,提取图像的特征,采用平均交并比mIoU作为评价指标评价...

【专利技术属性】
技术研发人员:冉令燕冀程张世周张晓强张艳宁
申请(专利权)人:西北工业大学宁波研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1