光学遥感图像云检测模型训练方法、检测方法和装置制造方法及图纸

技术编号:37623904 阅读:29 留言:0更新日期:2023-05-18 12:15
本公开提供了一种光学遥感图像云检测模型训练方法,包括:将光学遥感图像输入未经训练的云检测模型中,训练得到教师模型;固定教师模型的参数后,将光学遥感图像分别输入教师模型和预设学生模型中,分别输出第一特征图、第一预测概率分布和第二特征图、第二预测概率分布;根据第一特征图确定第一特征关联性知识;根据第二特征图确定第二特征关联性知识;根据第一特征关联性知识、第二特征关联性知识、第一预测概率分布和第二预测概率分布、利用第一预测概率分布计算得到的预测概率值和真值标签,计算预设学生模型的损失值;根据损失值,更新预设学生模型的参数,直至预设学生模型收敛,将收敛后的预设学生模型作为目标光学遥感图像云检测模型。学遥感图像云检测模型。学遥感图像云检测模型。

【技术实现步骤摘要】
光学遥感图像云检测模型训练方法、检测方法和装置


[0001]本公开涉及光学遥感
,具体涉及一种光学遥感图像云检测模型训练方法、检测方法和装置。

技术介绍

[0002]随着遥感技术的快速发展,卫星影像被广泛地应用于气象预警、灾害监测、军事监察等不同的领域。然而由于传感器受大气密度和云层变化等影响较大,许多影像存在云层遮挡问题,使得云检测成为对影像进行后续识别、分类和解译的关键,是遥感影像资料修复工作的基础之一。相关技术中的云检测方法是基于深度神经网络实现高精度的预测,然而使用相关技术中的训练方法训练得到的深度神经网络模型由于本身参数量大、浮点计算量高,存在花费大量存储和计算资源等缺点。

技术实现思路

[0003]鉴于上述问题,本公开提供了提高云检测效率的光学遥感图像云检测模型训练方法、检测方法和装置。
[0004]根据本公开的第一个方面,提供了一种光学遥感图像云检测模型训练方法,包括:
[0005]将光学遥感图像数据集中的光学遥感图像输入未经训练的基于深度神经网络的云检测模型中,训练得到经训练的基于深度神经网络的云检测模型作为教师模型;
[0006]在固定上述教师模型的模型参数的情况下,将上述光学遥感图像数据集中的光学遥感图像分别输入上述教师模型和预设学生模型中,分别输出利用模型提取的第一特征图和第二特征图,以及模型预测的第一预测概率分布和第二预测概率分布,其中,利用上述第一预测概率分布计算得到的预测概率值表征上述教师模型的预测能力知识;
[0007]根据上述第一特征图,确定第一特征关联性知识;以及根据上述第二特征图,确定第二特征关联性知识;
[0008]根据上述第一特征关联性知识、上述第二特征关联性知识、上述第一预测概率分布和上述第二预测概率分布、利用上述第一预测概率分布计算得到的预测概率值和上述光学遥感图像的真值标签,计算上述预设学生模型的损失值;
[0009]根据上述损失值,对上述预设学生模型的参数进行更新,直至上述预设学生模型收敛,将收敛后的上述预设学生模型作为目标光学遥感图像云检测模型。
[0010]根据本公开的实施例,根据上述第一特征图,确定第一特征关联性知识;以及根据上述第二特征图,确定第二特征关联性知识,包括:
[0011]将真值标签下采样以适配上述第一特征图和上述第二特征图的尺寸,其中,上述光学遥感图像数据集包括上述光学遥感图像和人工标注的云区域的真值标签;
[0012]根据上述第一特征图,确定上述教师模型的非云区域和云区域的特征映射;以及根据上述第二特征图,确定上述预设学生模型的非云区域和云区域的特征映射;
[0013]利用全局平均池化,分别计算得到上述教师模型的非云区域和云区域的特征中心
以及上述预设学生模型的非云区域和云区域的特征中心;
[0014]根据上述教师模型的上述特征映射与对应的特征中心的余弦距离,计算得到上述第一特征关联性知识;以及根据上述预设学生模型的上述特征映射与对应的特征中心,计算得到上述第二特征关联性知识。
[0015]根据本公开的实施例,根据上述教师模型的上述特征映射与对应的特征中心的余弦距离,计算得到上述第一特征关联性知识,包括:
[0016]根据上述教师模型的非云区域的第一特征映射与对应的特征中心的余弦距离,计算得到上述教师模型的非云区域的特征关联性知识;
[0017]根据上述教师模型的云区域的第二特征映射与对应的特征中心的余弦距离,计算得到上述教师模型的云区域的特征关联性知识;
[0018]上述教师模型的非云区域的特征关联性知识与上述教师模型的云区域的特征关联性知识联合作为上述第一特征关联性知识;以及
[0019]根据上述预设学生模型的上述特征映射与对应的特征中心,计算得到上述第二特征关联性知识,包括:
[0020]根据上述预设学生模型的非云区域的第三特征映射与对应的特征中心的余弦距离,计算得到上述预设学生模型的非云区域的特征关联性知识;
[0021]根据上述预设学生模型的云区域的第四特征映射与对应的特征中心的余弦距离,计算得到上述预设学生模型的云区域的特征关联性知识;
[0022]上述预设学生模型的非云区域的特征关联性知识与上述预设学生模型的云区域的特征关联性知识联合作为上述第二特征关联性知识。
[0023]根据本公开的实施例,上述损失值包括:特征关联性损失值、像素自适应蒸馏损失值、交叉熵损失值;
[0024]其中,上述特征关联性损失值通过将上述第一特征关联性知识和第二特征关联性知识应用到KL散度中计算得到,其中,上述KL散度作为损失函数;
[0025]其中,上述像素自适应蒸馏损失值通过如下方式计算得到:将上述第一预测概率分布与One

hot真值计算内积得到预测概率值;在上述第一预测概率分布与上述第二预测概率分布之间使用KL散度作为损失函数,将上述预测概率值与上述KL散度相乘,计算得到加权损失值,上述加权损失值作为像素自适应蒸馏损失值;以及
[0026]其中,上述交叉熵损失值,通过如下方式计算得到:将上述光学遥感图像数据集中的光学遥感图像输入预设学生模型中,输出上述预设学生模型的上述第二预测概率分布;利用上述光学遥感图像的真值标签与上述第二预测概率分布计算得到上述交叉熵损失值。
[0027]根据本公开的实施例,上述教师模型由一个深度神经网络特征提取器和一个预测器组成。
[0028]根据本公开的实施例,固定上述教师模型的模型参数包括:
[0029]固定上述教师模型的网络结构以及权重。
[0030]本公开的第二方面提供了一种光学遥感图像云检测方法,包括:
[0031]将上述光学遥感图像数据集输入目标光学遥感图像云检测模型中,输出光学遥感图像云检测结果;
[0032]其中,上述目标光学遥感图像云检测模型通过根据上述任一项中任一项所述的光
学遥感图像云检测模型训练方法训练得到。
[0033]本公开的第三方面提供了一种光学遥感图像云检测模型训练装置,包括:
[0034]训练模块,用于将光学遥感图像数据集中的光学遥感图像输入未经训练的基于深度神经网络的云检测模型中,训练得到经训练的基于深度神经网络的云检测模型作为教师模型;
[0035]特征提取模块,用于在固定上述教师模型的模型参数的情况下,将上述光学遥感图像数据集中的光学遥感图像分别输入上述教师模型和预设学生模型中,分别输出利用模型提取的第一特征图和第二特征图,以及模型预测的第一预测概率分布和第二预测概率分布,其中,利用上述第一预测概率分布计算得到的预测概率值表征上述教师模型的预测能力知识;
[0036]确定模块,用于根据上述第一特征图,确定第一特征关联性知识;以及用于根据上述第二特征图,确定第二特征关联性知识;
[0037]计算模块,用于根据上述第一特征关联性知识、第二特征关联性知识、上述第一预测概率分布和上述第二预测概率分布、利用上本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种光学遥感图像云检测模型训练方法,包括:将光学遥感图像数据集中的光学遥感图像输入未经训练的基于深度神经网络的云检测模型中,训练得到经训练的基于深度神经网络的云检测模型作为教师模型;在固定所述教师模型的模型参数的情况下,将所述光学遥感图像数据集中的光学遥感图像分别输入所述教师模型和预设学生模型中,分别输出利用模型提取的第一特征图和第二特征图,以及模型预测的第一预测概率分布和第二预测概率分布,其中,利用所述第一预测概率分布计算得到的预测概率值表征所述教师模型的预测能力知识;根据所述第一特征图,确定第一特征关联性知识;以及根据所述第二特征图,确定第二特征关联性知识;根据所述第一特征关联性知识、所述第二特征关联性知识、所述第一预测概率分布和所述第二预测概率分布、利用所述第一预测概率分布计算得到的预测概率值和所述光学遥感图像的真值标签,计算所述预设学生模型的损失值;根据所述损失值,对所述预设学生模型的参数进行更新,直至所述预设学生模型收敛,将收敛后的所述预设学生模型作为目标光学遥感图像云检测模型。2.根据权利要求1所述的训练方法,其中,所述根据所述第一特征图,确定第一特征关联性知识;以及根据所述第二特征图,确定第二特征关联性知识,包括:将真值标签下采样以适配所述第一特征图和所述第二特征图的尺寸,其中,所述光学遥感图像数据集包括所述光学遥感图像和人工标注的云区域的真值标签;根据所述第一特征图,确定所述教师模型的非云区域和云区域的特征映射;以及根据所述第二特征图,确定所述预设学生模型的非云区域和云区域的特征映射;利用全局平均池化,分别计算得到所述教师模型的非云区域和云区域的特征中心以及所述预设学生模型的非云区域和云区域的特征中心;根据所述教师模型的所述特征映射与对应的特征中心的余弦距离,计算得到所述第一特征关联性知识;以及根据所述预设学生模型的所述特征映射与对应的特征中心,计算得到所述第二特征关联性知识。3.根据权利要求2所述的训练方法,其中,根据所述教师模型的所述特征映射与对应的特征中心的余弦距离,计算得到所述第一特征关联性知识,包括:根据所述教师模型的非云区域的第一特征映射与对应的特征中心的余弦距离,计算得到所述教师模型的非云区域的特征关联性知识;根据所述教师模型的云区域的第二特征映射与对应的特征中心的余弦距离,计算得到所述教师模型的云区域的特征关联性知识;所述教师模型的非云区域的特征关联性知识与所述教师模型的云区域的特征关联性知识联合作为所述第一特征关联性知识;以及根据所述预设学生模型的所述特征映射与对应的特征中心,计算得到所述第二特征关联性知识,包括:根据所述预设学生模型的非云区域的第三特征映射与对应的特征中心的余弦距离,计算得到所述预设学生模型的非云区域的特征关联性知识;根据所述预设学生模型的云区域的第四特征映射与对应的特征中心的余弦距离,计算
得到所述预设学生模型的云区域的特征关联性知识;所述预设学生模型的非云区域的特征关联性知识与所述预设学生模型的云区域的特征关联性知识联合作为所述第二特征关联性知识。4.根据权利要求1所述的训练方法,其中,所述损失值包括:特征关联...

【专利技术属性】
技术研发人员:闫志远杨竹君李俊希刁文辉戴威
申请(专利权)人:中国科学院空天信息创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1