基于可解释深度学习的遥感图像跨域分类方法技术

技术编号:30432099 阅读:32 留言:0更新日期:2021-10-24 17:26
本发明专利技术属于遥感图像处理技术领域,具体公开了一种基于可解释深度学习的遥感图像跨域分类方法,包括深度特征提取的步骤;和构建基于因果平衡的深度因果平衡模型DCBM和平衡损失函数的步骤;其中,所述的深度因果平衡模型DCBM的混杂平衡损失L

【技术实现步骤摘要】
基于可解释深度学习的遥感图像跨域分类方法


[0001]本专利技术属于遥感图像分类
,特别涉及基于可解释深度学习的遥感图像跨域分类方法。

技术介绍

[0002]遥感图像分类在数字图像分类处理中是一个很重要的应用方向,无论是信息的提取、动态变化的监测或是遥感数据库的建立都离不开遥感图像的分类。与普通图像的分类算法有很多相同之处,但也因遥感图像自身的成像特点而有所差异。由于卫星传感设备的多样性,遥感图像采集过程中存在尺度、噪声的差异,加之地表覆盖的复杂性,干扰因素几乎分布在每个样本中,使得不同数据集数据分布的差异性显著,从而导致在分类过程中从一个环境或场景中学习的模型难以泛化到其他环境和场景。遥感图像跨域分类存在的挑战有:1)开放域数据分布不一致,2)类别分布不平衡和类间差异不显著。前者需要构建基于可解释的深度因果推理模型,后者需要针对类别分布不平衡和类间差异不显著的特点进行损失设计。
[0003]在普通图像目标域分布未知的条件下,针对源域和目标域的样本分布差异,CRLR算法中曾提出了一种基于因果关系的全局样本平衡机制,该方法通过联合因果平衡机制和逻辑回归来实现对不可知目标域的分类,其优化目标如下式所示。平衡机制的作用就是识别因果特征,去除跨域分类过程中“混杂因素”对结果的干扰,从而引导模型实现可解释的鲁棒预测。
[0004][0005]在上述公式中,n为样本数,p为样本特征量,其中i的取值范围为{1,2

n},j的取值范围为{1,2

p},k的取值范围为{1,2

n},X为样本特征向量,x为单个样本特征,Y为样本标签,β为衡量样本特征的因果贡献度的参数。W为样本权重向量,I为样本状态向量,其中状态向量取值为0或者1。以j=1为例,此时将X第1列设置为0,此时的特征向量变为X
‑1。随机设置状态向量值,并根据状态向量值将所有样本随机分为两组。对这两组特征分布分别进行W加权,再进行正则化处理,并最小化两组特征分布的差值,差值越小代表样本分布越平衡。最终依次对所有特征进行加权正则化处理,使得全局样本特征处于平衡分布状态。在全局分布平衡的样本特征空间进行因果特征学习,并使用β来衡量样本特征贡献度,最终基于β值学习不可知鲁棒分类器。
[0006]将上述方法直接应用存在以下局限:第一,数据规模的局限性,受制于模型计算效率,该方法在规模相对较小的图像分类中有效,然而却不利于大规模图像分类任务。第二,
数据维度的局限性,逻辑回归分类模型不能满足更具表现力的高维语义特征的提取。
[0007]因此,需要针对因果平衡机制,设计一种适用于大规模图像数据集和深度学习框架的分类模型。

技术实现思路

[0008]针对现有技术存在的不足,本专利技术提供一种基于可解释深度学习的遥感图像跨域分类方法,通过设计深度学习框架下的因果推理方法,构建鲁棒性的遥感图像分类模型,摆脱对目标域数据分布的依赖,满足开放域场景下模型的有效迁移。1)针对开放域数据分布不一致的挑战,通过研究开放域图像分类模型的泛化方法,构建了基于因果平衡的深度学习图像分类鲁棒模型DCBM;2)针对遥感图像类别分布不平衡和类间差异不显著的挑战,通过研究类别平衡和类间扩距机制,设计了融合聚焦损失和间隔损失的目标函数;3)通过融合因果平衡模型和目标函数,提出了面向开放域遥感图像鲁棒分类的深度神经网络模型和训练算法DCBM

FA。
[0009]为了解决上述技术问题,本专利技术采用的技术方案是:
[0010]基于可解释深度学习的遥感图像跨域分类方法,包括深度特征提取的步骤;和构建基于因果平衡的深度因果平衡模型DCBM和平衡损失函数的步骤;
[0011]其中,所述的深度因果平衡模型DCBM的混杂平衡损失L
B
融合了聚焦损失L
F
、间隔损失L
M
,构成平衡损失函数,由此构建面向开放域遥感图像鲁棒分类的深度神经网络模型和训练算法DCBM

FA。
[0012]进一步的,所述的深度因果平衡模型DCBM的因果平衡机制为:最小化混杂平衡损失、平衡混杂特征,提升抽取因果特征能力,具体为:
[0013]基于控制变量法则和样本平衡机制,在高维特征空间进行因果平衡处理,设计基于因果平衡的深度学习批处理训练方法,通过采用批量样本因果平衡加权后的损失代替传统的交叉熵损失,实现深度因果平衡模型DCBM模型参数的升级迭代;具体实现如下:
[0014]设E(x)为待训练的特征提取器,存在:
[0015]F
s
=E(X
s
)
ꢀꢀ
(1)
[0016]基于控制变量法则,在特征空间中对样本特征向量F
S
进行加权正则化处理,数学模型如下式所示:
[0017][0018]最初为每个样本都设置一个初始平衡权值w
bi
和一个状态值s
i
,分别构成一组权重向量W
B
和一组状态向量S,并把w
bi
初始化为0,s
i
取0或1;在式(2)中,当F
s
第j个特征设置为处理变量时,F
s

j
为去除处理变量的剩余变量,此时F
s
第j列设置为0;S
j
是F
s
第j列的状态值,并且有s
ij
为第i个样本第j个特征的状态值;W
B
是F
s
第j列的权重值,并且有w
bi
为第i个样本的权重值;
[0019]所述的混杂平衡损失L
B
公式为:
[0020][0021]上述公式(3)中,m为样本特征数量,j的取值范围为{1,2

m},F
s
是样本特征向量,S
j
是样本状态向量,W
B
是样本权重向量,λ1是超参数;
[0022]通过公式(3)求解一组最优样本权重值,对样本损失进行重新加权后进行深度因果平衡模型DCBM模型优化,完成模型训练。
[0023]对于深度因果平衡模型DCBM的损失函数如式(4)所示,其保留了经典的交叉熵损失函数,在全局分布平衡的样本特征空间进行因果特征学习,并使用β来衡量样本特征贡献度,最终基于β值学习不可知鲁棒分类器,
[0024][0025]其中n是样本数,c为类别数量,W是网络权重向量,y
i
表示第i个样本的标签,F
si
表示第i个样本的特征向量;是第i个样本的目标逻辑,β为衡量样本特征的因果贡献度的参数,β值越大证明特征的因果贡献值越大。
[0026]进一步的,所述的聚焦损失L
F
公式如下所示:
[0027][0028]其中,c为样本类别,

lo本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于可解释深度学习的遥感图像跨域分类方法,其特征在于,包括深度特征提取的步骤;和构建基于因果平衡的深度因果平衡模型DCBM和平衡损失函数的步骤;其中,所述的深度因果平衡模型DCBM的混杂平衡损失L
B
融合了聚焦损失L
F
、间隔损失L
M
,构成平衡损失函数,由此构建面向开放域遥感图像鲁棒分类的深度神经网络模型和训练算法DCBM

FA。2.根据权利要求1所述的基于可解释深度学习的遥感图像跨域分类方法,其特征在于,所述的深度因果平衡模型DCBM的因果平衡机制为:最小化混杂平衡损失、平衡混杂特征,提升抽取因果特征能力,具体为:基于控制变量法则和样本平衡机制,在高维特征空间进行因果平衡处理,设计基于因果平衡的深度学习批处理训练方法,通过采用批量样本因果平衡加权后的损失代替传统的交叉熵损失,实现深度因果平衡模型DCBM模型参数的升级迭代。具体实现如下:设E(x)为待训练的特征提取器,存在:F
s
=E(X
s
)
ꢀꢀꢀꢀꢀ
(1)基于控制变量法则,在特征空间中对样本特征向量F
S
进行加权正则化处理,数学模型如下式所示:最初为每个样本都设置一个初始平衡权值w
bi
和一个状态值s
i
,分别构成一组权重向量W
B
和一组状态向量S,并把w
bi
初始化为0,s
i
取0或1;在式(2)中,当F
s
第j个特征设置为处理变量时,F
s

j
为去除处理变量的剩余变量,此时F
s
第j列设置为0;S
j
是F
s
第j列的状态值,并且有s
ij
为第i个样本第j个特征的状态值;W
B
是F
s
第j列的权重值,并且有w
bi
为第i个样本的权重值;所述的混杂平衡损失L
B
公式为:上述公式(3)中,m为样本特征数量,j的取值范围为{1,2

m},F
s
是样本特征向量,S
j
是样本状态向量,W
B
是样本权重向量,λ1是超参数;通过公式(3)求解一组最优样本权重值,对样本损失进行重新加权后进行深度因果平衡模型DCBM模型优化。3.根据权利要求2所述的基于可解释深度学习的遥感图像跨域分类方法,其特征在于,对于深度因果平衡模型DCBM的损失函数如式(4)所示,其保留了经典的交叉熵损失函数,在全局分布平衡的样本特征空间进行因果特征学习,并使用β来衡量样本特征贡献度,最终基于β值学习不可知鲁棒分类器,
其中n是样本数,c为类别数量,W是网络权重向量,y
i
表示第i个样本的标签,F
si
表示第i个样本的特征向量;是第i个样本的目标逻辑,β为衡量样本特征的因果贡献度的参数,β值越大证明特征的因果贡献值越大。4.根据权利要求2所述的基于可解释深度学习的遥感图像跨域分类方法,其特征在于,所述的聚焦损失L
...

【专利技术属性】
技术研发人员:聂婕王含魏志强付煜杨启成王瑞
申请(专利权)人:中国海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1