基于动态结构和多层次蒸馏的SAR目标增量识别方法技术

技术编号:39276276 阅读:13 留言:0更新日期:2023-11-07 10:53
本发明专利技术公开了一种基于动态结构和多层次蒸馏的SAR目标增量识别方法,主要解决现有技术任务识别精度低的问题。其实现方案是:获取初始任务训练集和初始任务测试集;构建初始主干网络,利用初始训练集对其进行训练;由训练好的初始主干网络获得初始任务的SAR目标识别结果;构建示例集;从增量任务数据中划分辅助训练集和辅助测试集;构建辅助网络,利用辅助训练集对其进行训练;由训练好的辅助网络构建主干网络,从增量任务数据和示例集数据中划分增量训练集和增量测试集;利用增量训练集训练主干网络,利用训练好的主干网络获取增量测试集的SAR目标识别结果。本发明专利技术减小了增量识别中的灾难性遗忘,提高了识别精度,可用于战场侦察和态势感知。侦察和态势感知。侦察和态势感知。

【技术实现步骤摘要】
基于动态结构和多层次蒸馏的SAR目标增量识别方法


[0001]本专利技术属于雷达遥感
,更进一步涉及一种SAR目标增量识别方法,可用于战场侦察和态势感知。

技术介绍

[0002]合成孔径雷达SAR是一种主动式微波成像传感器,通过发射大时宽

带宽积信号并利用孔径合成获得二维高分辨图像。与光学和红外传感器相比,SAR具有全天时、全天候、作用距离远、穿透力强的独特优势,成为对地观测的重要手段,并广泛应用于军事和民用领域。随着SAR系统的不断完善和SAR成像水平的不断提高,SAR图像解译技术逐渐受到相关领域学者及研究人员的关注。作为其中的难点和关键步骤,对重点目标的精确识别具有重要意义和研究价值。
[0003]传统的SAR目标识别方法主要依据图像的统计信息和物理特性进行手工特征设计和分类器构建,然而,这需要较强的专业知识和专家经验,且算法的精度和灵活性较差,难以在实际应用中达到理想的效果。
[0004]近年来,随着深度学习技术的不断发展,以深度神经网络为主体的目标识别方法在计算机视觉领域取得了重大突破。
[0005]虽然,上述基于深度学习的方法为SAR目标识别提供了可行的途径,然而,与光学图像相比,SAR图像场景更为复杂,不同类别目标的相似性较高,且受相干斑噪声的影响,目标的边缘不清晰,因此依然存在复杂环境不稳健、相似类别难以区分的问题,导致SAR图像识别在面对增量学习任务时更加困难,灾难性遗忘现象更加严重。
[0006]申请号为201711257577.0的专利文献中公开了一种“基于改进卷积神经网络的SAR车辆目标识别方法”,其首先去除训练样本中的每幅图像的背景杂波,并将每幅SAR图像进行裁剪,然后构建基于caffe架构的改进卷积神经网络结构,即将卷积神经网络目标识别部分的分类器设为混合最大边界softmax,最后将裁剪后的训练样本输入改进卷积神经网络中进行训练得到训练好的网络模型,对测试样本进行去除背景杂波及裁剪操作后输入训练好的改进卷积神经网络模型进行测试,得到其识别率。但由于该方法未针对SAR目标增量学习进行相关优化,因此难以适应新目标和新数据,在多场景的增量学习任务中存在严重的灾难性遗忘,不同场景目标互相影响,导致识别率较低。

技术实现思路

[0007]本专利技术的目的在于针对上述现有技术的不足,提出一种基于动态结构和多层次蒸馏的SAR目标增量学习方法,以缓解在多场景增量学习任务中的灾难性遗忘,增强任务内特征的可分性,降低任务间特征混淆,显著提高SAR目标增量学习识别精度。
[0008]本专利技术的技术思路是,通过一种训练辅助网络拓展主干网络的动态结构及多层次蒸馏的训练模式,来提升多场景任务下模型适应新任务、新数据的能力,其实现步骤包括如下:
[0009](1)从初始任务数据中获取多类目标的多幅SAR图像,并对其图像和标签进行随机划分,得到初始任务训练集和初始任务测试集;
[0010](2)构建初始主干网络:
[0011](2a)建立由多个残差块级联组成的初干网络的特征提取器A
init
,用于输出多尺度特征图;
[0012](2b)建立能与特征维度及输出类别匹配的全连接层FC
init

[0013](2c)将特征提取器和全连接层级联组成初始主干网络,并选用交叉熵损失作为其分类损失;
[0014](3)从训练集中随机采样一组SAR图像输入到初始主干网络中计算损失,并通过随机梯度下降算法更新网络参数,直至网络收敛,得到训练好的初干网络。
[0015](4)将初始任务测试集中的SAR图像输入到训练好的初干网络中,得到识别结果;
[0016](5)设置一个空的示例集,根据herding算法从初始任务数据中挑选少于10%的样本放入该示例集中;
[0017](6)从增量任务数据中获取多类目标的多幅SAR图像,并对其图像和标签进行随机划分,得到辅助训练集和辅助测试集;
[0018](7)构建辅助网络:
[0019](7a)建立由多个残差块级联组成的辅助网络的特征提取器A
aux
,用于输出多尺度特征图;
[0020](7b)建立能与新任务特征维度及输出类别匹配的全连接层FC
aux

[0021](7c)将特征提取器与全连接层级联组成辅助网络,选用交叉熵损失作为其分类损失;
[0022](8)从辅助训练集中随机采样一组SAR图像输入到辅助网络中计算损失,基于该损失通过随机梯度下降算法更新网络参数,直至网络收敛,得到训练好的辅助网络;
[0023](9)利用(8)中训练好的辅助网络和步骤(3)中的初干网络,构建主干网络:
[0024](9a)将辅助网络中的特征提取器A
aux
与初干网络中的特征提取器A
init
并联,得到主干网络特征提取器A
new
及其输出的多尺度特征图Y
new

[0025](9b)根据并联后特征提取器的输出维度和分类数目构建新的全连接层FC
new

[0026](9c)用初干网络的全连接层参数初始化(9b)中全连接层部分参数;
[0027](9d)用辅助网络的全连接层参数初始化(9b)中全连接层剩余部分的参数;
[0028](9e)将并联后的特征提取器和新的全连接层级联组成新的主干网络,并使用交叉熵损失新旧模型知识蒸馏损失与特征空间知识蒸馏损失这三个损失作为其分类损失
[0029](10)从增量任务数据和示例集数据中获取多类目标的多幅SAR图像,并对其图像和标签进行随机划分,得到增量训练集和增量测试集;
[0030](11)从增量训练集中随机采样一组SAR图像输入到主干网络中计算其损失,基于该损失通过随机梯度下降算法迭代更新网络参数,直至网络收敛,得到训练好的主干网络;
[0031](12)将增量测试集中的SAR图像输入到训练好的主干网络中,得到识别结果。
[0032]本专利技术与现有技术相比,具有以下优点:
[0033]第一,本专利技术由于设计了一种通过训练辅助网络来拓展主干网络的动态结构,避
免了新知识对旧知识的覆盖,有效提高了模型对新数据、新任务的适应性;
[0034]第二,本专利技术由于通过设计新旧模型的知识蒸馏损失函数将旧模型和辅助模型中的知识迁移到新的主干网络,有效减缓了灾难性遗忘;
[0035]第三,本专利技术由于通过设计基于特征空间的知识蒸馏损失函数利用旧模型的特征提取器引导新的特征提取器学习任务间特征差异,有效提高了SAR目标增量学习过程中不同任务特征的可分性。
[0036]仿真结果表明,本专利技术比现有SAR目标识别方法精度提高了74.76%。
附图说明
[0037]图1为本专利技术的实现流程图;
[0038]图2为本专利技术中构建的初始模型图;
[0039]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于动态结构和多层次蒸馏的SAR目标识别增量学习方法,其特征在于,包括以下步骤:(1)从初始任务数据中获取多类目标的多幅SAR图像,并对其图像和标签进行随机划分,得到初始任务训练集和初始任务测试集;(2)构建初始主干网络:(2a)建立由多个残差块级联组成的初干网络的特征提取器A
init
,用于输出多尺度特征图;(2b)建立能与特征维度及输出类别匹配的全连接层FC
init
;(2c)将特征提取器和全连接层级联组成初始主干网络,并选用交叉熵损失作为其分类损失;(3)从训练集中随机采样一组SAR图像输入到初始主干网络中计算损失,并通过随机梯度下降算法更新网络参数,直至网络收敛,得到训练好的初干网络。(4)将初始任务测试集中的SAR图像输入到训练好的初干网络中,得到识别结果;(5)设置一个空的示例集,根据herding算法从初始任务数据中挑选少于10%的样本放入该示例集中;(6)从增量任务数据中获取多类目标的多幅SAR图像,并对其图像和标签进行随机划分,得到辅助训练集和辅助测试集;(7)构建辅助网络:(7a)建立由多个残差块级联组成的辅助网络的特征提取器A
aux
,用于输出多尺度特征图;(7b)建立能与新任务特征维度及输出类别匹配的全连接层FC
aux
;(7c)将特征提取器与全连接层级联组成辅助网络,选用交叉熵损失作为其分类损失;(8)从辅助训练集中随机采样一组SAR图像输入到辅助网络中计算损失,基于该损失通过随机梯度下降算法更新网络参数,直至网络收敛,得到训练好的辅助网络;(9)利用(8)中训练好的辅助网络和步骤(3)中的初干网络,构建主干网络:(9a)将辅助网络中的特征提取器A
aux
与初干网络中的特征提取器A
init
并联,得到主干网络特征提取器A
new
及其输出的多尺度特征图Y
new
;(9b)根据并联后特征提取器的输出维度和分类数目构建新的全连接层FC
new
;(9c)用初干网络的全连接层参数初始化(9b)中全连接层部分参数;(9d)用辅助网络的全连接层参数初始化(9b)中全连接层剩余部分的参数;(9e)将并联后的特征提取器和新的全连接层级联组成新的主干网络,并使用交叉熵损失新旧模型知识蒸馏损失与特征空间知识蒸馏损失这三个损失作为其分类损失(10)从增量任务数据和示例集数据中获取多类目标的多幅SAR图像,并对其图像和标签进行随机划分,得到增量训练集和增量测试集;(11)从增量训练集中随机采样一组SAR图像输入到主干网络中计算其损失,基于该损失通过随机梯度下降算法迭代更新网络参数,直至网络收敛,得到训练好的主干网络;(12)将增量测试集中的SAR图像输入到训练好的主干网络中,得到识别结果。
2.根据权利要求1所述的方法,其特征在于,步骤(2a)构成初干网络特征提取器A
init
中的每个卷积模块的结构参数如下:该特征提取器A
init
包括5个级联的卷积模块所述的第一个卷积模块由3
×
3标准卷积层、批归一化层、ReLU激活层以及3
×
3最大池化下采样层级联而成;所述的第二个卷积模块由2个输入维度为64,输出维度为64的残差块级联而成;所述的第三个卷积模块由2个输入维度为128,输出维度为128的残差块级联而成;所述的第四个卷积模块由2个输入维度为256,输出维度为256的残差块级联而成;所述的第五个卷积模块由2个输入维度为512,输出维度为512的残差块和一个1
×
1自适应平均池化层级联而成。3.根据权利要求1所述的方法,其特征在于,步骤(2a)中初干网络特征提取器A
init
输出的多尺度特征图表示如下:其中Y
iinit
为第i个卷积模块的输出特征图,是宽和高分别为W和H的SAR图像,是特征提取器A
init
的第i个卷积模块。4.根据权利要求1所述的方法,其特征在于,步骤(2b)中的初干网络全连接层FC
init
的参数及输出,表示如下:初干网络全连接层FC
init
的尺寸参数为:H
init
×
N
init
,其中,H
init
是特征提取器提取的特征的长度,N
...

【专利技术属性】
技术研发人员:白雪茹江凯孟昭晗
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1