空中目标检测增量学习方法、装置及介质制造方法及图纸

技术编号:42498121 阅读:28 留言:0更新日期:2024-08-22 14:09
本发明专利技术公开一种空中目标检测增量学习方法、装置及介质,其中方法包括:获取数据集,所述数据集包括空中目标数据,构建初始模型和增量模型,初始化所述增量模型;选取伪标签,得到知识蒸馏标签集,并利用改进的KD损失对增量模型进行训练;构建保持类别分布的增量训练阶段回放样本数据集,得到回放样本数据集;基于所述回放样本数据集,对训练后的增量模型进行调整。本发明专利技术通过从旧模型中选择性地忽略背景预测,并选择高置信度的前景预测,并将其用作伪标签,来使新知识和旧知识以结构化的方式融合,避免它们与新类别标签产生相互矛盾的监督。

【技术实现步骤摘要】

本专利技术涉及目标识别,更具体地,涉及一种空中目标检测增量学习方法、装置及介质


技术介绍

1、最新的基于transformer结构的目标检测模型detr系列取得了sota的表现,但是现有的增量学习方法直接应用在这类模型上效果不佳。

2、增量学习算法可分为两大类,分别为知识蒸馏方法和样本回放方法。知识蒸馏(knowledge distillation,kd)试图通过在新模型中匹配旧模型的logits、特征图或其他信息来保留前一版本模型中获得的知识。样本回放(exemplar replay,er)方法从旧的训练阶段中建立一个样本库,并在后边持续的训练阶段中回放它们,作为回忆过去知识的一种方式,使新模型得以保留旧模型的知识。下边以lwf算法和icarl算法为例来分别介绍这两种增量学习算法。

3、无遗忘学习(learning without forgetting,简称lwf)是一项深度学习领域的重要研究成果,该方法由李飞飞等人于2016年在欧洲计算机视觉大会(eccv)上提出。lwf算法是一种适用于增量学习场景的方法,能够在新任务上仅利用本文档来自技高网...

【技术保护点】

1.一种空中目标检测增量学习方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,获取数据集,构建初始模型和增量模型,初始化所述增量模型,包括:

3.根据权利要求1所述的方法,其特征在于,选取伪标签,得到知识蒸馏标签集,并利用改进的KD损失对增量模型进行训练,包括:

4.根据权利要求3所述的方法,其特征在于,选择K个置信度最高的初始模型前景预测,形成一个标签子集,并进一步将预测标签子集限制为与新类别的真实数据标签的重叠度低于设定阈值的子集,得到一组经过过滤的伪标签,包括:

5.根据权利要求3所述的方法,其特征在于,通过...

【技术特征摘要】

1.一种空中目标检测增量学习方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,获取数据集,构建初始模型和增量模型,初始化所述增量模型,包括:

3.根据权利要求1所述的方法,其特征在于,选取伪标签,得到知识蒸馏标签集,并利用改进的kd损失对增量模型进行训练,包括:

4.根据权利要求3所述的方法,其特征在于,选择k个置信度最高的初始模型前景预测,形成一个标签子集,并进一步将预测标签子集限制为与新类别的真实数据标签的重叠度低于设定阈值的子集,得到一组经过过滤的伪标签,包括:

5.根据权利要求3所述的方法,其特征在于,通过如下公式将所述增量模型的结果预...

【专利技术属性】
技术研发人员:李佳怡李劼罗荣周汉南李选李剑
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1