当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于特征空间组合的小样本类增量学习方法技术

技术编号:26343482 阅读:70 留言:0更新日期:2020-11-13 20:45
本发明专利技术公开了一种基于特征空间组合的小样本类增量学习方法,方法具体包括以下步骤:连续获取多个任务的数据流,在每个类增量学习会话中只能获得一个任务的数据,定义方法目标;在第一个类增量学习会话中,获取第一个任务的数据,学习得到基任务网络模型;在下一个类增量学习会话中,获取新任务数据,更新当前网络模型;每次类增量学习会话后,通过基任务网络模型得到基任务特征空间,通过当前网络模型得到终身学习特征空间,对两个空间进行组合,得到一个组合特征空间,利用组合空间进行分类。本发明专利技术能够构建一个有效的组合特征空间,很好地平衡旧知识保留和新知识适应,同时实现简单,是一个既有效并且实用简单的小样本类增量学习方法。

【技术实现步骤摘要】
一种基于特征空间组合的小样本类增量学习方法
本专利技术涉及深度网络模型的增量学习领域,尤其涉及一种基于特征空间组合的小样本类增量学习方法。
技术介绍
最近几年来,持续学习(也称为增量学习或终身学习)受到了广泛的关注,由于具有持续学习能力的深度网络模型有很多实际应用场景。在原理上来说,持续学习目的在于使得一个学习器从新数据中获得新知识的同时能够保留从之前数据中已经学习得到的旧知识。持续学习通常在任务增量学习或者类增量学习场景下进行的。类增量学习情景是更具有挑战性的场景,因为任务的标签信息在测试的过程中是不允许的。实际上,在新任务中的知识经常通过非常少数量的样本表示。为了满足这一实际需求,小样本类增量学习受到了很多关注,主要涉及了基任务(拥有大规模训练数据的第一个任务)和一系列新任务(包含有限的样本)的学习部件。在这个学习场景中,它追求动态地获得一个统一的具有判别力的特征空间,能够同时保留从基任务获得的知识和表征新任务中的知识。作为结果来说,它通常陷入到旧知识遗忘(在一系列新任务后)和新样本过拟合(有限样本)的困境中。因此,本文关注构建一个有效的表本文档来自技高网...

【技术保护点】
1.一种基于特征空间组合的小样本类增量学习方法,其特征在于,包括以下步骤:/nS1、连续获取多个任务的数据流,在每个类增量学习会话中只能获得一个任务的训练数据集;/nS2、在第一个类增量学习会话中,以基任务作为第一个任务的训练数据集,学习得到基任务网络模型;/nS3、在下一个类增量学习会话中,以新任务的训练数据集,更新前一个类增量学习会话中训练得到的网络模型;/nS4:完成一个类增量学习会话后,通过基任务网络模型得到基任务特征空间,通过当前网络模型得到终身学习特征空间,对两个空间进行组合,得到一个组合特征空间,利用组合空间进行分类;/nS5:当存在新任务的训练数据集时,重复S3和S4,利用新数...

【技术特征摘要】
1.一种基于特征空间组合的小样本类增量学习方法,其特征在于,包括以下步骤:
S1、连续获取多个任务的数据流,在每个类增量学习会话中只能获得一个任务的训练数据集;
S2、在第一个类增量学习会话中,以基任务作为第一个任务的训练数据集,学习得到基任务网络模型;
S3、在下一个类增量学习会话中,以新任务的训练数据集,更新前一个类增量学习会话中训练得到的网络模型;
S4:完成一个类增量学习会话后,通过基任务网络模型得到基任务特征空间,通过当前网络模型得到终身学习特征空间,对两个空间进行组合,得到一个组合特征空间,利用组合空间进行分类;
S5:当存在新任务的训练数据集时,重复S3和S4,利用新数据对网络模型进行学习。


2.根据权利要求1所述的基于特征空间组合的小样本类增量学习方法,其特征在于,所述S1中,所述的类增量学习会话定义如下:
从当前任务的数据到达后至下一个任务的数据到达的时间间隔是一个类增量学习会话;
所述多个任务的数据流定义如下:
数据流D由N个训练数据集构成,D={D(1),D(2),…,D(N)},其中第t个任务的训练数据集为D(t),D(t)仅在第t个类增量学习会话中被获取到并用于模型的训练学习,在小样本类增量学习中D(1)为基任务数据;C(t)是第t个任务数据的类别集合,不同任务间包含的数据类别没有重叠。


3.根据权利要求1所述的一种基于特征空间组合的小样本类增量学习方法,其特征在于,所述小样本类增量学习方法的目标定义为:在每个类增量学习会话中,更新模型,以平衡旧知识保留和新知识适应,在所有已经出现过的类别数据中实现样本分类。


4.根据权利要求1所述的一种基于特征空间组合的小样本类增量学习方法,其特征在于,所述S2中,所述的基任务网络模型是由嵌入网络和最近类均值分类器组成的图像分类模型;所述嵌入网络作为特征提取器,用于将一个给定的样本映射到一个表征空间,在该表征空间中样本间的距离表示样本间的语义差异;训练得到嵌入网络后,用所述最近类均值分类器对样本进行分类;
所述的基任务网络模型中,仅有嵌入网络是可学习的,所述嵌入网络在学习过程中,以最小化度量学习损失为目的。


5.根据权利要求4所述的一种基于特征空间组合的小样本类增量学习方法,其特征在于,所述的度量学习损失采用三元组损失



其中d+表示代表样本xa和正样本xp的特征之间的欧式距离,d-表示代...

【专利技术属性】
技术研发人员:李玺赵涵斌傅永健励雪巍
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1