【技术实现步骤摘要】
一种基于自保持表征扩展的类增量学习的图像分类方法
[0001]本专利技术属于类增量学习领域,具体来说是一种基于自保持表征扩展的类增量学习的图像分类方法。
技术介绍
[0002]近年来,由于深度神经网络在完全监督的条件下取得了巨大的进步,研究的注意力越来越多地转向学习的其他方面。一个重要的研究方面是随着输入流的更新而不断学习新任务的能力,其在实际应用中经常发生。类增量学习是持续学习中十分具有挑战性的任务,已吸引了诸多学者的关注。该任务旨在不遗忘已学习过的旧类知识条件下,准确识别新的类别。
[0003]针对该场景,在每个阶段重新联合训练新、旧两类样本特别费时、费力。此外,旧类样本存在不可完全获取的状况,进一步阻碍了该方法的使用。一个简单的替代方法是使用新类对网络进行微调,然而,这将导致灾难性的遗忘问题。即在优化过程中,整个表征和分类器会偏向于新的类别,导致旧有类别性能的急剧下降。为了处理上述问题,一些工作开始尝试通过保留一些有代表性的样本和引入各种蒸馏损失以维持过去的知识,并通过校准分类器纠正由数量不平衡引起的偏差问题。
[0004]最近的类增量方法大致可以划分为两类:基于记忆保存和结构动态扩增的方法。前者假定内存中能够存储一定数量(比如2,000个)的旧类样本,通过对齐所有样本在新旧网络中的特征或输出分布,以及修正新旧类数据的数目的不平衡来共同维持旧类的分类性能。然而在图像分类网络的实际场景中,由于用户隐私或设备限制,通常很难存在保存旧类图片样本的机会。该事实给基于记忆保存的方法带来了巨大的挑战,新类别 ...
【技术保护点】
【技术特征摘要】
1.一种基于自保持表征扩展的类增量学习的图像分类方法,其特征在于,包括如下步骤:步骤一、初始分类网络的构建和优化:步骤1.1、获取初始阶段已知类别的图像样本并进行归一化处理,获得第一阶段的图像集其中,表示初始阶段第k个类别中的第i个图像样本,表示初始阶段第k个类别中的第i个图像样本的类别标签,K代表图像集包含的类别数目,N
k
代表第k个类别的样本数目;步骤1.2、构建以ResNet
‑
18深度学习网络为基础的初始分类网络F:所述ResNet
‑
18深度学习网络包括5个阶段,其中,第1个阶段Stage 0由一个卷积核为n1
×
n1的卷积层,一个批量归一化处理层,一个ReLU激活函数层组成,其余4个阶段均由2个Basicblock模块组成,每个Basicblock模块依次由一个卷积核为n2
×
n2的卷积层,一个ReLU激活函数层,一个卷积核为n2
×
n2的卷积层组成;将所述ResNet
‑
18深度学习网络直接作为初始分类网络F的特征提取部分f;并用一个全连接层作为初始分类网络F的分类器部分g;步骤1.3、训练优化所述初始分类网络F:将第一阶段的图像集D1按批次送入初始分类网络F,并依次经过特征提取部分f和分类器部分g的处理后,输出预测类别标签,从而按照式(1)计算交叉熵损失L
cross
,并使用梯度下降算法优化所述初始分类网络F中所有的参数,从而得到训练好的初始分类网络F':式(1)中,x
j
表示第一阶段的图像集D1中的第j个图像样本,表示第j个图像样本x
j
的指示函数,若x
j
的类别标签y
j
与k相等,则令否则,令N代表K个类别所有样本的数目;步骤1.4、原型保存:对于训练好的初始分类网络F',将第一阶段的图像集D1逐类别送入训练后的特征提取部分f',并对各个类别的输出取平均后,将平均结果作为各类原型{p1,
…
,p
k
,
…
,p
k
}保存到增量阶段;p
k
表示第k类原型;步骤二、增量阶段的特征提取器结构扩展:步骤2.1、获取增量阶段中第h阶段的图像样本并进行归一化处理,得到第h阶段的图像集其中,表示第h阶段第k个类别中的第i个图像样本,表示第h阶段第k个类别中的第i个图像样本的类别标签,K
h
为第h阶段新增的图像类别数目,且D
h
和其余h
‑
1阶段的图像集中所有类别均不相同;步骤2.2、网络的增量结构扩展:在所述训练后的特征提取部分f'中的每个卷积层上均并联一个残差适应器,所述残差适应器包括一个n3
×
n3卷积层,构成第h阶段的增量扩增的特征提取部分f
h
;在训练后的分类器部分g'的全连接层中添加K
h
个输出结点,构成第h阶段的增量扩增的
分类器部分g
h
,从而与f
h
一起构成第h阶段的增量扩增网络F
h
;步骤三、基于原型选择策略的表征优化:步骤3.1、原型度量:将第h阶段的图像集D
h
中的图像依次送入到第h阶段的增量扩增的特征提取部分f
...
【专利技术属性】
技术研发人员:查正军,曹洋,翟伟,朱凯,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。