【技术实现步骤摘要】
本专利技术属于机器学习模型领域,涉及一种于知识桥接和类别锚定的类增量学习方法。
技术介绍
1、近年来,机器学习模型在自然语言处理和计算机视觉等各个领域都取得了显著的成就。在某些情况下,深度学习模型在特定任务上的表现甚至超过了人类。然而,对于深度神经网络(dnns)来说,让其能力进一步泛化,在新任务上训练模型,往往会导致灾难性遗忘。即模型倾向于忘记先前所学的知识为了缓解这一问题,增量学习被提出并且越来越受到人们的关注。
2、类增量学习作为增量学习的课题之一。目标是让图像分类模型以顺序方式学习新类别的知识,确保模型在尽量减少之前任务遗忘的情况下最大化所有任务的能力。为了缓解灾难性遗忘,研究人员提出了不同的方法。这些方法可以分为两类:基于网络扩展的方法和以及基于回放的方法。基于网络扩展的方法通过动态更新网络结构使模型适应多个任务。这些方法通常需要拓展模块或存储额外的参数来适应新任务。例如,der通过扩展特征提取器以适应顺序任务,并采用一种通道级别的掩码策略,从扩展模块中删除冗余参数,防止模型膨胀。foster通过采用两阶段学习策略
...【技术保护点】
1.一种基于知识桥接和类别锚定的类增量学习方法,其特征在于,所述方法包括以下步骤:
2.如权利要求1所述的一种基于知识桥接和类别锚定的类增量学习方法,其特征在于,所述步骤S22中,知识桥接的目标是用模型已经学习过的旧类别特征来学习新类别,在学习新任务时,图像分类模型会学习旧类别和新类别的关联特征,并通过关联特征来学习和记忆新类别,以确保旧类别在模型学习新类别参数更新时,其特征得以保留,不会发生灾难性遗忘的问题;首先,通过先前的图像分类模型Mt-1提取新任务图像数据x的特征该特征作为硬目标,表示使用旧类别特征表征新类的表征结果,然后,通过当前的图像分类模型M
...【技术特征摘要】
1.一种基于知识桥接和类别锚定的类增量学习方法,其特征在于,所述方法包括以下步骤:
2.如权利要求1所述的一种基于知识桥接和类别锚定的类增量学习方法,其特征在于,所述步骤s22中,知识桥接的目标是用模型已经学习过的旧类别特征来学习新类别,在学习新任务时,图像分类模型会学习旧类别和新类别的关联特征,并通过关联特征来学习和记忆新类别,以确保旧类别在模型学习新类别参数更新时,其特征得以保留,不会发生灾难性遗忘的问题;首先,通过先前的图像分类模型mt-1提取新任务图像数据x的特征该特征作为硬目标,表示使用旧类别特征表征新类的表征结果,然后,通过当前的图像分类模型mt提取新任务图像数据x的特征接着,对特征输出除以温度参之后,再做softmax变换,得到软化的概率分布,最后,对软目标和硬目标所对应的交叉熵求加权平均,鼓励当前图像分类模型的新类特征分布与先前的图像分类模型的特征分布对齐,从而实现了新旧类的知识桥接,缓解了灾难性遗忘问题。
3.如权利要求2所述的一种基于知识桥接和类别锚定的类增量学习...
【专利技术属性】
技术研发人员:郭东岩,钱冠予,吴康惠,胡宇翔,崔滢,汪晓妍,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。