一种基于持续学习的图像分类方法及图像分类装置制造方法及图纸

技术编号:36773015 阅读:27 留言:0更新日期:2023-03-08 21:51
本申请提供了一种基于持续学习的图像分类方法及图像分类装置,包括:基于图像分类模型,确定目标图像的图像类别;图像分类模型通过以下步骤被训练得到:针对任意一个模型训练任务,在按照该模型训练任务对初始图像分类模型进行每轮训练的过程中:判断该模型训练任务在该轮训练时的任务信息是否已进入预设可信区域;若已进入,则按照第一预定方式对初始图像分类模型中前一轮训练得到的每一层对应的投影矩阵进行更新;若未进入,则按照第二预定方式对前一轮训练得到的每一层对应的投影矩阵进行更新;最终确定该轮训练得到的投影矩阵。这样,能够提升训练好的图像分类模型在应用于识别未知类别的图像时,图像分类的准确率和稳定性。和稳定性。和稳定性。

【技术实现步骤摘要】
一种基于持续学习的图像分类方法及图像分类装置


[0001]本申请涉及深度学习
,尤其是涉及一种基于持续学习的图像分类方法及图像分类装置。

技术介绍

[0002]近来,随着深度学习的发展,神经网络模型被广泛地应用于语音识别、图像分类和目标检测等领域。其中,在图像分类领域,神经网络模型已取得了很多研究成果,在很多情况下已实现接近人类的识别速度和识别准确率。
[0003]然而,神经网络模型不像人类一样具有持续学习能力,即不能够将一个任务的知识用到后一个任务上,并且学习后一个任务时也不会忘记前一个任务。神经网络模型在学习新的任务时,会遗忘先前任务学习到的知识,使得训练好的图像分类模型在应用于识别未知类别的图像时,图像分类的准确率不稳定,在部分图像类别上的分类准确率很低,导致图像分类失败。此外,神经网络模型在训练过程中会不断学习输入数据和输出数据之间的映射关系,而在学习的早期阶段神经网络模型学习到的知识不够准确,这样的知识带来了误导信息,并将误导信息持久地保存在模型中,导致训练好的图像分类模型性能不佳并影响图像分类的准确性。
专利技本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于持续学习的图像分类方法,其特征在于,所述方法包括:将待分类的目标图像输入预先训练好的图像分类模型,确定所述目标图像的图像类别;其中,所述图像分类模型通过以下步骤被训练得到:依次获取持续学习条件下的多个模型训练任务;依次按照每个模型训练任务对初始图像分类模型进行多轮训练,得到训练好的所述图像分类模型;其中,针对任意一个模型训练任务,在按照该模型训练任务对所述初始图像分类模型进行多轮训练中的每轮训练的过程中:判断该模型训练任务在该轮训练时初始图像分类模型中每一层对应的投影矩阵的任务信息是否已进入预设可信区域;其中,每一层对应的初始投影矩阵为矩阵规模与所述初始图像分类模型的模型参数规模相同的单位矩阵;投影矩阵用于在反向传播时更新所述初始图像分类模型的模型参数;若在该轮训练时所述初始图像分类模型中该层对应的投影矩阵的任务信息已进入预设可信区域,则按照第一预定方式,根据经前一轮训练得到的所述初始图像分类模型中该层对应的投影矩阵,确定该轮训练得到的该层对应的投影矩阵。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:若在该轮训练时所述初始图像分类模型中该层对应的投影矩阵的任务信息未进入预设可信区域,则按照第二预定方式,根据经前一轮训练得到的所述初始图像分类模型中该层对应的投影矩阵,确定该轮训练得到的该层对应的投影矩阵。3.根据权利要求1所述的方法,其特征在于,每个模型训练任务包括该模型训练任务对应的预设总训练轮数和预设轮数阈值;所述判断该模型训练任务在该轮训练时初始图像分类模型中每一层对应的投影矩阵的任务信息是否已进入预设可信区域,包括:获取该模型训练任务在该轮训练时每一层对应的投影矩阵的任务信息;所述任务信息包括该轮训练时对应的训练轮数;若所述该轮训练时对应的训练轮数与所述预设总训练轮数之间的差值小于所述预设轮数阈值,则判断该模型训练任务在该轮训练时每一层对应的投影矩阵的任务信息均已进入预设可信区域。4.根据权利要求1所述的方法,其特征在于,每个模型训练任务包括该模型训练任务对应的预设损失值阈值或该模型训练任务中每一层对应的预设梯度阈值;所述判断该模型训练任务在该轮训练时初始图像分类模型中每一层对应的投影矩阵的任务信息是否已进入预设可信区域,包括:获取该模型训练任务在该轮训练时每一层对应的投影矩阵的任务信息;所述任务信息包括该轮训练时对应的损失值或者通过反向传播得到的每一层的梯度矩阵;若所述该轮训练时对应的损失值小于所述预设损失值阈值,则判断该模型训练任务在该轮训练时每一层对应的投影矩阵的任务信息均已进入预设可信区域;或者,若每一层的梯度矩阵中每个元素的绝对值之和小于该层对应的预设梯度阈值,则判断该模型训练任务在该轮训练时该层对应的投影矩阵的任务信息已进入预设可信区域。5.根据权利要求2所述的方法,其特征在于,每个模型训练任务包括该模型训练任务中每一层对应的梯度范数的比值阈值;所述判断该模型训练任务在该轮训练时初始图像分类
模型中每一层对应的投影矩阵的任务信息是否已进入预设可信区域,包括:针对所述初始图像分类模型中每一层对应的投影矩阵,获取该模型训练任务在该轮训练时该层对应的投影矩阵的任务信息;所述任务信息包括该轮训练中该层对应的第一范数和第二范数的比值;所述第一范数为投影后该层对应的投影矩阵与当前梯度之积的范数;所述第二范数为所述当前梯度的范数;若所述比值小于该层对应的梯度范数的比值阈值,则判断该模型训练任务在该轮训练时该层对应的投影矩阵的任务信息已进入预设可信区域。6.根据权利要求1所述的方法,其特征在于,每个模型训练任务还包括该模型训练任务对应的样本图像集和图像标签;所述按照第一预定方式,根据经前一轮训练得到的所述初始图像分类模型中该层对应的投影矩阵,确定该轮训练得到的该层对应的投影矩阵,包括:将该模型训练任务对应的样本图像集打乱分割成多个样本图像子集;针对任意一个样本图像子集,基于该样本图像子集和使用前一个样本图像子集更新得到的该层对应的投影矩阵,确定使用该样本图像子...

【专利技术属性】
技术研发人员:赵旭鹰赵星于连源姚越宇梁小涛
申请(专利权)人:首都师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1