【技术实现步骤摘要】
基于分布外检测的图像类增量学习方法及系统
[0001]本专利技术涉及图像分类
,特别是涉及基于分布外检测的图像类增量学习方法及系统
。
技术介绍
[0002]本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
,并不必然构成现有技术
。
[0003]连续学习的目的是使深度模型适应现实世界的任务
。
当遇到新类别时,深度模型应具有学习新知识的能力,同时保留先前获得的知识
。
连续学习的主要挑战是解决灾难性遗忘
(catastrophic forgetting)
,这是指当深度模型学习新任务时,模型会忘记其先前的知识,显著降低旧任务的性能
。
[0004]连续学习有三种主要场景:域增量学习
、
任务增量学习和类增量学习
。
域增量学习专注于学习具有不同域分布的相同类别集合,例如同一类别的真实世界
/
动画版本
。
模型可以学习跨域不变的信息,并在分布不同的情况下进行预测 />。
任务本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
基于分布外检测的图像类增量学习方法,其特征是,包括:
S101
:获取待检测图像以及训练后的分类器列表
C
;
S102
:取出训练后的分类器列表
C
中的最后一个分类器,将取出的分类器的输入端与图像特征提取器的输出端连接得到最后一个图像学习模型,将待检测图像输入到最后一个图像学习模型中,输出待检测图像的图像类别,如果待检测图像的图像类别为分布外类别,则进入
S103
,如果待检测图像的图像类别为分布内类别,则进入
S104
;
S103
:按照从后到前的顺序,取出训练后分类器列表
C
中的下一个分类器,将取出的分类器的输入端与图像特征提取器的输出端连接得到新的图像学习模型,将待检测图像输入到新的图像学习模型中,输出待检测图像的图像类别,如果待检测图像的图像类别为分布外类别,则继续取出训练后分类器列表
C
的下一个分类器,并对下一个分类器执行相同操作,如果待检测图像的图像类别为分布内类别,则进入
S104
;如果训练后的分类器列表
C
为空,则进入
S105
;
S104
:将待检测图像的文本描述输入到训练后的文本特征提取器中,输出待检测图像的文本特征;计算文本特征与图像特征提取器所求的图像特征之间的相似度,分析相似度最高的文本特征对应的类别是否属于分布内类别,如果属于分布内类别,则表示待检测图像的图像类别为分布内类别;如果不属于分布内类别,就返回
S103
;
S105
:将分类器列表
C
中的第一个分类器的分类结果作为最终的结果输出
。2.
如权利要求1所述的基于分布外检测的图像类增量学习方法,其特征是,所述训练后的文本特征提取器,训练过程包括:构建训练集,所述训练集为已知分类标签的图像和文本描述,图像和文本描述之间存在一一对应关系;将已知分类标签的图像输入到图像特征提取器中,输出图像特征;将已知分类标签的文本描述输入到文本特征提取器中,输出文本特征;计算同一类别标签下的图像特征与文本特征之间的相似度,使相似度达到最大值,得到训练后的文本特征提取器
。3.
如权利要求1所述的基于分布外检测的图像类增量学习方法,其特征是,所述分类器列表
C
中的第一个分类器,在训练的过程中,训练集的所有标签均为已知标签,没有分布外类别标签
。4.
如权利要求1所述的基于分布外检测的图像类增量学习方法,其特征是,所述训练后的分类器列表
C
,获取过程包括:
S101
‑1:构建图像特征提取器,构建分类器,将图像特征提取器的输出端与分类器的输入端连接,得到图像学习模型;
S101
‑2:构建初始训练集,所述初始训练集,包括已知类别标签的
m
个类别的图像;所述
m
个类别的图像,是从
cifar100
数据集中进行随机筛选得到的;
S101
‑3:利用初始训练集对图像学习模型进行初始训练,初始训练的过程中,保持图像特征提取器的参数不变,使用梯度下降法对分类器的参数进行更新,每个批次输入
N
张图像,让所有训练图像全部训练
n
遍,得到初始训练后的分类器,将初始训练后的分类器保存到训练后的分类器列表
C
中;每次训练完一个分类器后,为每个类别的所有图像计算图像特征向量的平均值,在同
一个类别下,选择图像特征向量距离平均值...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。