【技术实现步骤摘要】
一种基于增量学习的目标检测方法和增量检测模型IODC
[0001]本专利技术涉及图像识别领域
,具体涉及一种基于增量学习的目标检测方法和增量检测模型
IODC。
技术介绍
[0002]真实世界的视觉系统本质上是递增的,人们需要通过观察来学习新的知识,并整合到旧的视觉知识体系中去
。
虽然深度学习在目标检测任务上已经取得了辉煌的成就,但在增量学习场景下,它们会变得十分健忘,并遭受灾难性遗忘的影响,使得模型对于旧任务的性能急剧下降
。
[0003]现阶段,需要解决的增量目标检测模型的两个技术难题包括:
(1)
增量检测模型识别不到图片中潜在的未知类别对象,在增量学习阶段,增量分类任务中的训练图像一定是不重叠的,如图1所示,但是增量检测任务中可能出现同一张图像带有截然不同的标注信息,与增量分类的数据集设置存在较大出入,而传统的检测模型识别不到当前任务以外的类别;
(2)
传统检测器基于
Faster RCNN
等的卷积神经网络框架,其分类层只能输出当前类别集合中所涵盖的类别
。
对于从未明确出现过的一个类别,其分类预测将一直是
0。
即使给出了未知
(Unknown)
类对象的标记,仍然无法在一个类别中再区分细类,对增量目标新类任务细化产生阻碍
。
[0004]目前,中国专利
CN113822368A
一种基于无锚的增量式目标检测方法,在大量含丰富标签 ...
【技术保护点】
【技术特征摘要】
1.
一种基于增量学习的目标检测方法和增量检测模型
IODC
,其特征在于,包括以下步骤:步骤
1、
识别训练图片,构建所述训练图片的文本特征集,获取所述图片的视觉特征,依据所述文本特征集和视觉特征建立图片的全局感知类别文本特征模型;步骤
2、
基于全局感知类别文本特征模型构建用于识别图片中未知类别对象的视觉模型;步骤
3、
融合全局感知类别文本特征模型和视觉模型建立增量目标检测模型
IODC
,基于所述增量目标检测模型
IODC
识别当前任务图片中的潜在对象
。2.
根据权利要求1所述一种基于增量学习的目标检测方法和增量检测模型
IODC
,其特征在于,步骤1所述建立图片的全局感知类别文本特征模型具体包括:步骤
11、
分别识别多个训练图片中所涵盖所有对象的类别名称,将识别的每个类别名称构造类别文本句子,基于所有类别文本句子融合语言模态建立文本特征集;步骤
12、
将步骤
11
所述图片输入增量检测模型,获取所述图片的视觉特征,将每个视觉特征与每个文本特征进行遍历计算获得相似度,将对应的相似度最高的视觉特征与文本特征进行匹配构成类别元素,所有类别元素构成类别集合;步骤
13、
在步骤
12
所述类别集合的基础上添加广义类别,定义为广义类别集合,基于所述广义类别集合对增量目标检测模型进行增量训练,获得更新增量目标检测模型;步骤
14、
使用所述更新增量目标检测模型检测新任务类别,建立广义类别和新任务类别之间的类别映射关系,依据所述类别映射关系和广义类别集合建立全局感知文本模型
。3.
根据权利要求2所述一种基于增量学习的目标检测方法和增量检测模型
IODC
,其特征在于,步骤
11
所述构造类别文本特征句子,基于所有类别文本句子建立文本特征集具体包括:识别多个训练图片中所涵盖所有对象的类别名称;基于语言模态的信息训练语言模型,获得更新语言模型,基于所述更新语言模型构造句子模板;将每个类别名称放入句子模板获得表示类别名称的文本句子;将所有文本句子送入
CLIP
模型的文本编码器生成多个文本特征,建立文本特征集
。4.
根据权利要求3所述一种基于增量学习的目标检测方法和增量检测模型
IODC
,其特征在于,所述句子模板为“there is a{classname}in the scene”。5.
根据权利要求2所述一种基于增量学习的目标检测方法和增量检测模型
IODC
,其特征在于,步骤
12
所述图片的视觉特征与所述类别文本特征都具有相同的维度
。6.
根据权利要求2所述一种基于增量学习的目标检测方法和增量检测模型
IODC
,其特征在于,步骤
12
所述相似度计算具体包括:在目标检测模型中输入一张图片,使用检测网络获得图片中所涵盖对象的视觉特征;将视觉特征和步骤
11
所述文本特征进行特征归一化,再使用余弦相似度法遍历计算特征归一化后的视觉特征和文本特征的相似程度;获得该图片中多个对象的预测类别概率逻辑值;在预测类别概率逻辑值中接入交叉熵损失函数获得分类损失;基于所述分类损失对上述相似度进行修正,获得更优的相似度
。
7.
根据权利要求2所述一种基于增量学习的目标检测方法和增量检测模型
I...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。