当前位置: 首页 > 专利查询>鹏城实验室专利>正文

基于类增学习的对象分类方法、图像分类方法及相关设备技术

技术编号:38891910 阅读:12 留言:0更新日期:2023-09-22 14:16
本申请实施例提供了一种基于类增学习的对象分类方法、图像分类方法及相关设备,属于人工智能技术领域。该方法包括:获取提示码本和训练数据特征表示;将提示码本和训练数据特征表示输入至原始分类模型的提示组合网络进行提示预测得到组合提示数据;通过原始分类模型的提示加权网络对组合提示数据和训练数据特征表示进行加权处理得到加权提示信息;通过原始分类模型的分类网络对加权提示信息和训练数据特征表示进行分类得到分类预测结果;根据分类验证结果和分类预测结果对原始分类模型进行优化得到目标分类模型;通过目标分类模型对目标数据进行分类得到目标分类结果。本申请能够在新增数据时保留旧知识学习,提高分类准确性,降低数据量存储。降低数据量存储。降低数据量存储。

【技术实现步骤摘要】
基于类增学习的对象分类方法、图像分类方法及相关设备


[0001]本申请涉及人工智能
,尤其涉及一种基于类增学习的对象分类方法、图像分类方法及相关设备。

技术介绍

[0002]随着信息技术的发展,分类模型输入的数据也以增量式产生。而传统的分类模型往往采用封闭数据集进行训练,所以分类模型不能有效地应对新增数据的处理。
[0003]为了让分类模型具备处理新增数据的能力,相关技术中设置了三种类增量学习方法,且三种增量学习方法分别为网络微调方法、正则化方法和回放方法。网络微调方法大多只是微调新任务相关的全连接层,对旧任务遗忘较多,同时增加了网络体积。基于正则化方法通过给新任务的损失函数施加约束的方式来确保旧知识不被新增知识所覆盖,但是正则化方法高度依赖于新旧任务之间的相关性,训练时间会随着学习任务的数量线性增长。回放方法在训练新任务时,保留了一部分具有代表性的旧数据用于分类模型复习旧知识,但是对于旧数据的选取较为敏感,且计算成本也随着任务数量的增大而成倍增长。因此,如何让分类模型学习到新增数据且不影响旧知识学习,还不因任务数量的增大而成倍增长,成为了亟待解决的技术问题。

技术实现思路

[0004]本申请实施例的主要目的在于提出一种基于类增学习的对象分类方法、图像分类方法及相关设备,旨在让分类模型学习到新增数据且不影响旧知识学习,还不因任务数量的增大而成倍增长。
[0005]为实现上述目的,本申请实施例的第一方面提出了一种基于类增学习的对象分类方法,所述方法包括:获取当前增量任务的训练数据集;其中,所述训练数据集包括:提示码本和训练数据;对所述训练数据进行特征映射处理,得到训练数据特征表示;将所述提示码本和所述训练数据特征表示输入至预设的原始分类模型;其中,所述原始分类模型包括:提示组合网络、提示加权网络和分类网络;通过所述提示组合网络对所述提示码本和所述训练数据特征表示进行提示预测,得到组合提示数据;通过所述提示加权网络对所述组合提示数据和所述训练数据特征表示进行加权处理,得到加权提示信息;通过所述分类网络对所述加权提示信息和所述训练数据特征表示进行对象分类,得到分类预测结果;根据预设的分类验证结果和所述分类预测结果对所述原始分类模型进行优化,得到目标分类模型;
获取目标数据,将所述目标数据输入至所述目标分类模型进行对象分类,得到目标分类结果。
[0006]在一些实施例,所述通过所述提示组合网络对所述提示码本和所述训练数据特征表示进行提示预测,得到组合提示数据,包括:通过所述提示组合网络对所述提示码本和所述训练数据特征表示进行系数预测,得到提示组合系数;通过所述提示组合网络将所述提示组合系数和所述提示码本的数据矩阵进行乘积,得到所述组合提示数据。
[0007]在一些实施例,所述提示组合网络包括:至少两个相关性度量层和系数预测层;所述通过所述提示组合网络对所述提示码本和所述训练数据特征表示进行系数预测,得到提示组合系数,包括:通过所述相关性度量层对所述提示码本和所述训练数据特征表示进行相关性度量处理,得到相关性度量数据;通过所述系数预测层对所述相关性度量数据进行系数预测,得到所述提示组合系数。
[0008]在一些实施例,所述通过所述提示加权网络对所述组合提示数据和所述训练数据特征表示进行加权处理,得到加权提示信息,包括:通过所述提示加权网络对所述组合提示数据和所述训练数据特征表示进行加权权重计算,得到提示加权权重;通过所述提示加权网络将所述提示加权权重和所述组合提示数据构建成所述加权提示信息。
[0009]在一些实施例,所述提示加权网络包括:全连接层;所述通过提示加权网络对所述组合提示数据和所述训练数据特征表示进行加权权重计算,得到提示加权权重,包括:通过所述全连接层对所述组合提示数据映射至预设空间得到组合提示映射数据,通过所述全连接层对所述训练数据特征表示映射至所述预设空间得到训练数据特征映射数据;对所述组合提示映射数据和所述训练数据特征映射数据进行相关性度量,得到信息相关性数据;根据预设的长度信息对所述信息相关性数据进行标准化处理,得到目标相关性数据;其中,所述长度信息为所述提示码本中基础提示的长度;对所述目标相关性数据进行非线性映射处理,得到所述提示加权权重。
[0010]在一些实施例,所述通过所述分类网络对所述加权提示信息和所述训练数据特征表示进行对象分类,得到分类预测结果,得到分类预测结果,包括:在所述分类网络的首部层设置预设的初始化提示信息,在所述分类网络的中部层设置所述加权提示信息,并根据所述当前增量任务的类别总数设置所述分类网络中末端层的输出维度;将所述训练数据特征表示输入至结构调整的所述分类网络进行类别预测,得到所述分类预测结果。
[0011]在一些实施例,所述根据所述分类验证结果和所述分类预测结果对所述原始分类
模型进行优化,得到目标分类模型,包括:对所述分类验证结果和所述分类预测结果进行交叉熵损失计算,得到分类损失数据;根据所述分类损失数据对所述原始分类模型进行参数调整,得到所述目标分类模型。
[0012]在一些实施例,在所述对所述分类验证结果和所述分类预测结果进行交叉熵损失计算,得到分类损失数据之后,所述方法还包括:根据所述分类损失数据对所述提示码本进行优化。
[0013]在一些实施例,所述获取当前增量任务的训练数据集,包括:获取所述当前增量任务的训练数据和候选码本;根据预设的标准差对所述候选码本进行初始化处理,得到提示码本;其中,所述提示码本包括至少两个基础提示。
[0014]为实现上述目的,本申请实施例的第二方面提出了一种图像分类方法,应用于图像分类,所述目标分类模型为图像分类模型,且所述目标分类模型由上述的基于类增学习的对象分类中得到;所述方法包括:获取目标图像数据;将所述目标图像数据输入至所述图像分类模型进行图像分类,得到图像类别信息。
[0015]为实现上述目的,本申请实施例的第三方面提出了一种基于类增学习的对象分类装置,所述装置包括:数据集获取模块,用于获取当前增量任务的训练数据集;其中,所述训练数据集包括:提示码本和训练数据;特征映射模块,用于对所述训练数据进行特征映射处理,得到训练数据特征表示;输入模块,用于将所述提示码本和所述训练数据特征表示输入至预设的原始分类模型;其中,所述原始分类模型包括:提示组合网络、提示加权网络和分类网络;提示预测模块,用于通过所述提示组合网络对所述提示码本和所述训练数据特征表示进行提示预测,得到组合提示数据;加权处理模块,用于通过所述提示加权网络对所述组合提示数据和所述训练数据特征表示进行加权处理,得到加权提示信息;原始分类模块,用于通过所述分类网络对所述加权提示信息和所述训练数据特征表示进行对象分类,得到分类预测结果;优化模块,用于根据预设的分类验证结果和所述分类预测结果对所述原始分类模型进行优化,得到目标分类模型;目标分类模块,用于获取目标数据,将所述目标数据输入至所述目标分类模型进行对象分类,得到目标分类结果。
[0016]为实现上述目的,本申请本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于类增学习的对象分类方法,其特征在于,所述方法包括:获取当前增量任务的训练数据集;其中,所述训练数据集包括:提示码本和训练数据;对所述训练数据进行特征映射处理,得到训练数据特征表示;将所述提示码本和所述训练数据特征表示输入至预设的原始分类模型;其中,所述原始分类模型包括:提示组合网络、提示加权网络和分类网络;通过所述提示组合网络对所述提示码本和所述训练数据特征表示进行提示预测,得到组合提示数据;通过所述提示加权网络对所述组合提示数据和所述训练数据特征表示进行加权处理,得到加权提示信息;通过所述分类网络对所述加权提示信息和所述训练数据特征表示进行对象分类,得到分类预测结果;根据预设的分类验证结果和所述分类预测结果对所述原始分类模型进行优化,得到目标分类模型;获取目标数据,将所述目标数据输入至所述目标分类模型进行对象分类,得到目标分类结果。2.根据权利要求1所述的方法,其特征在于,所述通过所述提示组合网络对所述提示码本和所述训练数据特征表示进行提示预测,得到组合提示数据,包括:通过所述提示组合网络对所述提示码本和所述训练数据特征表示进行系数预测,得到提示组合系数;通过所述提示组合网络将所述提示组合系数和所述提示码本的数据矩阵进行乘积,得到所述组合提示数据。3.根据权利要求2所述的方法,其特征在于,所述提示组合网络包括:至少两个相关性度量层和系数预测层;所述通过所述提示组合网络对所述提示码本和所述训练数据特征表示进行系数预测,得到提示组合系数,包括:通过所述相关性度量层对所述提示码本和所述训练数据特征表示进行相关性度量处理,得到相关性度量数据;通过所述系数预测层对所述相关性度量数据进行系数预测,得到所述提示组合系数。4.根据权利要求1所述的方法,其特征在于,所述通过所述提示加权网络对所述组合提示数据和所述训练数据特征表示进行加权处理,得到加权提示信息,包括:通过所述提示加权网络对所述组合提示数据和所述训练数据特征表示进行加权权重计算,得到提示加权权重;通过所述提示加权网络将所述提示加权权重和所述组合提示数据构建成所述加权提示信息。5.根据权利要求4所述的方法,其特征在于,所述提示加权网络包括:全连接层;所述通过提示加权网络对所述组合提示数据和所述训练数据特征表示进行加权权重计算,得到提示加权权重,包括:通过所述全连接层对所述组合提示数据映射至预设空间得到组合提示映射数据,通过所述全连接层对所述训练数据特征表示映射至所述预设空间得到训练数据特征映射数据;对所述组合提示映射数据和所述训练数据特征映射数据进行相关性度量,得到信息相
关性数据;根据预设的长度信息对所述信息相关性数据进行标准化处理,得到目标相关性数据;其中,所述长度信息为所述提示码本中基础提示的长度;对所述目标相关性数据进行非线性映射处理,得到所述提示加权权重。6.根据权利要求1至5任一项所述的方法,其特征在于,所述通过所述分类网络对所述加权提示信息和所述训练数据特征表示进行对象分类,得到分类预测结果,得到分类预测结果,包括:在所述分类网络的首部层设置预设的初始化提示信息,在所述分类网络的中部层设置所述加权提示信息,并根据所述当前增量任务的类别总数设置所述分类网络中末端层的输出维度;将所述...

【专利技术属性】
技术研发人员:戴勇洪晓鹏王耀威蒋冬梅王亚斌马智恒
申请(专利权)人:鹏城实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1