分类模型的增量训练方法、装置和计算机设备制造方法及图纸

技术编号：35878987 阅读：29 留言：0更新日期：2022-12-07 11:17

本申请涉及一种分类模型的增量训练方法、装置和计算机设备。所述方法包括：获取经真实样本和虚构样本共同训练得到的目标分类模型；获取新增样本，新增样本所属的新增类别不同于任一真实类别；将新增样本输入至目标分类模型，并通过目标分类模型提取新增样本的特征向量；确定特征空间中与各个虚构类别分别对应的目标代表特征，并基于特征向量与各目标代表特征间的差异，确定与新增样本匹配的目标虚构类别；将目标虚构类别更新为新增类别，以使得目标分类模型支持对新增类别的预测。采用本方法能够在分类任务中快速支持对新增数据和新增类别的预测。类别的预测。类别的预测。

全部详细技术资料下载

【技术实现步骤摘要】
分类模型的增量训练方法、装置和计算机设备

[0001]本申请涉及机器学习
，特别是涉及一种分类模型的增量训练方法、装置和计算机设备。

技术介绍

[0002]分类任务指的是在特征维度上将不同的数据进行区分，例如对视频的品类进行区分，以识别视频属于综艺节目、游戏视频、或者体育直播等。或者，也可以对文学作品的类型进行区分，以识别文学作品属于写实类、科幻类、或者情感类等。
[0003]在实际的业务场景中，所需要进行识别的分类会随着业务数据变化而变化，时常会遇到需要新增加一些类别的情况。然而，相关技术中所使用的分类模型，在训练完成之后只能对已有的类别进行检测，对于新增的类别无法进行相应类别的预测输出。因此，需要将已有的数据和新增的数据作为输入，重新训练一个新的分类模型，以支持对新增的类别的预测。
[0004]而随着新的类别的不断增加，每次增加一个新的类别后，都需要重新再训练一个分类模型，效率十分低下。

技术实现思路

[0005]基于此，有必要针对上述技术问题，提供一种能够提高分类任务效率的分类模型的增量训练方法、装置、计算机设备、计算机可读存储介质、以及计算机程序产品。
[0006]一方面，本申请提供了一种分类模型的增量训练方法。所述方法包括：获取经真实样本和虚构样本共同训练得到的目标分类模型，所述目标分类模型支持对虚构类别和真实类别的预测；获取新增样本，所述新增样本所属的新增类别不同于任一所述真实类别；将所述新增样本输入至所述目标分类模型，并通过所述目标分类模型提取所述新增样本的...

【技术保护点】

【技术特征摘要】
1.一种分类模型的增量训练方法，其特征在于，所述方法包括：获取经真实样本和虚构样本共同训练得到的目标分类模型，所述目标分类模型支持对虚构类别和真实类别的预测；获取新增样本，所述新增样本所属的新增类别不同于任一所述真实类别；将所述新增样本输入至所述目标分类模型，并通过所述目标分类模型提取所述新增样本的特征向量；确定特征空间中与各个虚构类别分别对应的目标代表特征，并基于所述特征向量与各目标代表特征间的差异，确定与所述新增样本匹配的目标虚构类别；将所述目标虚构类别更新为所述新增类别，以使得所述目标分类模型支持对所述新增类别的预测。2.根据权利要求1所述的方法，其特征在于，所述目标分类模型通过如下步骤训练得到：获取真实样本和虚构样本，所述虚构样本是基于所述真实样本构建得到；通过待训练的分类模型对所述真实样本进行预测，并基于预测得到的第一输出确定所述真实样本对应于第一目标类别的第一损失，所述第一目标类别包括所述真实样本所属的目标真实类别、和与所述真实样本匹配的目标虚构类别；通过所述待训练的分类模型对所述虚构样本进行预测，并基于预测得到的第二输出确定所述虚构样本对应于第二目标类别的第二损失，所述第二目标类别包括分别与所述虚构样本匹配的目标真实类别和目标虚构类别；基于所述第一损失和第二损失，构建目标损失函数，通过所述目标损失函数对所述待训练的分类模型进行迭代训练，直至达到训练停止条件时停止，得到训练完成的目标分类模型。3.根据权利要求2所述的方法，其特征在于，所述通过所述目标损失函数对所述待训练的分类模型进行迭代训练，包括：通过所述目标损失函数对所述待训练的分类模型进行多次迭代训练，并在每次迭代训练后，确定当次迭代训练对应的梯度，并基于所述梯度的反向传播，对特征空间中每个类别各自对应的代表特征进行更新；其中，最后一次迭代训练完成后所得到的每个类别各自对应的代表特征，为各个类别的目标代表特征。4.根据权利要求2所述的方法，其特征在于，所述通过待训练的分类模型对所述真实样本进行预测，并基于预测得到的第一输出确定所述真实样本对应于第一目标类别的第一损失，包括：通过待训练的分类模型提取所述真实样本的特征向量，并基于所述真实样本的特征向量进行预测，得到所述真实样本对应于所有类别的第一概率；基于所述第一概率、以及所述真实样本所属的目标真实类别，确定所述真实样本对应于所述目标真实类别的第一原始损失；基于所述第一概率，确定所述真实样本对应于除所述目标真实类别以外的其他类别的第一假设概率；基于所述第一假设概率，确定所述真实样本对应于所匹配的目标虚构类别的第一虚构损失；
基于所述第一原始损失和所述第一虚构损失，确定所述真实样本对应于第一目标类别的第一损失。5.根据权利要求4所述的方法，其特征在于，所述基于所述第一概率，确定所述真实样本对应于除所述目标真实类别以外的其他类别的第一假设概率，包括：基于所述真实样本所属的目标真实类别，确定与所述真实样本对应的二值化向量，所述二值化向量的维度与预设类别的数量相匹配；对与所述真实样本对应的二值化向量进行逆运算，得到与所述真实样本对应的二值化逆向量；基于所述第一概率和与所述真实样本对应的所述二值化逆向量，确定所述真实样本对应于除所述目标真实类别以外的其他类别的第一假设概率。6.根据权利要求4所述的方法，其特征在于，所述基于所述第一假设概率，确定所述真实样本对应于所匹配的目标虚构类别的第一虚构损失，包括：确定与所述真实样本匹配的目标虚构类别；基于所述第一假设概率、以及所述目标虚构类别对应的虚构类别标签，确定所述真实样本对应于所述目标虚构类别的第一虚构损失。7.根据权利要求6所述的方法，其特征在于，所述确定与所述真实样本匹配的目标虚构类别，包括：确定特征空间中与各虚构类别分别对应的第一代表特征，所述第一代表特征为当次训练中与各虚构类别对应的代表特征；分别确定所述真实样本的特征向量与各第一代表特征之间的距离；将所述距离中的最小值对应的第一代表特征所代表的虚构类别，作为与所述真实样本匹配的目标虚构类别。8....

【专利技术属性】
技术研发人员：刘孟洋，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人