一种模型增量学习方法、装置、设备及存储介质制造方法及图纸

技术编号:38204526 阅读:12 留言:0更新日期:2023-07-21 16:50
本申请公开了一种模型增量学习方法、装置、设备及存储介质,涉及模型训练技术领域,包括:获取若干历史预测结果作为当前待训练数据集,并基于预设数据更新规则对当前待训练数据集进行数据更新操作以得到相应的更新后待训练数据集;利用更新后待训练数据集进行模型训练以得到相应的当前训练模型,并基于预设模型添加规则将当前训练模型放入预设集成模型以更新预设集成模型;对更新后的预设集成模型中每一训练模型进行权重更新操作以对预设权重调整器进行更新,利用更新后的预设集成模型和更新后的权重调整器进行类别预测操作以得到若干预测结果。本申请利用集成模型对数据和模型进行更新学习,可以缓解概念漂移问题使模型的预测效果更加平滑稳定。的预测效果更加平滑稳定。的预测效果更加平滑稳定。

【技术实现步骤摘要】
一种模型增量学习方法、装置、设备及存储介质


[0001]本专利技术涉及模型训练
,特别涉及一种模型增量学习方法、装置、设备及存储介质。

技术介绍

[0002]随着人工智能的不断普及,机器学习中的模型训练已经广泛运用至各行各业,然而在模型训练的过程中,可能会出现概念漂移导致模型检测性能下降的问题。概念漂移分为真概念漂移和假概念漂移。假概念漂移为一次训练的数据无法涵盖到数据总体,新的数据来临需要对模型进行重新训练。真概念漂移为已有的训练数据的映射经过一段时间后发生了改变,从y=f(x)变为y=g(x),从而导致原有模型需要重新训练。参见图1所示,存在数据集D1,训练得到模型m1。经过一定时间,出现了数据D2。D2中的C代表新的数据出现,则模型m1无法对C进行预测;数据D1和D2的交叉部分A,如果存在数据映射函数发生变化,由y=f(x)变为y=g(x),则模型m1同样无法对A正确预测。
[0003]现有技术存在缓解概念漂移的方法,例如使用G

mean进行动态加权、使用K

means聚类算法确定数据之间的相似度以进行重训练等,前述方法虽然可以在一定程度上缓解冲突数据对模型的影响,但需要人工标注数据并且产生的虚拟数据会对模型产生负面影响陷入局部问题等,因此解决概念漂移问题,学习到数据C中的新知识和解决存在B中的冲突数据仍是现阶段需要关注的问题。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种模型增量学习方法、装置、设备及存储介质,能够利用集成模型对数据和模型进行更新学习,从而在一定程度上缓解甚至解决概念漂移问题使模型的预测效果更加平滑稳定。其具体方案如下:
[0005]第一方面,本申请公开了一种模型增量学习方法,包括:
[0006]获取若干历史预测结果作为当前待训练数据集,并基于预设数据更新规则对所述当前待训练数据集进行数据更新操作,以得到相应的更新后待训练数据集;
[0007]利用所述更新后待训练数据集进行模型训练以得到相应的当前训练模型,并基于预设模型添加规则将所述当前训练模型放入预设集成模型以更新所述预设集成模型;所述预设集成模型用于存储全部参与类别预测的所述训练模型;
[0008]对更新后的所述预设集成模型中每一所述训练模型进行权重更新操作以对预设权重调整器进行更新,利用更新后的所述预设集成模型和更新后的所述权重调整器进行类别预测操作以得到若干预测结果,并跳转至所述获取若干历史预测结果作为当前待训练数据集的步骤以进行下一轮模型迭代学习。
[0009]可选的,所述获取若干历史预测结果作为当前待训练数据集之前,还包括:
[0010]利用初始待训练数据集进行模型训练得到第一训练模型,并创建所述预设集成模型以将所述第一训练模型放入所述预设集成模型中。
[0011]可选的,所述获取若干历史预测结果作为当前待训练数据集之后,还包括:
[0012]计算本轮模型迭代学习的所述当前待训练数据集与上一轮的待训练数据集之间的相似度,并判断所述相似度是否小于预设相似度阈值;
[0013]若否,则确定所述当前待训练数据集中的保留数据,并直接利用所述预设集成模型和所述权重调整器进行类别预测操作以得到若干预测结果;所述保留数据用于在下一轮模型迭代学习时加入至下一轮的待训练数据集中。
[0014]可选的,所述基于预设数据更新规则对所述当前待训练数据集进行数据更新操作,以得到相应的更新后待训练数据集,包括:
[0015]若所述相似度小于所述预设相似度阈值,则基于预设数据更新规则对本轮模型迭代学习的所述当前待训练数据集进行数据更新操作以得到相应的更新后待训练数据集。
[0016]可选的,所述基于预设模型添加规则将所述当前训练模型放入预设集成模型以更新所述预设集成模型中,包括:
[0017]判断所述预设集成模型中全部所述训练模型的数量是否达到预设数量阈值;
[0018]若否,则直接将所述当前训练模型放入所述预设集成模型以更新所述预设集成模型;
[0019]若是,则利用预设模型剔除规则从所述预设集成模型中剔除一个训练模型,并将所述当前训练模型放入所述预设集成模型以更新所述预设集成模型。
[0020]可选的,所述对更新后的所述预设集成模型中每一训练模型进行权重更新操作以对预设权重调整器进行更新,包括:
[0021]基于预设数据选取规则从历史数据集中选取待预测数据集,并将所述待预测数据集输入至所述预设集成模型的每一所述训练模型中,以得到每一所述训练模型对应的第一预测值;
[0022]将每一所述训练模型的所述第一预测值拼接为数组并输入至所述预设权重调整器进行训练得到每一所述训练模型对应的权重,以对所述预设权重调整器进行更新。
[0023]可选的,所述利用更新后的所述预设集成模型和更新后的所述权重调整器进行类别预测操作以得到若干预测结果,包括:
[0024]获取预设数据集并将所述预设数据集输入至更新后的所述预设集成模型的每一所述训练模型中,以得到每一所述训练模型对应的第二预测值;
[0025]将每一所述训练模型对应的所述第二预测值拼接为数组并输入至更新后的所述权重调整器中进行类别预测操作,以得到若干预测结果。
[0026]第二方面,本申请公开了一种模型增量学习装置,包括:
[0027]数据更新模块,用于获取若干历史预测结果作为当前待训练数据集,并基于预设数据更新规则对所述当前待训练数据集进行数据更新操作,以得到相应的更新后待训练数据集;
[0028]模型更新模块,用于利用所述更新后待训练数据集进行模型训练以得到相应的当前训练模型,并基于预设模型添加规则将所述当前训练模型放入预设集成模型以更新所述预设集成模型;所述预设集成模型用于存储全部参与类别预测的所述训练模型;
[0029]权重更新模块,用于对更新后的所述预设集成模型中每一所述训练模型进行权重更新操作以对预设权重调整器进行更新;
[0030]预测结果确定模块,用于利用更新后的所述预设集成模型和更新后的所述权重调整器进行类别预测操作以得到若干预测结果,并跳转至所述获取若干历史预测结果作为当前待训练数据集的步骤以进行下一轮模型迭代学习。
[0031]第三方面,本申请公开了一种电子设备,包括:
[0032]存储器,用于保存计算机程序;
[0033]处理器,用于执行所述计算机程序以实现前述的模型增量学习方法。
[0034]第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现前述的模型增量学习方法。
[0035]可见,本申请通过获取若干历史预测结果作为当前待训练数据集,并基于预设数据更新规则对所述当前待训练数据集进行数据更新操作,以得到相应的更新后待训练数据集;利用所述更新后待训练数据集进行模型训练以得到相应的当前训练模型,并基于预设模型添加规则将所述当前训练模型放入预设集成模型以更新所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型增量学习方法,其特征在于,包括:获取若干历史预测结果作为当前待训练数据集,并基于预设数据更新规则对所述当前待训练数据集进行数据更新操作,以得到相应的更新后待训练数据集;利用所述更新后待训练数据集进行模型训练以得到相应的当前训练模型,并基于预设模型添加规则将所述当前训练模型放入预设集成模型以更新所述预设集成模型;所述预设集成模型用于存储全部参与类别预测的所述训练模型;对更新后的所述预设集成模型中每一所述训练模型进行权重更新操作以对预设权重调整器进行更新,利用更新后的所述预设集成模型和更新后的所述权重调整器进行类别预测操作以得到若干预测结果,并跳转至所述获取若干历史预测结果作为当前待训练数据集的步骤以进行下一轮模型迭代学习。2.根据权利要求1所述的模型增量学习方法,其特征在于,所述获取若干历史预测结果作为当前待训练数据集之前,还包括:利用初始待训练数据集进行模型训练得到第一训练模型,并创建所述预设集成模型以将所述第一训练模型放入所述预设集成模型中。3.根据权利要求1所述的模型增量学习方法,其特征在于,所述获取若干历史预测结果作为当前待训练数据集之后,还包括:计算本轮模型迭代学习的所述当前待训练数据集与上一轮的待训练数据集之间的相似度,并判断所述相似度是否小于预设相似度阈值;若否,则确定所述当前待训练数据集中的保留数据,并直接利用所述预设集成模型和所述权重调整器进行类别预测操作以得到若干预测结果;所述保留数据用于在下一轮模型迭代学习时加入至下一轮的待训练数据集中。4.根据权利要求3所述的模型增量学习方法,其特征在于,所述基于预设数据更新规则对所述当前待训练数据集进行数据更新操作,以得到相应的更新后待训练数据集,包括:若所述相似度小于所述预设相似度阈值,则基于预设数据更新规则对本轮模型迭代学习的所述当前待训练数据集进行数据更新操作以得到相应的更新后待训练数据集。5.根据权利要求1所述的模型增量学习方法,其特征在于,所述基于预设模型添加规则将所述当前训练模型放入预设集成模型以更新所述预设集成模型,包括:判断所述预设集成模型中全部所述训练模型的数量是否达到预设数量阈值;若否,则直接将所述当前训练模型放入所述预设集成模型以更新所述预设集成模型;若是,则利用预设模型剔除规则从所述预设集成模型中剔除一个训练模型,并...

【专利技术属性】
技术研发人员:张刚
申请(专利权)人:济南博观智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1