一种模型增量学习方法、装置、设备及存储介质制造方法及图纸

技术编号：38204526 阅读：12 留言：0更新日期：2023-07-21 16:50

本申请公开了一种模型增量学习方法、装置、设备及存储介质，涉及模型训练技术领域，包括：获取若干历史预测结果作为当前待训练数据集，并基于预设数据更新规则对当前待训练数据集进行数据更新操作以得到相应的更新后待训练数据集；利用更新后待训练数据集进行模型训练以得到相应的当前训练模型，并基于预设模型添加规则将当前训练模型放入预设集成模型以更新预设集成模型；对更新后的预设集成模型中每一训练模型进行权重更新操作以对预设权重调整器进行更新，利用更新后的预设集成模型和更新后的权重调整器进行类别预测操作以得到若干预测结果。本申请利用集成模型对数据和模型进行更新学习，可以缓解概念漂移问题使模型的预测效果更加平滑稳定。的预测效果更加平滑稳定。的预测效果更加平滑稳定。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型增量学习方法、装置、设备及存储介质

[0001]本专利技术涉及模型训练
，特别涉及一种模型增量学习方法、装置、设备及存储介质。

技术介绍

[0002]随着人工智能的不断普及，机器学习中的模型训练已经广泛运用至各行各业，然而在模型训练的过程中，可能会出现概念漂移导致模型检测性能下降的问题。概念漂移分为真概念漂移和假概念漂移。假概念漂移为一次训练的数据无法涵盖到数据总体，新的数据来临需要对模型进行重新训练。真概念漂移为已有的训练数据的映射经过一段时间后发生了改变，从y＝f(x)变为y＝g(x)，从而导致原有模型需要重新训练。参见图1所示，存在数据集D1，训练得到模型m1。经过一定时间，出现了数据D2。D2中的C代表新的数据出现，则模型m1无法对C进行预测；数据D1和D2的交叉部分A，如果存在数据映射函数发生变化，由y＝f(x)变为y＝g(x)，则模型m1同样无法对A正确预测。
[0003]现有技术存在缓解概念漂移的方法，例如使用G
‑
mean进行动态加权、使用K
‑
means聚类算法确定数据之间的相似度以进行重训练等，前述方法虽然可以在一定程度上缓解冲突数据对模型的影响，但需要人工标注数据并且产生的虚拟数据会对模型产生负面影响陷入局部问题等，因此解决概念漂移问题，学习到数据C中的新知识和解决存在B中的冲突数据仍是现阶段需要关注的问题。

技术实现思路

[0004]有鉴于此，本专利技术的目的在于提供一种模型增量学习方法、装置、设备及存储介质，能够利用集...

【技术保护点】

【技术特征摘要】
1.一种模型增量学习方法，其特征在于，包括：获取若干历史预测结果作为当前待训练数据集，并基于预设数据更新规则对所述当前待训练数据集进行数据更新操作，以得到相应的更新后待训练数据集；利用所述更新后待训练数据集进行模型训练以得到相应的当前训练模型，并基于预设模型添加规则将所述当前训练模型放入预设集成模型以更新所述预设集成模型；所述预设集成模型用于存储全部参与类别预测的所述训练模型；对更新后的所述预设集成模型中每一所述训练模型进行权重更新操作以对预设权重调整器进行更新，利用更新后的所述预设集成模型和更新后的所述权重调整器进行类别预测操作以得到若干预测结果，并跳转至所述获取若干历史预测结果作为当前待训练数据集的步骤以进行下一轮模型迭代学习。2.根据权利要求1所述的模型增量学习方法，其特征在于，所述获取若干历史预测结果作为当前待训练数据集之前，还包括：利用初始待训练数据集进行模型训练得到第一训练模型，并创建所述预设集成模型以将所述第一训练模型放入所述预设集成模型中。3.根据权利要求1所述的模型增量学习方法，其特征在于，所述获取若干历史预测结果作为当前待训练数据集之后，还包括：计算本轮模型迭代学习的所述当前待训练数据集与上一轮的待训练数据集之间的相似度，并判断所述相似度是否小于预设相似度阈值；若否，则确定所述当前待训练数据集中的保留数据，并直接利用所述预设集成模型和所述权重调整器进行类别预测操作以得到若干预测结果；所述保留数据用于在下一轮模型迭代学习时加入至下一轮的待训练数据集中。4.根据权利要求3所述的模型增量学习方法，其特征在于，所述基于预设数据更新规则对所述当前待训练数据集进行数据更新操作，以得到相应的更新后待训练数据集，包括：若所述相似度小于所述预设相似度阈值，则基于预设数据更新规则对本轮模型迭代学习的所述当前待训练数据集进行数据更新操作以得到相应的更新后待训练数据集。5.根据权利要求1所述的模型增量学习方法，其特征在于，所述基于预设模型添加规则将所述当前训练模型放入预设集成模型以更新所述预设集成模型，包括：判断所述预设集成模型中全部所述训练模型的数量是否达到预设数量阈值；若否，则直接将所述当前训练模型放入所述预设集成模型以更新所述预设集成模型；若是，则利用预设模型剔除规则从所述预设集成模型中剔除一个训练模型，并...

【专利技术属性】
技术研发人员：张刚，
申请(专利权)人：济南博观智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人