【技术实现步骤摘要】
一种模型的更新方法、装置及设备
[0001]本文件涉及计算机
,尤其涉及一种模型的更新方法、装置及设备。
技术介绍
[0002]近年来,机器学习模型在一系列机器学习任务(包括图像、语言、语音、视频等多个领域的机器学习任务)上,取得了优越的性能,但是,机器学习模型训练的代价非常大,而训练后的机器学习模型部署在业务场景中,模型可能会因为安全问题或者需求变化,需要随时打补丁或者更新。
[0003]通常,更新或修改模型的方式可以包括模型微调、迁移学习或多任务学习等。但是,上述方式往往只考虑了在新任务上的准确率和原始任务上的准确率,没有考虑到即使在原始任务上表现准确率一致,具体到样本的行为也可能不一致,一致性可以包括整体一致性和样本层次的一致性,整体一致性要求模型在原始任务上的整体表现和性能相比原始模型不变,样本一致性要求模型在原始任务上针对不同样本的行为相对原始模型需要一致。为此,需要提供一种建模需求更新的微调任务,并且需要保证新任务上的准确率和原始任务上的一致性。
技术实现思路
[0004]本说明书实 ...
【技术保护点】
【技术特征摘要】
1.一种模型的更新方法,所述方法包括:根据目标模型中待修改的模型功能的信息,获取与所述待修改的模型功能的信息相匹配的第一训练集,并基于所述待修改的模型功能的信息,从对所述目标模型进行模型训练所使用的模型训练集中获取第二训练集;基于所述第一训练集和所述第二训练集,确定所述目标模型对应的第一模型损失,以及基于所述第二训练集,确定所述目标模型对应的第二模型损失;基于所述第一模型损失和所述第二模型损失,通过反向传播算法对所述目标模型进行更新训练,以对所述目标模型中待修改的模型功能进行修改,得到更新后的所述目标模型。2.根据权利要求1所述的方法,所述方法还包括:获取所述目标模型的部署情况信息;基于所述目标模型的部署情况信息,使用更新后的所述目标模型替换部署的所述目标模型。3.根据权利要求2所述的方法,所述基于所述待修改的模型功能的信息,从对所述目标模型进行模型训练所使用的模型训练集中获取第二训练集,包括:获取对所述目标模型进行模型训练所使用的模型训练集;基于所述第一训练集中训练样本的数量,从所述模型训练集中获取与所述第一训练集中训练样本的数量相匹配的数量的训练样本,并基于获取的训练样本构建预选训练集;基于所述待修改的模型功能的信息,对所述预选训练集中的训练样本中与所述待修改的模型功能的信息相关的信息进行调整,得到调整后的训练样本,并基于调整后的训练样本构建第二训练集。4.根据权利要求3所述的方法,所述基于所述待修改的模型功能的信息,对所述预选训练集中的训练样本中与所述待修改的模型功能的信息相关的信息进行调整,得到调整后的训练样本,包括:基于所述待修改的模型功能的信息,将所述预选训练集中的训练样本中与所述待修改的模型功能的信息相关的信息删除,得到调整后的训练样本;或者,基于所述待修改的模型功能的信息,将所述预选训练集中的训练样本中与所述待修改的模型功能的信息相关的信息进行修改,得到调整后的训练样本。5.根据权利要求1所述的方法,所述基于所述第一训练集和所述第二训练集,确定所述目标模型对应的第一模型损失,包括:通过交叉熵损失函数计算所述第一训练集和所述第二训练集下所述目标模型对应的第一模型损失。6.根据权利要求1所述的方法,所述基于所述第二训练集,确定所述目标模型对应的第二模型损失,包括:在所述第二训练集下,计算所述目标模型对所述第二训练集中的训练样本的预测概率的回归Logit分值;基于所述目标模型对所述第二训练集中的训练样本的预测概率的Logit分值,确定所述目标模型对应的第二模型损失。7.根据权利要求6所述的方法,所述Logit分值包括所述目标模型对所述第二训练集中的训练样本的预测概率的第一Logit分值和更新后的所述目标模型对所述第二训练集中的
训练样本的预测概率的第二Logit分值,所述基于所述目标模型对所述第二训练集中的训练样本的预测概率的Logit分值,确定所述目标模型对应的第二模型损失,包括:计算所述第一Logit分值和所述第二Logit分值,在所述目标模型对应的分类类别中的每种分类类别下的差值的平方,得到第一计算结果;将所述目标模型对应的分类类别中的不同分类类别对应第一计算结果相加,得到所述目标模型对应的第二模型损失。8.根据权利要求1
‑
7中任一项所述的方法,所述基于所述第一模型损失和所述第二模型损失,通过梯度反向算法对所述目标模型进行更新训练,以对所述目标模型中待修改的模型功能进行修改,得到更新后的所述目标模型,包括:获取所述第一模型损失对应的权重和所述第二模型损失对应的权重;基于所述第一模型损失、所述第二模型损失、所述第一模型损失对应的权重和所述第二模型损失对应的权重,确定所述目标模型对应的总模型损失;基于所述目标模型对应的总模型损失,通过梯度反向算法对所述目标模型进行更新训练,以对所述目标模型中待修改的模型功能进行修改,得到更新后的所述目标模型。9.根据权利要求8所述的方法,所述目标模型为分类模型,所述分类模型由神经网络算法构建。10.一种模型的更新方法,应用于区块链系统,所述方法包括:获取目标模型中的模型功能的更新规则信息,基于所述目标模型中的模型功能的更新规则信息生成相应的智能合约,并将所述智能合约部署到所述区块链系统中;接收所述目标模型的更新请求,所述更新请求中包括所述目标模型中待修改的模型功能的信息;调用所述智能合约,并根据目标模型中待修改的模型功能的信息,获取与所述待修改的模型功能的信息相匹配的第一训练集,并基于所述待修改的模型功能的信息,从对所述目标模型进行模型训练所使用的模型训练集中获取第二训练集;基于所述智能合约,以及所述第一训练集和所述第二训练集,确定所述目标模型对应的第一模型损失,并基于所述第二训练集,确定所述目标模型对应的第二模型损失;基于所述智能合约,以及所述第一模型损失和所述第二模型损失,通过反向传播算法对所述目标模型进行更新训练,以对所述目标模型中待修改的模型功能进行修改,得到更新后的所述目标模型。11.根据权利要求10所述的方法,所述方法还包括:基于所述智能合约,获取所述目标模型的部署情况信息;基于所述智能合约和所述目标模型的部署情况信息,使用更新后的所述目标模型替换部署的所述目标模型。12.一种模型的更新装置,所述装置包括:训练...
【专利技术属性】
技术研发人员:张之远,吕灵娟,王维强,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。