一种模型训练方法、装置、存储介质及电子设备制造方法及图纸

技术编号：37675159 阅读：18 留言：0更新日期：2023-05-26 04:39

本说明书公开了一种模型训练方法、装置、存储介质及电子设备。确定当前迭代过程对应的噪声值，以及基于每个训练样本分别确定出的调整模型参数的梯度，根据各梯度以及预设的第一超参数，分别确定各梯度权重，根据各梯度以及各梯度权重，确定各自适应梯度，基于训练样本确定出的梯度越大则自适应梯度与预设的梯度期望值的差越小，根据噪声值对各各自适应梯度之和加噪，以得到当前迭代过程的批次平均梯度，最后根据批次平均梯度，调整所述待训练模型的参数。可以减少小梯度样本对模型参数影响程度，使得模型训练效果更好，基于训练得到的模型执行业务的结果更准确。模型执行业务的结果更准确。模型执行业务的结果更准确。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型训练方法、装置、存储介质及电子设备

[0001]本说明书涉及机器学习领域，尤其涉及一种模型训练方法、装置、存储介质及电子设备。

技术介绍

[0002]随着互联网技术的发展，信息传播的途径越来越多，人们也越来越重视保护自己的隐私信息。而在机器学习中往往需要大量的高质量数据，其中大部分通常包含敏感的个人数据。
[0003]因此，在满足隐私保护的前提下，如何训练模型是亟待解决的问题，为此本说明书提供一种模型训练方法。

技术实现思路

[0004]本说明书提供一种模型训练方法、装置、存储介质及电子设备，以至少部分的解决现有技术存在的上述问题。
[0005]本说明书采用下述技术方案：
[0006]本说明书提供了一种模型训练方法，包括：
[0007]在对待训练模型进行迭代训练的过程中，确定当前迭代过程对应的噪声值；
[0008]针对当前迭代过程中的每个训练样本，确定基于该训练样本得到的调整模型参数的梯度，作为该训练样本对应的梯度训练样本对应的梯度；
[0009]根据该训练样本对应的梯度训练样本对应的梯度以及预设的第一超参数，确定该训练样本对应的梯度权重；
[0010]根据该训练样本对应的梯度及该训练样本对应的梯度权重，确定该训练样本的自适应梯度，其中，所述训练样本对应的梯度越大，则基于所述梯度权重确定的自适应梯度与预设的梯度期望值的差越小；
[0011]根据所述当前迭代过程对应的噪声值，对各训练样本的自适应梯度之和添加噪声，确定加入所述噪声后的...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，所述方法包括：在对待训练模型进行迭代训练的过程中，确定当前迭代过程对应的噪声值；针对当前迭代过程中的每个训练样本，确定基于该训练样本得到的调整模型参数的梯度，作为该训练样本对应的梯度；根据该训练样本对应的梯度以及预设的第一超参数，确定该训练样本对应的梯度权重；根据该训练样本对应的梯度及该训练样本对应的梯度权重，确定该训练样本的自适应梯度，其中，所述训练样本对应的梯度越大，则基于所述梯度权重确定的自适应梯度与预设的梯度期望值的差越小；根据所述当前迭代过程对应的噪声值，对各训练样本的自适应梯度之和添加噪声，确定加入所述噪声后的梯度和，并根据所述梯度和确定所述当前迭代过程的批次平均梯度；根据所述批次平均梯度，调整所述待训练模型的参数。2.如权利要求1所述的方法，确定当前迭代过程对应的噪声值，具体包括：根据当前迭代过程采用的训练样本，确定隐私预算；根据所述隐私预算以及采样率，确定当前迭代过程对应的噪声值，其中，隐私预算与所述噪声值负相关，所述采样率与所述噪声值正相关。3.如权利要求1所述的方法，确定基于该训练样本得到的调整模型参数的梯度，具体包括：根据该训练样本的标签及当前迭代模型输出的结果，确定当前迭代的损失值，根据所述损失值，确定基于该训练样本得到的调整模型参数的梯度。4.如权利要求1所述的方法，根据该训练样本对应的梯度训练样本对应的梯度以及预设的第一超参数，确定该训练样本对应的梯度权重，具体包括：根据该训练样本对应的梯度以及预设的第一超参数，通过以下公式确定该训练样本对应的梯度权重：其中，g
t
，
i
是指第t次迭代的第i个训练样本对应的梯度，r是指第一超参数。5.如权利要求1所述的方法，根据该训练样本对应的梯度训练样本对应的梯度以及预设的第一超参数，确定该训练样本对应的梯度权重，具体包括：根据该训练样本对应的梯度以及预设的第一超参数，通过以下公式确定该训练样本对应的梯度权重：其中，g
t
，
i
是指第t次迭代的第i个训练样本对应的梯度，r是指第一超参数。6.如权利要求1所述的方法，根据所述当前迭代过程对应的噪声值，对各训练样本的自适应梯度之和添加噪声，确定加入所述噪声后的梯度和，并根据所述梯度和确定所述当前迭代过程的批次平均梯度，具体包括：
根据所述梯度裁剪阈值与所述噪声值，确定高斯分布；根据所述高斯分布，确定加入当前迭代过程中的噪声；对所述当前迭代过程的各训练样本的自适应梯度之和添加所述噪声，确定加入所述噪声后的梯度和；根据所述梯度和除以当前迭代的样本数，确定所述当前迭代过程的批次平均梯度。7.如权利要求1所述的方法，根据所述批次平均梯度，调整所述待训练模型的参数，具体包括：根据学习率与所述梯度裁剪阈值的乘积，确定第二超参数；根据所述批次平均梯度以及所述第二超参数，调整所述待训练模型的参数。8.如权利要求7所述的方法，所述方法还包括：根据多次迭代过程确定出的批次平均梯度，以批次平均梯度下降的方向，调整所述第二超参数。9.如权利要求1所述的方法，所述方法还包括：响应于用户操作，确定目标业务，并获取执行所述目标业务的业务数据；将所述业务数据输入训练完成的模型中，确定所述模型输出的风险识别结果；根据所述模型输出结果，确定是否对所述目标业务进行风险控制。10.一种模型训练装置，所述装置包括：噪声值确定模块，用于在对待训练模型进...

【专利技术属性】
技术研发人员：赵闻飙，申书恒，张长浩，傅欣艺，王维强，徐恪，李琦，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人