一种模型聚合训练方法及装置制造方法及图纸

技术编号:37415708 阅读:10 留言:0更新日期:2023-04-30 09:39
本发明专利技术公开了一种模型聚合训练方法及装置,该方法为:将初始化后的机器学习模型下发给至少一个协作方设备,分别获得至少一个协作方设备发送的模型梯度更新参数,并构建模型梯度更新集合;使用预设测试集进行联邦学习训练任务的全局模型预测,获得本轮模型准确率,对本轮模型准确率进行准确率审查,根据获得的审查结果和模型梯度更新集合,进行基于贝叶斯差分隐私的全局模型更新,获得更新后的全局模型;通过第一隐私会计对全局模型的本轮训练过程进行追踪,获得本轮隐私成本;汇总本轮前的所有训练轮分别对应的最大隐私成本,获得合并隐私消耗;如果合并隐私消耗大于第一预设隐私预算,确定结束联邦训练,获得目标机器学习模型。型。型。

【技术实现步骤摘要】
一种模型聚合训练方法及装置


[0001]本专利技术涉及数据安全领域,尤其涉及一种模型聚合训练方法及装置。

技术介绍

[0002]目前,在基于大数据技术的数据识别模型、数据分级分类模型、数据操作行为画像模型、数据流转分析模型、数据风险分析模型、数据接口风险分析模型等模型训练中,均需要从海量数据中构建准确又强大的模型。然而,前述基于大数据技术的各种模型依赖于对应基础场景中所分布的数据,因此需要进行多方数据收集。
[0003]在汇集多方数据进行模型训练时,不可以收集所有数据到一台服务器进行集中式模型训练,一是因为数据提供方不期望暴露源数据所造成的数据孤岛,二是因为数据集中化会带来单点故障问题,不但会消耗大量计算资源和存储资源,也会遭到大量的外部攻击以致隐私数据泄露。
[0004]因此,如何在隐私保护下实现通信资源消耗的降低且实现模型的训练,成为亟待解决的问题。

技术实现思路

[0005]本专利技术实施例提供一种模型聚合训练方法及装置,用于在隐私保护下实现通信资源消耗的降低且实现模型的训练。
[0006]第一方面,提供一种模型聚合训练方法,应用于主训练设备,所述方法包括:
[0007]将初始化后的机器学习模型下发给至少一个协作方设备,分别获得所述至少一个协作方设备发送的模型梯度更新参数,并根据获得的至少一个所述模型梯度更新参数,构建模型梯度更新集合;其中,模型梯度更新参数为协作方设备基于本地数据对所述初始化后的机器学习模型进行训练后所获得的;
[0008]使用预设测试集进行联邦学习训练任务的全局模型预测,获得本轮模型准确率,并对所述本轮模型准确率进行准确率审查,并根据获得的审查结果和所述模型梯度更新集合,进行基于贝叶斯差分隐私的全局模型更新,获得更新后的全局模型,所述全局模型包括在所述至少一个协作方设备上训练的所有初始化后的机器学习模型;
[0009]通过第一隐私会计对所述全局模型的本轮训练过程进行追踪,获得本轮隐私成本;汇总所述本轮前的所有训练轮分别对应的最大隐私成本,获得合并隐私消耗;
[0010]如果所述合并隐私消耗大于第一预设隐私预算,确定结束联邦训练,获得目标机器学习模型。
[0011]在一种可能的实施方式中,在将所述初始化后的机器学习模型下发给至少一个协作方设备之前,所述方法还包括:
[0012]使用贝叶斯差分隐私技术,创建第一隐私会计。
[0013]在一种可能的实施方式中,在将所述初始化后的机器学习模型下发给至少一个协作方设备之前,所述方法还包括:
[0014]将打包后的联邦学习应用以及依赖包发送给所述至少一个协作方设备中的可移植的轻量容器中,以使所述至少一个协作方设备创建所述初始化后的机器学习模型的本地训练环境;以及,
[0015]根据预设联邦学习训练参数中经过认证的协作方集合,确定下发所述初始化后的机器学习模型的至少一个协作方设备。
[0016]在一种可能的实施方式中,根据获得的审查结果和所述模型梯度更新集合,进行基于贝叶斯差分隐私的全局模型更新,获得更新后的全局模型,包括:
[0017]如果确定所述模型任务预测结果处于预设准确率审查范围,基于动态准确率审查随机率的互斥概率和所述模型梯度更新集合,进行基于贝叶斯差分隐私的全局模型更新,获得更新后的全局模型。
[0018]在一种可能的实施方式中,进行基于贝叶斯差分隐私的全局模型更新,包括:
[0019]使用次采样高斯噪声机制,结合预设采样估计器,在所述全局模型更新中,进行基于学习机器模型的分层加噪扰动,消除来自所述至少一个协作方设备中的数据的非独立同分布特性。
[0020]第二方面,一种模型聚合训练方法,应用于协作方设备,所述方法包括:
[0021]响应于接收到的主训练设备发送的初始化后的机器学习模型,对本地数据进行数据预处理,根据获得的预处理后的数据构建本地训练数据集,并创建第二隐私会计;
[0022]根据所述本地数据训练集,对所述初始化后的机器学习模型进行本地模型训练,获得模型梯度更新数据;
[0023]根据所述模型梯度更新数据和预设发送策略,将所述模型梯度更新数据发送给所述主训练设备;所述预设发送策略用于确定是否跳过梯度检查,直接将所述模型梯度更新数据发送;
[0024]根据所述第二隐私会计,进行本地隐私度检查,并根据检查结果确定是否参与联邦训练。
[0025]在一种可能的实施方式中,响应于接收到的主训练设备发送的初始化后的机器学习模型,对本地数据进行数据预处理,根据获得的预处理后的数据构建本地训练数据集,并创建第二隐私会计,包括:
[0026]在可移植的轻量容器中解包联邦学习应用以及依赖包,并根据所述联邦学习应用以及依赖包构建模型本地训练环境;
[0027]对本地源数据进行数据预处理,获得本地训练数据集;所述数据预处理包括区分特征矩阵、处理缺失数据、编码分类数据以及特征缩放中的一项或多项;
[0028]使用切片采样或随机采样对预设隐私数据进行隐私放大,获得初始化后的第二隐私会计。
[0029]在一种可能的实施方式中,根据所述模型梯度更新数据和预设发送策略,将所述模型梯度更新数据发送给所述主训练设备,包括:
[0030]对所述模型梯度更新数据进行数据质量分析,获得免检权重;
[0031]如果所述免检权重符合预设范围,则跳过梯度检查,向所述主训练设备上传所述模型梯度更新数据;
[0032]如果所述免检权重不符合所述预设范围,则不跳过所述梯度检查,并根据本轮前
的全局模型参数值与本轮中的所有协作方设备对应的平均模型参数以及差分校正函数,获得本轮训练后产生的第一贡献值;当所述第一贡献值不小于平均贡献值时,则向主训练设备传递所述模型梯度更新数据。
[0033]在一种可能的实施方式中,根据所述第二隐私会计,进行本地隐私度检查,并根据检查结果确定是否参与联邦训练,包括:
[0034]使用所述第二隐私会计更新本地隐私消耗,使用中心极限定理进行隐私合并,获得目标隐私成本;
[0035]如果所述目标隐私成本超过第二预设隐私成本,确定不参与联邦训练。
[0036]第三方面,提供一种模型聚合训练装置,应用于主训练设备,所述装置包括:
[0037]第一处理单元,用于将初始化后的机器学习模型下发给至少一个协作方设备,分别获得所述至少一个协作方设备发送的模型梯度更新参数,并根据获得的至少一个所述模型梯度更新参数,构建模型梯度更新集合;其中,模型梯度更新参数为协作方设备基于本地数据对所述初始化后的机器学习模型进行训练后所获得的;
[0038]第二处理单元,用于使用预设测试集进行联邦学习训练任务的全局模型预测,获得本轮模型准确率,并对所述本轮模型准确率进行准确率审查,并根据获得的审查结果和所述模型梯度更新集合,进行基于贝叶斯差分隐私的全局模型更新,获得更新后的全局模型,所述全局模型包括在所述至少一个协作方设备上训练的所有初始化本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型聚合训练方法,其特征在于,应用于主训练设备,所述方法包括:将初始化后的机器学习模型下发给至少一个协作方设备,分别获得所述至少一个协作方设备发送的模型梯度更新参数,并根据获得的至少一个所述模型梯度更新参数,构建模型梯度更新集合;其中,模型梯度更新参数为协作方设备基于本地数据对所述初始化后的机器学习模型进行训练后所获得的;使用预设测试集进行联邦学习训练任务的全局模型预测,获得本轮模型准确率,并对所述本轮模型准确率进行准确率审查,并根据获得的审查结果和所述模型梯度更新集合,进行基于贝叶斯差分隐私的全局模型更新,获得更新后的全局模型,所述全局模型包括在所述至少一个协作方设备上训练的所有初始化后的机器学习模型;通过第一隐私会计对所述全局模型的本轮训练过程进行追踪,获得本轮隐私成本;汇总所述本轮前的所有训练轮分别对应的最大隐私成本,获得合并隐私消耗;如果所述合并隐私消耗大于第一预设隐私预算,确定结束联邦训练,获得目标机器学习模型。2.如权利要求1所述的方法,其特征在于,在将所述初始化后的机器学习模型下发给至少一个协作方设备之前,所述方法还包括:使用贝叶斯差分隐私技术,创建第一隐私会计。3.如权利要求2所述的方法,其特征在于,在将所述初始化后的机器学习模型下发给至少一个协作方设备之前,所述方法还包括:将打包后的联邦学习应用以及依赖包发送给所述至少一个协作方设备中的可移植的轻量容器中,以使所述至少一个协作方设备创建所述初始化后的机器学习模型的本地训练环境;以及,根据预设联邦学习训练参数中经过认证的协作方集合,确定下发所述初始化后的机器学习模型的至少一个协作方设备。4.如权利要求1

3任一所述的方法,其特征在于,根据获得的审查结果和所述模型梯度更新集合,进行基于贝叶斯差分隐私的全局模型更新,获得更新后的全局模型,包括:如果确定所述模型任务预测结果处于预设准确率审查范围,基于动态准确率审查随机率的互斥概率和所述模型梯度更新集合,进行基于贝叶斯差分隐私的全局模型更新,获得更新后的全局模型。5.如权利要求4所述的方法,其特征在于,进行基于贝叶斯差分隐私的全局模型更新,包括:使用次采样高斯噪声机制,结合预设采样估计器,在所述全局模型更新中,进行基于学习机器模型的分层加噪扰动,消除来自所述至少一个协作方设备中的数据的非独立同分布特性。6.一种模型聚合训练方法,其特征在于,应用于协作方设备,所述方法包括:响应于接收到的主训练设备发送的初始化后的机器学习模型,对本地数据进行数据预处理,根据获得的预处理后的数据构建本地训练数据集,并创建第二隐私会计;根据所述本地数据训练集,对所述初始化后的机器学习模型进行本地模型训练,获得模型梯度更新数据;根据所述模型梯度更新数据和预设发送策略,将所述模型梯度更新数据发送给所述主
训练设备;所述预设发送策略用于确定是否跳过梯度检查,直接将所述模型梯度更新数据发送;根据所述第二隐私会计,进行本地隐私度检查,并根据检查结果确定是否参与联邦训练。7.如权利要求6所述的方法,其特征在于,响应于接收到的主训练设备发送的初始化后的机器学习模型,对本地数据进行数据预处理,根据获得的预处理后的数据构建本地训练数据集,并创建第二隐私会计,包括:在可移植的轻量容器中解包联邦学习应用以及依赖包,并根据所述联邦学习应用以及依赖包构建模型本地训练环境;对本地源数据进行数据预处理,获得本地训练数据集;所述数据预处理包括区分特征矩阵、处理缺失数据、编码分类数据以及特征缩放中的一项或多项;使用切片采样或随机采样对预设隐私数据进行隐私放大,获得初始化后的第二隐私会计。8.如权利要求7所述的方法,其特征在于,根据所述模型梯度更新数据和预设发送策略,将所述模型梯度更新数据发送给所述主训练设备,包括:对所述模型梯度更新数据进行数据质量分析,获得免检权重;如果所述免检权重符合预设范围,则跳过梯度检查,向所述主训练设备上传所述模型梯度更新数据;如果所述免检权重不符合所述预设范围,则不跳过所述梯度检查,并根据本轮前的全局模型参数值与本轮中的所有协作方设备对应的平均模型参数以及差分校正函数,获得本轮训练后产生的第一贡献值;当所述第一贡献值不小于平均贡献值时,则向主训练设备传递所述模型梯度更新数据。9.如权利要求6

8任一所述的方法,其特征在于,根据所述第二隐私会计,进行本地隐私度检查,并根据检查结果确定是否参与联邦训练,包括:使用所述第二隐私会计更新本地隐私消耗,使用中心极限定理进行隐私合并,获得目标隐私成本;如果所述目标隐私成本超过第二预设隐私成本,确定不参与联邦训练。10.一种模型聚合训练装置,其特征在于,应用于主训练设备,所述装置包括:第一处理单元,用于将初始化后的机器学习模型下发给至少一个协作方设备,分别获得所述至少一个协作方设备发送的模型梯度更新参数,并根据获得的至少一个所述模型梯度更新参...

【专利技术属性】
技术研发人员:周涛杨凯文贾晋康刘紫千
申请(专利权)人:天翼安全科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1