基于联邦学习的模型训练方法技术

技术编号:43321442 阅读:37 留言:0更新日期:2024-11-15 20:21
本申请公开了一种基于联邦学习的模型训练方法,包括:获取协调方发送的与当前参与方对应的预设数据长度的混淆因子数据组和混淆承诺;其中,混淆因子数据组和混淆承诺由协调方基于多个参与方提供的样本数据和参与方数量生成;根据混淆因子数据组和混淆承诺进行数据加密处理,得到当前参与方的加密数据;基于当前参与方的加密数据进行模型计算,得到当前参与方的计算结果;将当前参与方的计算结果发送至协调方,以获取协调方基于多个参与方的计算结果反馈的汇总计算结果,并根据汇总计算结果对模型参数进行调整。本申请技术方案降低了加密后密文数据的数据量,进而可以降低后续模型训练过程所涉及的数据量,从而提高模型训练效率。

【技术实现步骤摘要】

本申请属于联邦学习,具体涉及一种基于联邦学习的模型训练方法


技术介绍

1、联邦学习(federated learning)是一种分布式机器学习方法,旨在解决数据隐私和安全性的问题。联邦学习通过在本地设备上进行训练,将模型参数更新的信息聚合在一起,从而实现在保护数据隐私的同时进行模型训练。现有方案普遍使用了基于公钥密码学的半同态或全同态加密算法,来构建逻辑回归协议。使用传统的公钥密码学同态加密算法对方案进行构造,构造模式简单,实现简单。但是同态加密算法本身是复杂运算,在一些轻客户端无法支持,且会导致密文膨胀问题,原本的一个数据类型可能就是2个字节,经同态算法加密后的数据为512字节,整个数据膨胀会变为256倍,会增大数据运算量和对加密设备的限制,从而使得联邦学习建模效率较低,速度较慢。


技术实现思路

1、本申请的目的在于提供一种基于联邦学习的模型训练方法,以降低联邦学习过程中密文膨胀,提高模型训练效率。

2、本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。...

【技术保护点】

1.一种基于联邦学习的模型训练方法,其特征在于,包括:

2.根据权利要求1所述的基于联邦学习的模型训练方法,其特征在于,所述混淆因子数据组的数量与所述参与方数量相同;所述混淆因子数据组包括多个随机生成的预设数据长度的混淆因子,一个混淆因子对应于一个样本数据;所述当前参与方对应的混淆承诺为所述当前参与方的样本数据对应的多个混淆因子之和。

3.根据权利要求1所述的基于联邦学习的模型训练方法,其特征在于,所述当前参与方的加密数据包括多个数据密文分片;根据所述混淆因子数据组和所述混淆承诺进行数据加密处理,得到所述当前参与方的加密数据,包括:

>4.根据权利要求1...

【技术特征摘要】

1.一种基于联邦学习的模型训练方法,其特征在于,包括:

2.根据权利要求1所述的基于联邦学习的模型训练方法,其特征在于,所述混淆因子数据组的数量与所述参与方数量相同;所述混淆因子数据组包括多个随机生成的预设数据长度的混淆因子,一个混淆因子对应于一个样本数据;所述当前参与方对应的混淆承诺为所述当前参与方的样本数据对应的多个混淆因子之和。

3.根据权利要求1所述的基于联邦学习的模型训练方法,其特征在于,所述当前参与方的加密数据包括多个数据密文分片;根据所述混淆因子数据组和所述混淆承诺进行数据加密处理,得到所述当前参与方的加密数据,包括:

4.根据权利要求1所述的基于联邦学习的模型训练方法,其特征在于,基于所述当前参与方的加密数据进行模型计算,得到所述当前参与方的计算结果,包括:

5.根据权利要求4所述的基于联邦学习的模型训练方法,其特征在于,所述多个参与方提供的样本数据包括训练数据;所述当前参与方的加密数据包括所述训练数据对应的数据密文分片;所述模型参数包括第一模型参数和第二模型参数;根据所述当前参与方的加密数据和模型参数进行计算,得到第一秘密参数分片,包括:

6.根据权利要求4所述的基于联邦学习的模型训...

【专利技术属性】
技术研发人员:李昊轩白兴强贺双洪王章李辉忠张开翔姚辉亚
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1