一种基于Paillier的联邦学习数据隐私保护方法技术

技术编号：37543315 阅读：21 留言：0更新日期：2023-05-12 16:12

本发明专利技术公开了一种基于Paillier的联邦学习数据隐私保护方法，其实现步骤为：构建联邦学习系统，联邦服务器初始化参数并分发个客户端，随机选择一个客户端生成公钥和私钥并共享给其余的客户端，全部客户端根据公钥和私钥分别建立明文池和噪声池。在训练过程中，客户端根据自身的私有数据计算得到局部梯度，然后与联邦学习系统中的其余客户端同步梯度范围，确定量化系数，客户端根据量化系数量化梯度，然后基于明文池和噪声池加密梯度数据并发送给服务器，服务器在收到所有客户端的加密梯度后，直接聚合梯度而不进行解密，然后返回聚合梯度给客户端。客户端根据私钥进行解密，更新自身模型，进入下一个迭代。进入下一个迭代。进入下一个迭代。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Paillier的联邦学习数据隐私保护方法

[0001]本专利技术涉及一种保护方法，具体涉及一种基于Paillier的联邦学习数据隐私保护方法，属于数据处理

技术介绍

[0002]近年来机器学习的发展如火如荼，在图像处理、自然语言处理、强化学习、对抗式生成网络等领域取得了令人瞩目的成果。在这些领域取得良好的效果无疑离不开大量数据进行训练。
[0003]2016年，为解决安卓系统更新的问题，谷歌提出可以在用户的手机上部署神经网络训练，只需要将训练好的模型参数上传，而不需要上传用户数据，一定程度上保证了个人数据的私密，这就是联邦学习（federated learning）的核心理念。在联邦学习中，客户端与服务端通过交换梯度训练全局模型，尽管梯度信息看上去是一些杂乱无章、毫无规律的数据，但是攻击者仍然可以通过部分梯度信息推测出客户端上的训练数据类别，甚至推测出客户端身份。因此，加法同态加密（HE），特别是基于合数剩余问题的加密算法Paillier，在联邦学习中特别有吸引力，因为它提供了强大的隐私保障，而不会损失学习准确性。基于Paillier算法的联邦学习提供了不错的隐私保护性，但是模幂运算影响了它的计算性能。
[0004]专利：一种联邦学习系统中的快速 Paillier加密方法（申请号：202210527155 .5），包括：步骤1，离线得出以模幂运算密态零集合：在训练协议离线阶段，联邦学习系统各参与方根据自身对应训练任务确定自身加密任务总次数，各参与在本地用公钥以模幂运算生成与自...

【技术保护点】

【技术特征摘要】
1.一种基于Paillier的联邦学习数据隐私保护方法，其特征在于，所述方法包括以下步骤：S1服务器根据模型结构生成模型参数，然后将模型参数共享给联邦学习中的其他客户端，S2随机选择一个客户端生成公钥和私钥，然后分发给所有参与训练的客户端，S3客户端分别根据公钥和私钥建立明文池和噪声池，其中噪声池根据私钥产生，S4客户端根据自身的私有数据集和模型参数计算得到梯度，然后将梯度进行量化，S5量化后的梯度数据根据明文池和噪声池进行加密，从而跳过加密过程中的模幂运算，S6将加密后的数据发送给服务器进行聚合操作，在等待时间利用自乘更新噪声池，S7服务器在收到所有客户端发送的加密梯度后执行聚合操作，S8客户端收到聚合后的加密梯度后利用私钥进行解密，S9解密后的梯度利用反量化公式计算得到原始梯度，更新客户端上的局部模型，进入下一轮迭代。2.如权利要求1所述的一种基于Paillier的联邦学习数据隐私保护方法，其特征在于，所述S1中，服务器根据模型结构初始化模型参数，然后将初始化的模型参数共享给联邦学习中的其他客户端。3.如权利要求2所述的一种基于Paillier的联邦学习数据隐私保护方法，其特征在于，所述S2中，随机选择一个客户端生成公钥和私钥，然后分发给所有参与训练的客户端，其中，和均为长度为1024
‑
bit的大素数，，，是两个大素数成绩，和都是公钥。4.如权利要求3所述的一种基于Paillier的联邦学习数据隐私保护方法，其特征在于，所述S3中，客户端分别根据公钥和私钥建立明文池和噪声池，明文池和噪声池分别储存，其中，和是储存在明文池和噪声池的预计算结果，为明文，为噪声，在联邦学习中，客户端同时持有私钥和公钥，因此，私钥用来产生噪声。5.如权利要求4所述的一种基于Paillier的联邦学习数据隐私保护方法，其特征在于，所述S4中，客户端根据自身的私有数据集和模型参数反向求导计算得...

【专利技术属性】
技术研发人员：汪芸，徐超，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人