【技术实现步骤摘要】
一种自适应的隐私保护联邦学习方法
[0001]本专利技术涉及联邦学习(Federated Learning)安全领域和数据隐私领域,具体涉及一种自适应的隐私保护联邦学习方法。
技术介绍
[0002]联邦学习是一种分散式机器学习技术,其中多个客户端设备共同学习一个神经网络模型而不将其本地数据发送到云服务器。与集中式机器学习相比,联邦学习显着减轻了客户的隐私问题,因为它不需要集中他们的私人数据。然而,研究人员发现联邦学习仍然面临各种数据安全和隐私问题。这是因为参与者传递的模型参数和梯度信息可能会泄露数据隐私,导致攻击者可以通过这些信息重构出客户端本地的训练数据。
[0003]针对上述的隐私泄露问题,联邦学习的隐私保护技术主要分为以下两类:1)基于加密的隐私保护的方法,主要使用密码技术进行隐私保护,主流的方法有同态加密和安全多方计算。该方法可以保留原始模型训练的准确性并实现高隐私保证。然而,这类方法会产生大量的通信成本和计算成本,不太适用于参与者多、数据量大的联邦学习场景。2)基于扰动的隐私保护方法,主流方法是差分隐私技术(DP)。差分隐私技术通过在梯度信息上添加可度量的噪声来扰动梯度,从而防止真实梯度泄露带来的隐私攻击。虽然差分隐私技术由于其高效轻量的特点更适合联邦学习场景,现有基于差分隐私技术的联邦学习方法无法有效地权衡模型的隐私性和准确率,特别是在需要高可用性的模型情况下,数据的隐私保护得不到充分的保障。
[0004]因此,针对现有技术所存在的问题,当下迫切需要研究如何使用差分隐私技术实现高效、轻量、 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种自适应的隐私保护联邦学习方法,其特征在于,包含如下步骤:1):初始化阶段;1.1)收集与联邦学习任务相关的公共样本作为评估数据集;1.2)初始化全局模型;1.3)初始化总的隐私预算;2):根据评估数据集和全局模型评估当前通信轮次的隐私泄露风险;3):根据评估的隐私泄露风险对总的隐私预算进行分解,得到当前通信轮次的隐私预算;4):根据隐私预算和当前全局模型,采用自适应的差分隐私随机梯度下降法开展本地模型训练得到新的本地模型;4.1)将分配预算转化为零均值集中差分隐私范式并用全局模型初始化本地模型;4.2)根据隐私预算和当前模型训练周期计算当前模型训练周期使用的噪声等级;4.3)根据噪声等级更新剩余的隐私预算;4.4)根据当前模型迭代周期计算当前模型迭代周期使用的梯度裁剪系数;4.5)根据反向传播计算当前模型迭代周期的梯度;4.6)根据梯度裁剪系数对当前模型迭代周期生成的梯度进行裁剪;4.7)根据噪声等级和梯度裁剪系数计算噪声扰动参数,并在裁剪后的梯度上按噪声扰动参数添加高斯噪声得到扰动后梯度;4.8)根据扰动后的梯度按梯度下降发更新本地模型(初始值为全局模型);迭代4.2)到4.8)直到4.3)计算的剩余隐私预算小于0或模型训练周期结束;5)本地模型聚合得到新的全局模型:循环执行步骤2)到5),直至全局模型收敛,联邦学习模型训练停止。2.如权利要求书1所述的自适应的隐私保护联邦学习方法,其特征在于,所述的评估当前通信轮次的隐私泄露风险具体为:服务器使用收集到的评估数据集来测试当前全局模型的准确率,并用其作为隐私泄露风险指示器来表征当前通信轮次的隐私泄露风险,考虑到全局模型的准确率会出现一定范围的小波动,为降低波动对隐私泄露风险评估的影响,若S
t
表示t通信轮次的全局模型的准确率,模型准确率增值表示为:当训练刚起步阶段,缺乏有效的全局模型准确率数据,和取值为1。3.如权利要求书1所述的自适应的隐私保护联邦学习方法,其特征在于,所述的隐私预算进行分解具体为:在完成隐私泄露风险测算后,根据当前通信轮次的隐私风险计算当前通信轮次的隐私预算∈
t
:其中∈是总隐私预算,∈
c
是已消耗预算,T代表预设的总通信轮次,是当前通信轮次的全局模型准确率增量,用于评估隐私泄露风险。
4.如权利要求书1所述的自适应的隐私保护联邦学习方法,其特征在于,所述的自适应的差分隐私随机梯度下降法ADP
‑
SGD具体为:每个客户端基于下发的全局模型和根据隐私泄露风险得到的隐私预算,其使用自身本地数据集开展本地模型训练;在ADP
‑
SGD中,首先将分配预算∈
t
转化为零均值集中差分隐私zCDP范式,因此,∈
t
转化为ρ
技术研发人员:王志波,胡佳慧,申永生,任奎,
申请(专利权)人:杭州城市大脑有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。