一种基于差分隐私的联邦学习安全聚合方法技术

技术编号：42648335 阅读：41 留言：0更新日期：2024-09-06 01:42

本发明专利技术公开了一种基于差分隐私的联邦学习安全聚合方法，方法包括：服务端根据收集的信息向各客户端分配隐私预算，并制作评分数据集。客户端根据分配的隐私预算初始化模型训练优化器，并进行模型训练以获得模型更新数据，然后根据隐私预算向服务端上传数据。服务端随机抽取部分客户端参与聚合，通过预设方法计算每个客户端的聚合权重，并基于权重对模型更新数据进行聚合，然后将其分发给各个客户端。本方法根据用户的不同隐私需求提供不同的隐私预算，避免浪费。在聚合时，使用评分数据集对用户上传的模型更新数据进行测试，减少投毒攻击的影响。聚合权重由隐私预算和模型评分两个因素决定，提高了聚合后模型的可用性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机科学领域，更具体地，涉及一种基于差分隐私的联邦学习安全聚合方法。

技术介绍

1、联邦学习是一种分布式机器学习方法，它允许多个设备或服务器协同训练一个共享的模型，同时保持各自数据的隐私性和安全性。在联邦学习的环境中，数据通常分布在多个设备上，每个设备使用其本地数据对模型进行训练，然后只将模型的更新(例如梯度信息或参数更新)发送到中心服务器。中心服务器聚合这些更新，并将聚合后的模型参数发送回各个设备，以便进行下一轮的本地训练。这个过程重复进行，直到达到预定的性能标准或收敛条件。而如果恶意客户端参与到联邦学习中来，他们可以进行成员推理攻击和投毒攻击，严重危害联邦学习的安全。

2、近年来，在联邦学习中进行隐私保护的方案相继被提出。phong等人提出了一种基于同态加密的联邦学习算法，利用加法同态加密来保护梯度数据，从而抵御成员推理攻击(l.t.phong,y.aono,t.hayashi,l.wang and s.moriai,"privacy-preserving deeplearning via additively homomorphic encryption,"in ieee transactions oninformation forensics and security,vol.13,no.5,pp.1333-1345,may 2018,doi:10.1109/tifs.2017.2787987.)，但同态加密的计算代价过于高昂，差分隐私因为其计算简单，得到了广泛的应用。mcmahan等人在20

3、现有技术公开号为cn116402167a提出了一种基于差分隐私针对投毒攻击的联邦学习系统和方法，通过对称加密和差分隐私技术，防止攻击者推断用户的敏感信息，实现服务器在不侵犯用户隐私的情况下验证模型参数是否被投毒，并降低计算和通信开销，但该方案存在没有充分考虑客户隐私预算的问题。

技术实现思路

1、本专利技术为克服现有技术中没有充分考虑到投毒攻击，客户隐私预算和聚合时的权重分配问题，提供一种基于差分隐私的联邦学习安全聚合方法。包括如下步骤：

2、s1：服务端根据收集到的不同客户端的信息向各客户端分配隐私预算，并根据聚合的应用场景收集公开数据制作评分数据集；客户端根据所分配的隐私预算以及本地训练环境，初始化预设模型训练使用的优化器，并将其应用于本地模型训练中；

3、s2：客户端使用自身的数据集对预设模型进行训练得到模型更新数据；

4、s3：客户端根据所分配的隐私预算，向服务端上传本地的模型更新数据；

5、s4：服务端随机抽取部分客户端参与聚合，并通过预设方法计算出每个客户端的最终聚合权重；

6、s5：服务端根据最终聚合权重，对选择的客户端的模型更新数据进行聚合，得到最终的模型更新数据，并将其分发给各个客户端。

7、进一步地，所述步骤s1的具体过程为：

8、s1.1：服务端收集客户端的应用场景和数据特征与隐私需求；

9、s1.2：服务端根据收集到的信息，制作评分数据集，保证评分数据集的标签与客户端的标签一致；

10、s1.3：服务端根据收集到的信息分配隐私预算；

11、s1.4：将隐私预算分发给各个客户端；

12、s1.5：客户端根据服务端分配的隐私预算、本地数据集的大小、采样比例、训练轮次、最大范数来初始化满足差分隐私定义的模型优化器器并应用于本地模型训练中。

13、进一步地，所述步骤s1.3，设定隐私预算阈值q，当客户端的隐私需求大于阈值q时，分配第一隐私预算；当客户端的隐私需求小于或等于阈值q时，分配第二隐私预算，其中，第一隐私预算小于第二隐私预算。

14、进一步地，所述步骤s1.5采用facebook开源的opacus库的函数，得到满足差分隐私定义的模型优化器。

15、进一步地，所述步骤s2的具体过程为：

16、s2.1：客户端使用本地数据集对模型进行训练，得到训练后的模型参数；

17、s2.2：计算本地训练后的模型相较于训练前的模型的模型更新数据。

18、进一步地，所述步骤s3客户端上传模型更新数据的具体过程为：

19、s3.1：计算当前累积的隐私预算消耗；

20、s3.2：判断隐私预算是否耗尽，如果耗尽则退出本次联邦学习过程并告知服务端，如果没有耗尽则上传模型更新数据。

21、进一步地，所述步骤s3.1采用moments accountant方法计算累积的隐私预算消耗。

22、进一步地，所述步骤s4的具体过程为：

23、s4.1：服务端抽取待聚合的客户端，使用评分数据集对被抽取的客户端上传的模型更新数据进行测试，根据测试精确度得到分数列表，对分数列表进行k-means聚类，分为两类kh、kl组；

24、s4.2：根据分数列表按预设方法计算得到阈值；

25、s4.3：将中心点位于阈值以上的客户端纳入最终聚合，计算得到分数权重；

26、s4.4：服务端根据被选中聚合的客户端的隐私预算，计算得到隐私权重；

27、s4.5：服务端将分数权重和隐私权重进行平均，得到每个客户端的最终聚合权重。

28、进一步地，所述步骤s5的聚合更新，是服务端根据最终聚合权重对选中的客户端上传的模型更新数据进行加权平均得到最终的模型更新数据。

29、进一步地，所述步骤s4.2的阈值计算，是通过计算分数列表的均值和标准差，以均值减去标准差得到的。

30、本专利技术与现有技术相比，具有如下优点和有益效果：

31、1.提供个性化的隐私保护。用户根本文档来自技高网...

【技术保护点】

1.一种基于差分隐私的联邦学习安全聚合方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于差分隐私的联邦学习安全聚合方法，其特征在于，所述步骤S1的具体过程为：

3.根据权利要求2所述的一种基于差分隐私的联邦学习安全聚合方法，其特征在于，所述步骤S1.3，设定隐私预算阈值Q，当客户端的隐私需求大于阈值Q时，分配第一隐私预算；当客户端的隐私需求小于或等于阈值Q时，分配第二隐私预算，其中，第一隐私预算小于第二隐私预算。

4.根据权利要求2所述的一种基于差分隐私的联邦学习安全聚合方法，其特征在于，所述步骤S1.5采用FaceBook开源的Opacus库的函数，得到满足差分隐私定义的模型优化器。

5.根据权利要求1所述的一种基于差分隐私的联邦学习安全聚合方法，其特征在于，所述步骤S2的具体过程为：

6.根据权利要求1所述的一种基于差分隐私的联邦学习安全聚合方法，其特征在于，所述步骤S3客户端上传模型更新数据的具体过程为：

7.根据权利要求6所述的一种基于差分隐私的联邦学习安全聚合方法，其特征在于，所述步

8.根据权利要求1所述的一种基于差分隐私的联邦学习安全聚合算法，其特征在于，所述步骤S4的具体过程为：

9.根据权利要求1所述的一种基于差分隐私的联邦学习安全聚合方法，其特征在于，所述步骤S5的聚合更新，是服务端根据最终聚合权重对选中的客户端上传的模型更新数据进行加权平均得到最终的模型更新数据。

10.根据权利要求8所述一种基于差分隐私的联邦学习安全聚合方法，其特征在于，所述步骤S4.2的阈值计算，是通过计算分数列表的均值和标准差，以均值减去标准差得到的。

...

【技术特征摘要】

1.一种基于差分隐私的联邦学习安全聚合方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于差分隐私的联邦学习安全聚合方法，其特征在于，所述步骤s1的具体过程为：

3.根据权利要求2所述的一种基于差分隐私的联邦学习安全聚合方法，其特征在于，所述步骤s1.3，设定隐私预算阈值q，当客户端的隐私需求大于阈值q时，分配第一隐私预算；当客户端的隐私需求小于或等于阈值q时，分配第二隐私预算，其中，第一隐私预算小于第二隐私预算。

4.根据权利要求2所述的一种基于差分隐私的联邦学习安全聚合方法，其特征在于，所述步骤s1.5采用facebook开源的opacus库的函数，得到满足差分隐私定义的模型优化器。

5.根据权利要求1所述的一种基于差分隐私的联邦学习安全聚合方法，其特征在于，所述步骤s2的具体过程为：

6.根据权利...

【专利技术属性】
技术研发人员：凌捷，熊健东，罗玉，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人