基于反向拍卖的联邦学习激励方法、装置及系统制造方法及图纸

技术编号：44426233 阅读：10 留言：0更新日期：2025-02-28 18:40

本发明专利技术提供一种基于反向拍卖的联邦学习激励方法、装置及系统，该方法包括：通过反向拍卖过程确定参与联邦学习的客户端；初始化全局模型，并将所述全局模型分发给各客户端；接收各客户端发送的更新模型密文；根据所述更新模型密文生成新的全局模型；确定各客户端的奖励，将所述奖励发放给对应的客户端。利用本发明专利技术方案，不仅可以实现对联邦学习的参与者数据隐私的有效保护，而且可以实现在有限预算下的资源有效分配，有效提升参与者的积极性，提升联邦学习效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及联邦学习领域，具体涉及一种基于反向拍卖的联邦学习激励方法、装置及系统。

技术介绍

1、联邦学习（federated learning，fl）作为一种分布式机器学习方法，近年来受到了众多研究学者的关注，被广泛应用于多种领域，如智慧医疗、智慧城市、金融和智能工业等。

2、在联邦学习中，数据保留在本地物理域中，参与节点使用自身数据分别训练本地模型，并共同建立联合模型。联邦学习激励机制是联邦学习系统中用于鼓励和促进参与者积极参与模型训练的机制。在联邦学习中，多个参与者共同协作，训练一个共享的机器学习模型，同时保持各自的数据隐私不被泄露。由于参与者需要消耗自己的计算资源和电力来进行模型的训练，因此需要一种激励机制来补偿这些成本，并鼓励参与者贡献高质量的数据和计算资源。

3、而如何更合理、有效地提升参与方的动力，保护参与方敏感信息不被泄露，是业界需要解决的一个重要问题。

技术实现思路

1、本专利技术提供一种基于反向拍卖的联邦学习激励方法、装置及系统，以解决现有联邦学习中参与者激励不足的问题。

2、为此，本专利技术提供如下技术方案：

3、本专利技术提供一种基于反向拍卖的联邦学习激励方法，所述方法包括：

4、通过反向拍卖过程确定参与联邦学习的客户端；

5、初始化全局模型，并将所述全局模型分发给各客户端；

6、接收各客户端发送的更新模型密文；

7、根据所述更新模型密文生成新的全局模型；>

8、确定各客户端的奖励，将所述奖励发放给对应的客户端。

9、可选地，所述通过反向拍卖过程确定参与联邦学习的客户端包括：

10、发起针对联邦学习的拍卖；

11、获取多个客户端提交的竞价信息，所述竞价信息包括出价信息和客户端信息；

12、基于预算约束和所述竞价信息，利用反向拍卖算法确定参与联邦学习的客户端。

13、可选地，所述竞价信息为加密信息；所述方法还包括：使用同态加密的私钥对所述加密信息进行解密，得到对应的出价信息和客户端信息。

14、可选地，所述基于预算约束和所述竞价信息，利用反向拍卖算法确定参与联邦学习的客户端包括：

15、确定评判目标；

16、根据所述评判目标确定评估指标；

17、根据所述评估指标对参与竞价的各客户端进行评分，并根据评分结果对所述客户端进行优先级排序；

18、依次选择优先级较高的客户端并根据所述预算约束确定参与联邦学习的客户端的数量。

19、可选地，所述评估指标包括一个或多个；多个评估指标具有相同或不同的权重。

20、可选地，所述多个评估指标包括以下至少两种或多种：数据质量、计算能力、网络带宽。

21、可选地，所述根据所述更新模型密文生成新的全局模型包括：

22、对所述更新模型密文进行解密，得到更新模型；

23、聚合各客户端的更新模型，得到新的全局模型。

24、可选地，所述确定各客户端的奖励包括：

25、确定各客户端的贡献度；

26、根据所述贡献度及预算约束确定各客户端的奖励。

27、可选地，所述确定各客户端的奖励包括：

28、确定各客户端的贡献度；

29、获取各客户端的历史行为记录，并根据所述历史行为记录确定各客户端的行为评分；

30、根据所述客户端的行为评分和贡献度计算所述客户端的综合评分；

31、根据各客户端的综合评分及预算约束，确定各客户端的奖励。

32、可选地，所述确定各客户端的贡献度包括：

33、确定各客户端的更新模型在验证集上的性能，根据所述性能确定所述各户端的贡献度；或者

34、计算各客户端的更新模型参数与所述新的全局模型参数的差异，根据所述差异确定所述客户端的贡献度；或者

35、构建表征合作收益的特征函数，并利用所述特征函数计算所述客户端的夏普利值，根据所述夏普利值确定所述客户端的贡献度。

36、本专利技术还提供一种基于反向拍卖的联邦学习激励装置，所述装置包括：

37、客户端选择模块，用于通过拍卖过程确定参与联邦学习的客户端；

38、模型分发模块，用于初始化全局模型，并将所述全局模型分发给各客户端；

39、接收模块，用于接收各客户端发送的更新模型密文；

40、模型更新模块，用于根据所述更新模型密文生成新的全局模型；

41、奖励确定模块，用于确定各客户端的奖励；

42、奖励发放模块，用于将所述奖励发放给对应的客户端；

43、其中，所述装置向监管中心发送整个联邦学习过程信息，所述联邦学习过程信息包括训练过程信息、奖励发放的合规性信息以及违规客户端的信息。

44、可选地，所述客户端选择模块包括：

45、拍卖发起单元，用于发起针对联邦学习的拍卖；

46、信息获取单元，用于获取多个客户端提交的竞价信息，所述竞价信息包括出价信息和客户端信息；

47、筛选单元，用于基于预算约束和所述竞价信息，利用反向拍卖算法确定参与联邦学习的客户端。

48、可选地，所述奖励确定模块包括：

49、贡献度确定单元，用于确定各客户端的贡献度；

50、第一奖励确定单元，用于根据所述贡献度确定各客户端的奖励。

51、可选地，所述奖励确定模块包括：

52、贡献度确定单元，用于确定各客户端的贡献度；

53、行为评分单元，用于获取各客户端的历史行为记录，并根据所述历史行为记录确定各客户端的行为评分；

54、计算单元，根据所述客户端的行为评分和贡献度计算所述客户端的综合评分；

55、第二奖励确定单元，用于根据各客户端的综合评分及预算约束，确定各客户端的奖励。

56、本专利技术还提供一种基于反向拍卖的联邦学习激励系统，所述系统包括：中央服务器、以及多个客户端；所述中央服务器包括所述的基于反向拍卖的联邦学习激励装置。

57、可选地，所述系统还包括：监管中心，用于监控联邦学习过程，记录违规客户端，并监管奖励发放的合规性。

58、另一方面，本专利技术还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器运行时执行所述的基于反向拍卖的联邦学习激励方法的步骤。

59、本专利技术提供的基于反向拍卖的联邦学习激励方法、装置及系统，通过加密方式可以确保数据在传输和计算过程中的隐私性，使得参与者可以在不泄露原始数据的情况下共同训练模型，实现了对联邦学习的参与者数据隐私的有效保护。而且，通过反向拍卖过程确定参与联邦学习的客户端，允许参与者根据其资源和需求动态出价，确保了在有限预算下的资源有效分配。通过对参与者进行激励，解决了传统联邦学习中存在的参与者动力不足的问题本文档来自技高网...

【技术保护点】

1.一种基于反向拍卖的联邦学习激励方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于反向拍卖的联邦学习激励方法，其特征在于，所述竞价信息为加密信息；所述方法还包括：

3.根据权利要求2所述的基于反向拍卖的联邦学习激励方法，其特征在于，所述基于预算约束和所述竞价信息，利用反向拍卖算法确定参与联邦学习的客户端包括：

4.根据权利要求3所述的基于反向拍卖的联邦学习激励方法，其特征在于，所述评估指标包括一个或多个；多个评估指标具有相同或不同的权重。

5.根据权利要求4所述的基于反向拍卖的联邦学习激励方法，其特征在于，所述多个评估指标包括以下至少两种或多种：数据质量、计算能力、网络带宽。

6.根据权利要求1所述的基于反向拍卖的联邦学习激励方法，其特征在于，所述根据所述更新模型密文生成新的全局模型包括：

7.根据权利要求1所述的基于反向拍卖的联邦学习激励方法，其特征在于，所述确定各客户端的奖励包括：

8.根据权利要求1所述的基于反向拍卖的联邦学习激励方法，其特征在于，所述确定各客户端的奖励包括：</p>

9.根据权利要求7或8所述的基于反向拍卖的联邦学习激励方法，其特征在于，所述确定各客户端的贡献度包括：

10.一种基于反向拍卖的联邦学习激励装置，其特征在于，所述装置包括：

11.根据权利要求10所述的基于反向拍卖的联邦学习激励装置，其特征在于，所述奖励确定模块包括：

12.根据权利要求11所述的基于反向拍卖的联邦学习激励装置，其特征在于，所述奖励确定模块包括：

13.一种基于反向拍卖的联邦学习激励系统，其特征在于，所述系统包括：中央服务器、以及多个客户端；所述中央服务器包括如权利要求10至12任一项所述的基于反向拍卖的联邦学习激励装置。

14.根据权利要求13所述的基于反向拍卖的联邦学习激励系统，其特征在于，所述系统还包括：

15.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器运行时执行权利要求1至9中任一项所述的基于反向拍卖的联邦学习激励方法的步骤。

...

【技术特征摘要】

1.一种基于反向拍卖的联邦学习激励方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于反向拍卖的联邦学习激励方法，其特征在于，所述竞价信息为加密信息；所述方法还包括：

4.根据权利要求3所述的基于反向拍卖的联邦学习激励方法，其特征在于，所述评估指标包括一个或多个；多个评估指标具有相同或不同的权重。

6.根据权利要求1所述的基于反向拍卖的联邦学习激励方法，其特征在于，所述根据所述更新模型密文生成新的全局模型包括：

7.根据权利要求1所述的基于反向拍卖的联邦学习激励方法，其特征在于，所述确定各客户端的奖励包括：

8.根据权利要求1所述的基于反向拍卖的联邦...

【专利技术属性】
技术研发人员：曹扬，朱策，管桂林，杨波，蔡惠民，
申请(专利权)人：中电科大数据研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人