基于斯塔克尔伯格博弈的无偏联邦学习激励方法及设备技术

技术编号：38393112 阅读：16 留言：0更新日期：2023-08-05 17:46

本申请实施例公开了基于斯塔克尔伯格博弈的无偏联邦学习激励方法及设备，用于在每轮训练的目标参与方随机且数量不定的情况下保证模型的无偏性，且实现更快更优的模型收敛。本申请实施例方法包括：基于每个备选参与方的预期参与水平确定用户效用函数以及服务效用函数；基于斯塔克尔伯格博弈模型确定与服务效用函数以及用户效用函数对应的目标优化问题；求解目标优化问题，获得每个备选参与方的目标参与水平以及对应的目标激励函数；基于每轮训练的目标参与方进行联邦学习，直至模型收敛获得目标模型；每轮训练的目标参与方，根据目标参与水平对多个备选参与方进行随机采样确定，目标模型为基于所述每轮训练的目标参与方的实际参与水平聚合得到。实际参与水平聚合得到。实际参与水平聚合得到。

全部详细技术资料下载

【技术实现步骤摘要】
基于斯塔克尔伯格博弈的无偏联邦学习激励方法及设备

[0001]本申请实施例涉及联邦学习领域，尤其涉及基于斯塔克尔伯格博弈的无偏联邦学习激励方法以及相关设备。

技术介绍

[0002]联邦学习作为一种新兴的分布式机器学习范式出现，它使许多用户端在中央服务端的协调下能够协同训练机器学习模型，同时保持训练数据的私密性。在公司或机构需要用户的海量数据进行价值模型的机器学习以盈利，国家越发重视数据隐私保护的大数据时代，联邦学习的地位正在大幅提升。为了鼓励备选参与方积极参与联邦学习，需要向每个参与方提供足够的补偿，也就是激励。
[0003]然而，现有联邦学习的激励机制都是以每轮训练的目标参与方数量固定的情况下设计的。在实际应用中，备选参与方并非有条件参与每轮训练，而每轮训练的目标参与方的训练数据难以代表所有备选参与方的数据特征，导致模型存在严重偏差，也就是说导致模型仅在特定数据集下具有良好的表现。因此，亟需一种在保证模型全局表现的前提下考虑到每轮目标参与方随机性的联邦学习激励方法。

技术实现思路

[0004]本申请实施例提供了基于斯塔克尔伯格博弈的无偏联邦学习激励方法及设备，用于在每轮训练的目标参与方随机的情况下实现更快更优的模型收敛。
[0005]本申请实施例第一方面提供一种基于斯塔克尔伯格博弈的无偏联邦学习激励方法，应用于聚合服务器，包括：
[0006]基于每个备选参与方的预期参与水平确定每个备选参与方的用户效用函数以及所述聚合服务器的服务效用函数；
[0007]基于斯塔克尔伯格...

【技术保护点】

【技术特征摘要】
1.一种基于斯塔克尔伯格博弈的无偏联邦学习激励方法，其特征在于，应用于聚合服务器，所述方法包括：基于每个备选参与方的预期参与水平确定每个备选参与方的用户效用函数以及所述聚合服务器的服务效用函数；基于斯塔克尔伯格博弈模型确定与所述服务效用函数以及所述用户效用函数对应的目标优化问题；求解所述目标优化问题，获得每个备选参与方的目标参与水平以及所述目标参与水平对应的目标激励函数，在所述目标参与水平下，所述用户效用函数以及所述服务效用函数达到斯塔克尔伯格平衡；基于每轮训练的目标参与方进行联邦学习，直至模型收敛获得目标模型；所述每轮训练的目标参与方，根据所述目标参与水平对多个备选参与方进行随机采样确定，所述目标模型为基于所述每轮训练的目标参与方的实际参与水平聚合得到；根据对应的目标激励函数，计算每个所述目标参与方的学习激励。2.根据权利要求1所述的方法，其特征在于，所述基于每个备选参与方的预期参与水平确定每个备选参与方的用户效用函数以及所述聚合服务器的服务效用函数，包括：基于每个备选参与方的预期参与水平以及预设损失函数，计算所述聚合服务器的服务效用函数；向所述每个备选参与方发送预设激励函数；接收所述每个备选参与方发送的用户效用函数，所述用户效用函数为备选参与方基于预期参与水平、预设激励函数以及预设成本函数构建得到。3.根据权利要求2所述的方法，其特征在于，所述用户效用函数为备选参与方基于预期参与水平、预设激励函数以及预设成本函数构建得到，包括：所述每个备选参与方的用户效用函数根据以下公式构建；U
c
(q
n
,P
n
)＝P
n
q
n
‑
C
n
其中，C
n
为第n个备选参与方的预设成本函数，q
n
为第n个备选参与方的预期参与水平，P
n
为所述第n个备选参与方的预设激励函数，U
c
(q
n
,P
n
)为第n个备选参与方在q
n
以及P
n
下的用户效用函数。4.根据权利要求3所述的方法，其特征在于，所述基于每个备选参与方的预期参与水平以及预设损失函数，计算所述聚合服务器的服务效用函数，包括：根据以下公式构建所述聚合服务器的服务效用函数；其中，P为所述每个目标参与方的预设激励函数构成的集合，q为所述每个目标参与方的预期参与水平构成的集合，F为预设损失函数，w
r
为第r轮的聚合模型参数，表示期望值，U
s
为所述聚合服务器在P以及q下的服务效用函数。5.根据权利要求4所述的方法，其特征在于，所述基于斯塔克尔伯格博弈模型确定与所述服务效用函数以及所述用户效用函数对应的目标优化问题，包括：基于斯塔克尔伯格博弈模型、所述服务效用函数以及所述每个备份服务器的用户效用函数进行数学推导，可获得...

【专利技术属性】
技术研发人员：罗冰，冯雨童，黄建伟，
申请(专利权)人：深圳市人工智能与机器人研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人