一种基于斯塔克尔伯格博弈的多因子联邦学习激励机制制造技术

技术编号：35032644 阅读：48 留言：0更新日期：2022-09-24 23:07

本发明专利技术设计了一种基于斯塔克尔伯格博弈的多因子联邦学习激励机制，旨在打破无激励条件下的囚徒困境，选取真正符合联邦学习任务要求的用户，最大化联邦学习效用，确保联邦学习生态系统的健康发展。其主要思想是从开销和效用两方面入手，设计高效公平的联邦学习激励机制。我们基于反向拍卖设计开销选择算法，从而减少任务发布者选取数据拥有者的开销，并设计多因子奖励函数进行激励。在此基础上，我们建立了斯塔克尔伯格博弈模型，在动态环境下实现最佳奖励策略和最佳训练策略。最佳奖励策略和最佳训练策略。最佳奖励策略和最佳训练策略。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于斯塔克尔伯格博弈的多因子联邦学习激励机制

：
[0001]本专利技术属于人工智能领域，涉及联邦学习激励机制。

技术介绍
：
[0002]在缺乏激励的条件下，联邦学习陷入囚徒困境。目前，大多数的激励机制根据用户对联邦学习的贡献提供奖励，其基于贡献的数据量大小、可花费的隐私预算、训练时间、计算和通信花销、提升的模型精度、信誉来评估贡献。然而，仅仅考虑单一贡献指标，即单因子，无法选取真正符合联邦学习任务要求的用户，这不利于联邦学习生态系统的健康发展。因此，迫切需要一个多因子评估机制。
[0003]博弈论被视为研究联邦学习激励机制的有力工具，特别是在分析联邦学习双方为最大化自身利益进行复杂的交互时，一般采用斯塔克尔伯格博弈进行建模降低复杂度。

技术实现思路
：
[0004]本专利技术的目的是提供一种基于斯塔克尔伯格博弈的多因子联邦学习激励机制，为打破无激励条件下的联邦学习囚徒困境，采用多因子评估机制，并基于斯塔克尔伯格博弈设计新的激励机制，为实现上述目的，本专利技术采用如下技术方案：
[0005]步骤一：发布任务信息：任务发布者作为斯塔克尔伯格博弈中的领导者，将联邦学习任务信息发布给数据拥有者，任务信息包括奖励策略、算力、数据量等。
[0006]步骤二：报告开销：作为跟随者的数据拥有者在收到奖励策略等任务信息后，基于反向拍卖报告完成任务所需的开销。任务发布者选取前K个开销小的数据拥有者参与联邦学习。
[0007]步骤三：本地训练：数据拥有者接收全局模型进行模型训练，并上传梯度...

【技术保护点】

【技术特征摘要】
1.一种基于斯塔克尔伯格博弈的多因子联邦学习激励机制，具体步骤如下：步骤一：发布任务信息：任务发布者作为斯塔克尔伯格博弈中的领导者，将联邦学习任务信息发布给数据拥有者，任务信息包括奖励策略、算力、数据量等；步骤二：报告开销：作为跟随者的数据拥有者在收到奖励策略等任务信息后，基于反向拍卖报告完成任务所需的开销；任务发布者选取前K个开销小的数据拥有者参与联邦学习；步骤三：本地训练：数据拥有者接收全局模型进行模型训练，并上传梯度；步骤四：攻击检测：由于联邦学习参数平均的特性，恶意攻击者在梯度中加入小的随机噪声并不会影响全局...

【专利技术属性】
技术研发人员：陈玉玲，周辉，钱晓斌，胡建文，白瑞，
申请(专利权)人：贵州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人