一种面向联邦学习的群体众筹博弈的持续激励方法技术

技术编号：38356197 阅读：7 留言：0更新日期：2023-08-05 17:27

本发明专利技术涉及一种面向联邦学习的群体众筹博弈的持续激励方法，针对面向联邦学习的群体众筹架构中激励机制设计问题，采用基于Stackelberg双层博弈框架的激励机制，将机制设计分解为三个主要步骤，包括用户选择、酬金分配和持续性激励过程。首先针对用户感知数据质量未知的问题，将用户选择问题建模为组合多臂赌博机问题，同时为解决用户间的不公平选择问题，引入虚拟队列技术，保证用户公平性选择。其次，将联邦学习的分配策略建模为两阶段的Stackelberg博弈过程，以激励用户参与联邦学习训练，确定平台的最优定价策略和用户的最优训练策略。最后，对确保有足够的用户参与联邦学习训练过程，提出基于用户声誉的报酬激励策略，防止高声誉用户退出系统，保证持续性激励。保证持续性激励。保证持续性激励。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向联邦学习的群体众筹博弈的持续激励方法

[0001]本专利技术涉及一种面向联邦学习的群体众筹博弈的持续激励方法，属于无线通信

技术介绍

[0002]近年来，随着物联网技术的快速发展，相关的智慧服务被广泛应用到智慧城市、森林检测、智慧海洋等场景中。据估计，到2030年全球物联网设备数量将超过100万亿。因此，物联网服务场景中海量数据的收集将面临巨大挑战。在此背景下，作为一种新兴的数据感知的范式，群体众筹技术应运而生。群体众筹通过用户间的协同合作，利用用户所携带设备提供的数据感知、计算及无线通信能力，完成大规模的数据感知服务，诸如环境监测、交通密度评估、城市规划、位置导航和医疗保健等。相比于传统数据感知技术，依赖昂贵的专用传感基础设施，群体众筹具备高敏捷性、高灵活性和低成本等优势。
[0003]一个典型的群体众筹的系统主要包括一个部署在云端的平台和一群移动用户，平台通过招募移动用户收集感知数据，通过用户的智能终端设备，完成大规模数据感知的众筹任务。然而，在执行众筹任务期间，用户需要上传将其感知数据(例如，每日轨迹、实时位置和周围环境)，此类机制可能导致严重的数据安全风险，如隐私泄露、数据窃听和用户个人数据滥用。同时，随着边缘网络中物联网数据的爆炸式增长，将通过群体众筹收集的数据上传到远程服务器所耗费的网络资源和产生的通信延迟，不利于实际应用部署。因此，有必要进一步研究和改进相关技术，以弥补群体众筹技术中的不足。
[0004]联邦学习(Federated Learning，FL)作为一种新兴...

【技术保护点】

【技术特征摘要】
1.一种面向联邦学习的群体众筹博弈的持续激励方法，其特征在于：该方法包括：步骤1，任务请求者向联邦学习平台发布群体众筹任务；步骤2，联邦学习平台招募用户参与联邦学习，在此过程中，联邦学习平台向任务请求者收取报酬，并向被招募的用户发放酬金，同时，在每个轮次中对上一轮次未被招募的用户给予额外的奖励；在每个轮次中，每个用户独立地决定是否参与群体众筹任务，并决定参与联邦学习的数据量。2.根据权利要求1所述的一种面向联邦学习的群体众筹博弈的持续激励方法，其特征在于：所述步骤1中群体众筹任务定义为其中，Loc,B,K分别表示任务地点、任务预算和执行任务所需用户数，T表示最大轮次数，τ
min
表示每个轮次的最短截至期限。3.根据权利要求1所述的一种面向联邦学习的群体众筹博弈的持续激励方法，其特征在于：所述步骤2中联邦学习平台在t轮次中对用户i给予额外的奖励为：其中，ρ是用户单位声誉奖励，表示用户i在t轮次中的声誉值；表示用户i在t
‑
1轮次中是否被招募，4.根据权利要求1所述的一种面向联邦学习的群体众筹博弈的持续激励方法，其特征在于：所述步骤2中联邦学习平台基于如下用户招募问题确定用户选择策略：在于：所述步骤2中联邦学习平台基于如下用户招募问题确定用户选择策略：在于：所述步骤2中联邦学习平台基于如下用户招募问题确定用户选择策略：其中，表示用户i在t轮次中用于模型训练的数据质量，T表示最大轮次数，δ表示用户i将被招募的所需轮次的最小值，K表示执行任务所需用户数，表示用户i在t轮次中是否被招募，5.根据权利要求1所述的一种面向联邦学习的群体众筹博弈的持续激励方法，其特征在于：所述步骤2中基于Stackelberg博弈，确定用户的定价策略使得联邦学习平台效用最大化，确定用户参与联邦学习的数据量使得用户效用最大化。6.根据权利要求1所述的一种面向联邦学习的群体众筹博弈的持续激励方法，其特征在于：当用户的投资回报率低于设定阈值时，该用户退出该群体众筹任务，其中，用户的投资回报率的表达式为：
其中，表示用户i在t轮次中的投资回报率，R(
·
)和C(
·
)分别表示用户i的累计报酬和成本，表示联邦学习平台在t轮次中对用户i给予额外的奖励，β
i
表示用户i的容忍系数。7.根据权利要求4所述的一种面向联邦学习的群体众筹博弈的持续激励方法，其特征在于：引入虚拟队列技术将用户招募问题扩展为：在于：引入虚拟队列技术将用户招募问题扩展为：在于：引入虚拟队列技术将用户招募问题扩展为：其中，表示用户i在t轮次中的虚拟队列长度，[
·
]
+
＝max{
·
,0}，V
i1
＝0，表示用户i在t
‑
1轮次中是否被招募，α≥0表示非负参数；采用多臂赌博机模型中的UCB策略的思想，联邦学习平台为用户i维护一个二...

【专利技术属性】
技术研发人员：张晖，遆宁，罗天翔，王琴，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人