一种面向非规则博弈场景的联邦学习激励机制制造技术

技术编号:43549402 阅读:27 留言:0更新日期:2024-12-03 12:31
本发明专利技术公开了一种面向非规则博弈场景的联邦学习激励机制,涉及计算机技术领域,包括以下步骤:步骤S1、构建激励模型,包括:步骤S11、建立基本假设;步骤S12、建立策略空间;步骤S13、建立效用函数,初步建立激励模型;步骤S14、进行动态激励,得到激励模型;步骤S2、调整奖励和惩罚策略;步骤S3、判断是否达到停止条件,达到则停止,未达到则进行联邦学习训练,再次重复步骤S14和步骤S2,直至达到停止条件。本发明专利技术采用上述结构的一种面向非规则博弈场景的联邦学习激励机制,针对联邦学习搭便车问题,提出了基于演化博弈论的激励机制,实现了有效的激励,提高了联邦学习模型性能和社会福利。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其是涉及一种面向非规则博弈场景的联邦学习激励机制


技术介绍

1、随着大数据时代的到来,互联网和计算机技术快速发展,人工智能技术再一次迎来了飞跃。但传统的机器学习方法通常需要收集大量的数据,并集中在服务器中训练人工智能模型。在现实场景中,单个参与者往往没有足够的数据来支持模型的训练,而且很多原始数据涉及到用户的隐私,如果将多个参与者的数据集中起来进行训练,就会存在隐私泄露的风险,由此引发了“数据孤岛”问题。

2、为解决“数据孤岛”问题带来的挑战,2016年google提出了一种新的机器学习范式,称为联邦学习(federated learning,fl)。联邦学习不需要使用集中存储的数据来训练模型,而是在保证数据隐私的同时,使用分布在多个参与者的数据来学习一个高质量的集中式模型。它要求参与者使用自己的数据在本地训练模型,并将不含原始数据的本地模型上传到服务器进行多方模型聚合,得到一个涵盖多方特征的全局模型。

3、在联邦学习中,所有参与者维护的全局模型是一种公共物品,其特点是非排他性(即,无法排除个体使用它们)和本文档来自技高网...

【技术保护点】

1.一种面向非规则博弈场景的联邦学习激励机制,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种面向非规则博弈场景的联邦学习激励机制,其特征在于,所述步骤S11的具体步骤如下:

3.根据权利要求1所述的一种面向非规则博弈场景的联邦学习激励机制,其特征在于,所述步骤S12的具体步骤如下:设联邦学习参与者的策略集为S={S1:搭便车策略,S2:合作策略},其中,搭便车策略代表参与者不执行本地模型训练,对全局模型添加随机扰动后上传给服务器;合作策略代表参与者执行本地模型训练并上传本地梯度更新给服务器。

4.根据权利要求1所述的一种面向非规则博弈场景的联...

【技术特征摘要】

1.一种面向非规则博弈场景的联邦学习激励机制,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种面向非规则博弈场景的联邦学习激励机制,其特征在于,所述步骤s11的具体步骤如下:

3.根据权利要求1所述的一种面向非规则博弈场景的联邦学习激励机制,其特征在于,所述步骤s12的具体步骤如下:设联邦学习参与者的策略集为s={s1:搭便车策略,s2:合作策略},其中,搭便车策略代表参与者不执行本地模型训练,对全局模型添加随机扰动后上传给服务器;合作策略代表参与者执行本地模型训练并上传本地梯度更新给服务器。

4.根据权利要求1所述的一种面向非规则博弈场景的联邦学习激励机制,其特征在于,所述步骤s13的具体步骤如下:

5.根据权利要求1所述的一种面向非规则博弈场景的...

【专利技术属性】
技术研发人员:张沁楠陈天翔王冯邱望洁揭晚晴何锦淳苗淑怡郑志明
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1