【技术实现步骤摘要】
本专利技术涉及计算机,尤其是涉及一种面向非规则博弈场景的联邦学习激励机制。
技术介绍
1、随着大数据时代的到来,互联网和计算机技术快速发展,人工智能技术再一次迎来了飞跃。但传统的机器学习方法通常需要收集大量的数据,并集中在服务器中训练人工智能模型。在现实场景中,单个参与者往往没有足够的数据来支持模型的训练,而且很多原始数据涉及到用户的隐私,如果将多个参与者的数据集中起来进行训练,就会存在隐私泄露的风险,由此引发了“数据孤岛”问题。
2、为解决“数据孤岛”问题带来的挑战,2016年google提出了一种新的机器学习范式,称为联邦学习(federated learning,fl)。联邦学习不需要使用集中存储的数据来训练模型,而是在保证数据隐私的同时,使用分布在多个参与者的数据来学习一个高质量的集中式模型。它要求参与者使用自己的数据在本地训练模型,并将不含原始数据的本地模型上传到服务器进行多方模型聚合,得到一个涵盖多方特征的全局模型。
3、在联邦学习中,所有参与者维护的全局模型是一种公共物品,其特点是非排他性(即,无法
...【技术保护点】
1.一种面向非规则博弈场景的联邦学习激励机制,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种面向非规则博弈场景的联邦学习激励机制,其特征在于,所述步骤S11的具体步骤如下:
3.根据权利要求1所述的一种面向非规则博弈场景的联邦学习激励机制,其特征在于,所述步骤S12的具体步骤如下:设联邦学习参与者的策略集为S={S1:搭便车策略,S2:合作策略},其中,搭便车策略代表参与者不执行本地模型训练,对全局模型添加随机扰动后上传给服务器;合作策略代表参与者执行本地模型训练并上传本地梯度更新给服务器。
4.根据权利要求1所述的一种面
...【技术特征摘要】
1.一种面向非规则博弈场景的联邦学习激励机制,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种面向非规则博弈场景的联邦学习激励机制,其特征在于,所述步骤s11的具体步骤如下:
3.根据权利要求1所述的一种面向非规则博弈场景的联邦学习激励机制,其特征在于,所述步骤s12的具体步骤如下:设联邦学习参与者的策略集为s={s1:搭便车策略,s2:合作策略},其中,搭便车策略代表参与者不执行本地模型训练,对全局模型添加随机扰动后上传给服务器;合作策略代表参与者执行本地模型训练并上传本地梯度更新给服务器。
4.根据权利要求1所述的一种面向非规则博弈场景的联邦学习激励机制,其特征在于,所述步骤s13的具体步骤如下:
5.根据权利要求1所述的一种面向非规则博弈场景的...
【专利技术属性】
技术研发人员:张沁楠,陈天翔,王冯,邱望洁,揭晚晴,何锦淳,苗淑怡,郑志明,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。