【技术实现步骤摘要】
本专利技术属于异构联邦学习优化领域,具体涉及一种基于资源约束的异构联邦学习优化方法及系统。
技术介绍
1、自谷歌提出联邦学习(fl)以来,这个分布式学习框架成为了一个热门研究方向。联邦学习的提出使得不同设备在保护自身隐私数据的前提下进行知识协作。在如今注重隐私保护的互联网环境下,联邦学习一定程度上缓解了数据孤岛现象,并增强了模型的泛化性能。
2、fl不是在集中式服务器上收集数据,而是支持分布式模型训练。经典的fl框架会进行多轮的通信和训练,在每一轮通信中,客户端从服务器获取全局模型,使用本地的数据集进行本地训练。在完成本地训练后,客户端将模型参数梯度返回给中心服务器,中心服务器结合这些梯度来完善全局模型。这个过程会重复进行直到达到目标准确率为止。原始数据在训练过程中不离开客户端,fl能够有效保护数据隐私,并减轻无线通信的负担。
3、在整个fl系统中,随着移动设备的增多和发展,移动设备的性能差异也变得越来越大,希望联邦学习的全局模型在准确率、训练时间上有足够提升。到目前为止,许多研究和努力被用来提升fl的性能,包括
...【技术保护点】
1.一种基于资源约束的异构联邦学习优化方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于资源约束的异构联邦学习优化方法,其特征在于,在步骤S1中,联邦学习的客户端硬件设置,具体包括:
3.根据权利要求1所述的一种基于资源约束的异构联邦学习优化方法,其特征在于,在步骤S1中,联邦学习的服务器训练任务具体包括:
4.根据权利要求1所述的一种基于资源约束的异构联邦学习优化方法,其特征在于,步骤S2中,近端策略优化算法是收集策略πk′=π(θk′)的部分轨迹集合,然后使用优势估计算法学习优势,其中θk′表示深度强化学习模型的
...【技术特征摘要】
1.一种基于资源约束的异构联邦学习优化方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于资源约束的异构联邦学习优化方法,其特征在于,在步骤s1中,联邦学习的客户端硬件设置,具体包括:
3.根据权利要求1所述的一种基于资源约束的异构联邦学习优化方法,其特征在于,在步骤s1中,联邦学习的服务器训练任务具体包括:
4.根据权利要求1所述的一种基于资源约束的异构联邦学习优化方法,其特征在于,步骤s2中,近端策略优化算法是收集策略πk′=π(θk′)的部分轨迹集合,然后使用优势估计算法学习优势,其中θk′表示深度强化学习模型的策略网络在训练的第k′步的网络参数,πk′和π(θk′)表示在第k′步策略网络的策略;
5.根据权利要求1所述的一种基于资源约...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。