一种基于资源约束的异构联邦学习优化方法及系统技术方案

技术编号:45065246 阅读:22 留言:0更新日期:2025-04-25 18:10
本发明专利技术公开的一种基于资源约束的异构联邦学习优化方法及系统,包括如下步骤:通过联邦学习训练机器学习模型,服务器初始化或聚合全局模型,对客户端的训练强度进行分配,将训练强度分配到被选中参与训练的客户端;服务器通过训练深度强化学习模型分配训练中的所有客户端的总训练强度,通过确定性分配算法来分配各个参与训练的客户端的训练强度;客户端在完成本地训练后,将训练的模型参数和深度强化学习状态传到服务器,根据历史训练信息对深度强化学习模型进行更新。本发明专利技术在服务器有计算资源预算补偿的约束下,权衡联邦学习中异构设备的计算时延、通信时延、计算资源、模型收敛速度,提升训练速度,并减少计算资源预算的消耗和训练时延。

【技术实现步骤摘要】

本专利技术属于异构联邦学习优化领域,具体涉及一种基于资源约束的异构联邦学习优化方法及系统


技术介绍

1、自谷歌提出联邦学习(fl)以来,这个分布式学习框架成为了一个热门研究方向。联邦学习的提出使得不同设备在保护自身隐私数据的前提下进行知识协作。在如今注重隐私保护的互联网环境下,联邦学习一定程度上缓解了数据孤岛现象,并增强了模型的泛化性能。

2、fl不是在集中式服务器上收集数据,而是支持分布式模型训练。经典的fl框架会进行多轮的通信和训练,在每一轮通信中,客户端从服务器获取全局模型,使用本地的数据集进行本地训练。在完成本地训练后,客户端将模型参数梯度返回给中心服务器,中心服务器结合这些梯度来完善全局模型。这个过程会重复进行直到达到目标准确率为止。原始数据在训练过程中不离开客户端,fl能够有效保护数据隐私,并减轻无线通信的负担。

3、在整个fl系统中,随着移动设备的增多和发展,移动设备的性能差异也变得越来越大,希望联邦学习的全局模型在准确率、训练时间上有足够提升。到目前为止,许多研究和努力被用来提升fl的性能,包括提升模型准确率、降低本文档来自技高网...

【技术保护点】

1.一种基于资源约束的异构联邦学习优化方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于资源约束的异构联邦学习优化方法,其特征在于,在步骤S1中,联邦学习的客户端硬件设置,具体包括:

3.根据权利要求1所述的一种基于资源约束的异构联邦学习优化方法,其特征在于,在步骤S1中,联邦学习的服务器训练任务具体包括:

4.根据权利要求1所述的一种基于资源约束的异构联邦学习优化方法,其特征在于,步骤S2中,近端策略优化算法是收集策略πk′=π(θk′)的部分轨迹集合,然后使用优势估计算法学习优势,其中θk′表示深度强化学习模型的策略网络在训练的第k...

【技术特征摘要】

1.一种基于资源约束的异构联邦学习优化方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于资源约束的异构联邦学习优化方法,其特征在于,在步骤s1中,联邦学习的客户端硬件设置,具体包括:

3.根据权利要求1所述的一种基于资源约束的异构联邦学习优化方法,其特征在于,在步骤s1中,联邦学习的服务器训练任务具体包括:

4.根据权利要求1所述的一种基于资源约束的异构联邦学习优化方法,其特征在于,步骤s2中,近端策略优化算法是收集策略πk′=π(θk′)的部分轨迹集合,然后使用优势估计算法学习优势,其中θk′表示深度强化学习模型的策略网络在训练的第k′步的网络参数,πk′和π(θk′)表示在第k′步策略网络的策略;

5.根据权利要求1所述的一种基于资源约...

【专利技术属性】
技术研发人员:汪秀敏陈邱健
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1