一种联邦学习方法以及装置制造方法及图纸

技术编号：37038590 阅读：16 留言：0更新日期：2023-03-29 19:18

本申请提供一种人工智能领域的联邦学习方法、装置及系统，用于在进行联邦学习的过程中，通过对客户端反馈的端侧模型的参数维度进行变换，来适应客户端数据异构的场景。该方法包括：首先，服务器获取第一模型集合，第一模型集合中的多个端侧模型的至少一种参数的维度不相同；服务器对多个端侧模型中的至少一个端侧模型的该至少一种参数的维度进行变换，变换模型和未变换的模型组成第二模型集合，第二模型集合中的模型的至少一种参数的维度相同，该至少一种参数包括了多个端侧模型中需要进行聚合的参数；随后服务器对第二模型集合中的模型进行聚合，得到第一全局模型；服务器向至少一个客户端下发第一全局模型的信息。一个客户端下发第一全局模型的信息。一个客户端下发第一全局模型的信息。

全部详细技术资料下载

【技术实现步骤摘要】
一种联邦学习方法以及装置

[0001]本申请涉及人工智能领域，尤其涉及一种联邦学习方法以及装置。

技术介绍

[0002]联邦学习(Federated Learning)是针对“数据孤岛”的存在而提出的一种机器学习框架，能够有效帮助各参与方(客户端)在无需共享数据资源，即训练数据不出本地的情况下，进行联合训练，建立共享的机器学习模型。
[0003]联邦强化学习方法，在传统联邦学习的基础上引入强化学习，客户端将训练好的客户端本地强化学习策略模型上传给云服务器进行聚合得到全局模型。然而，各个不同的客户端可能存在数据异构的问题，各个不同的客户端得到的模型所适应的数据结构可能不相同，将导致云服务器聚合得到的模型效果不佳。

技术实现思路

[0004]本申请提供一种联邦学习方法以及装置，用于在进行联邦学习的过程中，通过对客户端反馈的端侧模型的参数维度进行变换，来适应客户端数据异构的场景。
[0005]有鉴于此，第一方面，本申请提供一种联邦学习方法，包括：首先，服务器获取第一模型集合，第一集合中包括至少一个客户端反馈的多个端侧模型的信息，该多个端侧模型的至少一种参数的维度不相同；服务器对多个端侧模型中的至少一个端侧模型的该至少一种参数的维度进行变换，得到一一对应的至少一个变换模型，该至少一个变换模型和第一模型集合中未经过变换的模型组成第二模型集合，第二模型集合中的模型的至少一种参数的维度相同，该至少一种参数包括了多个端侧模型中需要进行聚合的参数；随后服务器对第二模型集合中的模型进行聚合，得到第一全局模...

【技术保护点】

【技术特征摘要】
1.一种联邦学习方法，其特征在于，包括：服务器获取第一模型集合，所述第一集合中包括至少一个客户端的多个端侧模型的信息，所述多个端侧模型的至少一种参数的维度不相同；所述服务器对所述多个端侧模型中的至少一个端侧模型的所述至少一种参数的维度进行变换,得到至少一个变换模型，第二模型集合中包括所述至少一个变换模型和所述第一模型集合中未经过变换的模型，所述第二模型集合中的模型的所述至少一种参数的维度相同；所述服务器对所述第二模型集合中的模型进行聚合，得到第一全局模型；所述服务器向所述至少一个客户端下发所述第一全局模型的信息。2.根据权利要求1所述的方法，其特征在于，所述多个端侧模型的信息包括观测状态空间或动作维度空间中的至少一种，所述观测状态空间包括状态信息，所述动作维度空间中包括任务相关的动作信息。3.根据权利要求2所述的方法，其特征在于，所述服务器对所述多个端侧模型中的至少一个端侧模型的至少一种参数的维度进行变换，得到第二模型集合，包括：所述服务器对所述至少一个端侧模型对应的所述观测状态空间或所述动作维度空间的维度进行拉伸或者压缩，得到所述第二模型集合。4.根据权利要求1
‑
3中任一项所述的方法，其特征在于，在所述服务器获取至少一个客户端的多个端侧模型的信息之前，所述方法还包括：所述服务器向所述至少一个客户端下发第二全局模型，所述第二全局模型用于所述至少一个客户端使用本地保存的数据进行强化学习，得到所述多个端侧模型。5.根据权利要求4所述的方法，其特征在于，所述服务器向所述至少一个客户端下发所述第一全局模型的信息，包括：所述服务器获取所述第一全局模型和所述第二全局模型之间的残差，得到残差项；所述服务器向所述至少一个客户端发送所述残差项。6.根据权利要求4或5所述的方法，其特征在于，所述多个端侧模型为所述至少一个客户端结合距离约束使用本地保存的数据进行强化学习得到，所述距离约束包括所述至少一个客户端本地保存的模型和所述第二全局模型之间的距离形成的约束。7.根据权利要求1
‑
6中任一项所述的方法，其特征在于，所述服务器对所述第二模型集合中的模型进行聚合，得到第一全局模型，包括：所述服务器根据预先设定的衰减因子对所述第二模型集合中的模型进行聚合，得到所述第一全局模型。8.一种联邦学习装置，其特征在于，包括：获取模块，用于获取第一模型集合，所述第一集合中包括至少一个客户端的多个端侧模型的信息，所述多个端侧模型的至少一种参数的维...

【专利技术属性】
技术研发人员：李银川，邵云峰，王浩智，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人