一种基于超网络的分层联邦学习系统技术方案

技术编号：38529855 阅读：12 留言：0更新日期：2023-08-19 17:04

本发明专利技术公开了一种基于超网络的分层联邦学习系统，包括以下步骤：构建包括一个中央服务器、多个聚合服务器和多个客户端的三层联邦学习系统；各个客户端利用本地数据对模型进行训练，并将训练后的模型参数上传至聚合服务器；聚合服务器利用更新后的本地模型参数更新超网络模型参数，并将更新后的超网络模型上传至中央服务器；中央服务器对超网络模型参数进行联邦聚合，并将聚合更新后的超网络重新下发至各个聚合服务器。本发明专利技术将联邦学习扩展到三层，可在复杂的数据异构场景下，有效提升联邦学习方法的性能，在提高通信效率的同时降低计算成本。算成本。算成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于超网络的分层联邦学习系统

[0001]本专利技术属于联邦学习技术应用领域，涉及一种基于超网络的分层联邦学习系统。

技术介绍

[0002]伴随着物联网、云计算等技术的繁荣发展，联邦学习(Federated Learning，FL)能够有效的打破数据壁障，因而逐渐成为一种新兴的分布式机器学习范式，掀起了万物互联的潮流与趋势。在FL场景中，各方数据保留在本地，不泄露隐私也不违反通用数据保护条例；多个参与者在满足身份、地位平等的条件下，联合数据建立虚拟的全局模型，组成共同利益体系，协同训练共享数据价值而不是共享原始数据。这样既保护了本地数据的隐私，又解决了因本地数据量不够充足、数据类型不够丰富引起的模型泛化能力差、模型性能不尽人意的问题。
[0003]联邦学习的一个主要挑战是如何在客户之间训练一个关于非独立同分布数据集的高效全局模型，FedAvg的大多数变体致力于解决非独立同分布问题中的标签分布偏斜和数量不平衡的问题。现在假设这样一个典型的联邦学习场景。边缘设备(如传感器、监视器和可穿戴设备)希望利用自己的本地私有数据协作训练共享模型，但直接使用传统的联邦学习方法可能会导致三个问题：(1)由于边缘设备无处不在，传统联合学习方法的模型聚合方案将导致极其昂贵的通信成本，甚至可能导致模型无法收敛。(2)传统的联邦学习算法将在中央服务器中聚合所有模型参数，这将导致单个节点上的计算成本过高。(3)由于功能和位置的差异，位于不同区域的边缘设备可能具有特征分布偏斜的私有数据集，因此传统的联邦学习算法可能无法获得良好的准确性...

【技术保护点】

【技术特征摘要】
1.一种基于超网络的分层联邦学习系统，其特征在于，包括以下步骤：步骤一、构建包括一个中央服务器、J个聚合服务器和J
×
N个客户端的三层联邦学习系统：步骤101、中央服务器与J个聚合服务器相连，每个聚合服务器与N个客户端相连，同一聚合服务器下的客户端本地数据存在标签分布不平衡，不同聚合服务器下的客户端本地数据存在特征分布不平衡；步骤102、在每个聚合服务器中初始化一个超网络，用于生成该聚合服务器下所有客户端的本地模型；步骤103、聚合服务器利用客户端嵌入向量为客户端生成其本地模型并将该本地模型下发给与其相连的客户端，即：其中，代表超网络，其参数为上标t为中央服务器与聚合服务器之间的通信回合数，上标r为聚合服务器与客户端之间的通信回合数；步骤二、各个客户端利用本地数据对模型进行训练，并将训练后的模型参数上传至聚合服务器：步骤201、本地客户端采用随机梯度下降法对模型进行E次本地更新，即：其中，是本地损失函数，η是本地学习率；步骤202、客户端将更新后的本地模型上传...

【专利技术属性】
技术研发人员：蒋雯，杨季皓，聂来森，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人