一种基于抽样聚合优化的多层联邦学习方案制造技术

技术编号：38750944 阅读：12 留言：0更新日期：2023-09-09 11:17

本发明专利技术公开了一种基于抽样聚合优化的多层联邦学习方案，包括以下步骤：(1)初始化：服务器初始化全局模型，广播给所有参与训练的客户端；(2)聚类：客户端在本地进行第一轮训练后，采用OPTICS聚类方法对收集到的模型参数进行聚类，将客户端划分到不同的簇中；(3)抽样：每轮训练中，按照客户端比例从每一个簇中抽取可用的客户端参与训练；(4)结合训练：参与训练的客户端结合服务器发送的全局模型以及其他客户端的参数进行训练；(5)聚合及分发：服务器对传回的参数进行加权平均，并向下一轮参与训练的客户端发送本轮除自身以外的参与训练的客户端上传的模型参数。本发明专利技术设计加速模型收敛，抑制模型偏移，并提高全局聚合模型可信度。并提高全局聚合模型可信度。并提高全局聚合模型可信度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于抽样聚合优化的多层联邦学习方案

[0001]本专利技术涉及一种基于抽样聚合优化的多层联邦学习方案。

技术介绍

[0002]在联邦学习的过程中，服务器首先初始化全局模型，广播给所有参与训练的客户端。客户端收到模型后结合本地数据集在客户端本地对模型进行训练，再将更新结果上传给服务器。服务器接收到上传的参数进行聚合得到全局更新，迭代数次后停止训练。在这一过程中，存在许多安全的隐患问题。例如，设备异构导致客户端之间计算能力，通信，存储效率不平衡；数据异构引起的数据类型，数据量不平衡问题等。
[0003]联邦学习(Federated Learning)本质上是一种分布式的机器学习技术。传统的由服务器集中训练的机器学习模型存在安全性和隐私方面的不足，联邦学习作为一种高效的隐私保护手段应运而生。联邦学习利用去中心化的数据源进行训练，避免因中心化带来的隐私问题；以不访问参与者私有数据为前提，在一定程度上保证了原始数据的隐私安全。具体来说，联邦学习过程就是参与者在本地对数据进行训练，再将训练后得到的参数上传到服务器，最后由云聚合得到整体参数。通过这种方式，可以在客户端和服务器之间共享信息，且在训练过程中有效的保护了用户的数据隐私。但联邦学习在模型的本地训练、参数传递等过程仍存在巨大的安全隐患。
[0004]边缘计算(Edge Computing)也被称为边缘处理，是一种将服务器放置在设备附近的网络技术。有助于减少系统处理负载和解决数据传输延迟。这些过程在传感器或设备生成数据的位置执行，也被称为边缘。
[...

【技术保护点】

【技术特征摘要】
1.一种基于抽样聚合优化的多层联邦学习方案，其特征在于，包括以下步骤：(1)初始化：服务器初始化全局模型，广播给所有参与联邦学习训练的客户端；(2)聚类：客户端在本地进行第一轮训练后，采用OPTICS聚类方法对收集到的模型参数进行聚类，将客户端划分到不同的簇中；(3)抽样：每轮训练中，按照客户端比例从每一个簇中抽取可用的客户端参与训练；(4)结合训练：参与训练的客户端结合服务器发送的全局模型以及其他客户端的参数进行训练；(5)聚合及分发：服务器对传回的参数进行加权平均，并向下一轮参与训练的客户端发送本轮除自身以外的参与训练的客户端上传的模型参数。2.根据权利要求1所述的抽样聚合优化的多层联邦学习方案，其特征在于，所述步骤(1)中，初始化阶段主要是服务器初始化全局模型，广播给所有参与联邦学习训练的客户端。其具体过程为：服务器：1
‑
1)服务器Ecs初始化全局模型1
‑
2)服务器Ecs向所有的客户端C
i
(i∈K，K为客户端的总数)广播初始化的全局模型θ0。3.根据权利要求1所述的抽样聚合优化的多层联邦学习方案，其特征在于，所述步骤(2)中，聚类阶段主要是客户端在本地进行第一轮训练后，采用OPTICS聚类方法对收集到的模型参数进行聚类，将客户端划分到不同的簇中。其具体过程为：客户端：2
‑
1)在第一轮，客户端C
i
(0＜i≤k)接收到云服务器Ecs广播分发的全局模型θ0。2
‑
2)第t轮中，被抽取参与训练的客户端C
i
(0＜i≤k)利用本地数据集的样本进行模型训练，其中，为第t轮第i个客户端更新的模型，θ
t
‑1为第t
‑
1轮的全局模型，η
t
为更新的第t轮的全局模型的学习率，ξ
i
为客户端C
i
的数据集样本。2
‑
3)在第一轮完成训练后，采用OPTICS聚类方法对收集到的模型参数进行聚类，将具有足够密度的区域划分为簇，并将客户端划分到不同的簇中。其中，min_samples，x
i
为聚类算法参数。4.根据权利要求2所述的抽样聚合优化的多层联邦学习方案，其特征在于，所述步骤(3)中，抽样阶段主要是每轮训练中，按照客户端比例从每一个簇中抽取可用的客户端参与训练。其具体过程为：3
‑
1)在第t轮时，按照客户端C的比例，从每个簇中抽取可用的客户端参与训练，其中，为第t轮时第q个聚合器所在簇被抽取的客户端集合，β为客户端训练比例。3
‑
2)在该轮训练时，被抽取参与训练的客户端C
i
(C
i
∈S
t
)接收最新的全局模型参数θ
t
‑1。3
‑
3)在该轮训练时，被抽取参与训练的客户端C
i
(C
i
∈S
t
)进行模型训练。3
‑
4)在该轮训练时，被抽取参与训练的客户端C
i
(C
i
∈S
t
)将训练更新的模型发送至服务器。5.根据权利要求3所述的抽样聚合优化的多层联邦学习方案，其特征在于，所述步骤
(4)中，结合训练主要是参与训练的客户端结合服务器发送的全局模型以及其他客户端的参数进行训练。其具体过程为：服务器：4
‑
1)在第t轮中，服务器Ecs向被抽取参与训练的客户端C
i
(C
i
∈S
t
)传递全局模型θ
t
‑1、上一轮参与训练的客户端传送的全部模型参数u
t
‑1＝∑
j∈A
(G
t
‑<...

【专利技术属性】
技术研发人员：张世文，陈双，任飞翔，梁伟，
申请(专利权)人：湖南科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人