一种基于抽样聚合优化的多层联邦学习方案制造技术

技术编号:38750944 阅读:12 留言:0更新日期:2023-09-09 11:17
本发明专利技术公开了一种基于抽样聚合优化的多层联邦学习方案,包括以下步骤:(1)初始化:服务器初始化全局模型,广播给所有参与训练的客户端;(2)聚类:客户端在本地进行第一轮训练后,采用OPTICS聚类方法对收集到的模型参数进行聚类,将客户端划分到不同的簇中;(3)抽样:每轮训练中,按照客户端比例从每一个簇中抽取可用的客户端参与训练;(4)结合训练:参与训练的客户端结合服务器发送的全局模型以及其他客户端的参数进行训练;(5)聚合及分发:服务器对传回的参数进行加权平均,并向下一轮参与训练的客户端发送本轮除自身以外的参与训练的客户端上传的模型参数。本发明专利技术设计加速模型收敛,抑制模型偏移,并提高全局聚合模型可信度。并提高全局聚合模型可信度。并提高全局聚合模型可信度。

【技术实现步骤摘要】
一种基于抽样聚合优化的多层联邦学习方案


[0001]本专利技术涉及一种基于抽样聚合优化的多层联邦学习方案。

技术介绍

[0002]在联邦学习的过程中,服务器首先初始化全局模型,广播给所有参与训练的客户端。客户端收到模型后结合本地数据集在客户端本地对模型进行训练,再将更新结果上传给服务器。服务器接收到上传的参数进行聚合得到全局更新,迭代数次后停止训练。在这一过程中,存在许多安全的隐患问题。例如,设备异构导致客户端之间计算能力,通信,存储效率不平衡;数据异构引起的数据类型,数据量不平衡问题等。
[0003]联邦学习(Federated Learning)本质上是一种分布式的机器学习技术。传统的由服务器集中训练的机器学习模型存在安全性和隐私方面的不足,联邦学习作为一种高效的隐私保护手段应运而生。联邦学习利用去中心化的数据源进行训练,避免因中心化带来的隐私问题;以不访问参与者私有数据为前提,在一定程度上保证了原始数据的隐私安全。具体来说,联邦学习过程就是参与者在本地对数据进行训练,再将训练后得到的参数上传到服务器,最后由云聚合得到整体参数。通过这种方式,可以在客户端和服务器之间共享信息,且在训练过程中有效的保护了用户的数据隐私。但联邦学习在模型的本地训练、参数传递等过程仍存在巨大的安全隐患。
[0004]边缘计算(Edge Computing)也被称为边缘处理,是一种将服务器放置在设备附近的网络技术。有助于减少系统处理负载和解决数据传输延迟。这些过程在传感器或设备生成数据的位置执行,也被称为边缘。
[0005]联邦学习的发展主要依赖以下技术:
[0006]联邦平均(FedAvg)算法将每个客户端的局部随机梯度下降(SGD)与执行模型平均的服务器相结合。在客户端进行多轮局部模型的更新,在服务器将局部模型上传,只进行一个平均算法进行聚合,即,该算法将计算量放在了本地客户端,而服务器只用于聚合平均。
[0007]FedProx算法在FedAvg算法的基础上对客户端的损失函数加了修正项,使得模型效果更好收敛更快。其本质是对本地模型权重参数和全局模型权重参数的一个差异限制,一次来增加模型训练的稳定性和模型的收敛性。
[0008]FedSSO算法是利用用分层抽样优化的联邦学习算法,使用了基于密度的聚类方法将总体客户端划入不同的聚类中,使得每个聚类中的客户端具有较高的相似度,再按样本权重从不同聚类中抽取可用客户端参与训练,因此所有种类的数据都会按样本权重参与每轮训练,使模型加速收敛到全局最优解解;同时,设定了学习率递减和本地迭代轮次选择机制,以保证模型的收敛性。
[0009]OPTICS(Ordering Points to Identify the Clustering Structure)是一种基于密度的聚类算法。它将簇定义为通过密度连接的最大点集,并将具有足够密度的区域划分为簇。
[0010]分布式优化就是考虑如何把大任务分解成若干子任务,安排给多个核心、利用多
个核心来实现对一个大问题的并行快速求解。即以分布式方法(即通过局部的运算及通信)来求解最优化问题。
[0011]分层抽样是从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样品(个体)的方法。其具体程序是:把总体各单位分成两个或两个以上的相互独立的完全的组,从两个或两个以上的组中进行简单随机抽样,样本相互独立。
[0012]随机梯度下降算法(SGD)是深度学习中常用的优化算法之一。SGD是一种基于梯度的优化算法,用于更新深度神经网络的参数。它的基本思想是,在每一次迭代中,随机选择一个小批量的样本来计算损失函数的梯度,并用梯度来更新参数。这种随机性使得算法更具鲁棒性,能够避免陷入局部极小值,并且训练速度也会更快。

技术实现思路

[0013]为解决上述技术问题,本专利技术提供一种加速模型收敛,抑制模型偏移以及提高了全局聚合模型可信度的多层联邦学习方案。
[0014]本专利技术解决上述技术问题的技术方案的技术方案是:一种基于抽样聚合优化的多层联邦学习方案,包括以下步骤:
[0015](1)初始化:服务器初始化全局模型,广播给所有参与联邦学习训练的客户端;
[0016](2)聚类:客户端在本地进行第一轮训练后,采用OPTICS聚类方法对收集到的模型参数进行聚类,将客户端划分到不同的簇中;
[0017](3)抽样:每轮训练中,按照客户端比例从每一个簇中抽取可用的客户端参与训练;
[0018](4)结合训练:参与训练的客户端结合服务器发送的全局模型以及其他客户端的参数进行训练;
[0019](5)聚合及分发:服务器对传回的参数进行加权平均,并向下一轮参与训练的客户端发送本轮除自身以外的参与训练的客户端上传的模型参数。
[0020]上述的基于抽样聚合优化的多层联邦学习方案,所述步骤(1)中,初始化阶段主要是服务器初始化全局模型,广播给所有参与联邦学习训练的客户端。其具体过程为:
[0021]服务器:
[0022]1‑
1)服务器Ecs初始化全局模型
[0023]1‑
2)服务器Ecs向所有的客户端C
i
(i∈K,K为客户端的总数)广播初始化的全局模型θ0。
[0024]上述的抽样聚合优化的多层联邦学习方案,所述步骤(2)中聚类阶段主要是客户端在本地进行第一轮训练后,采用OPTICS聚类方法对收集到的模型参数进行聚类,将客户端划分到不同的簇中。其具体过程为:
[0025]客户端:
[0026]2‑
1)在第一轮,客户端C
i
(0<i≤k)接收到云服务器Ecs广播分发的全局模型θ0。
[0027]2‑
2)第t轮中,被抽取参与训练的客户端C
i
(0<i≤k)利用本地数据集的样本进行模型训练,其中,为第t轮第i个客户端更新的模型,θ
t
‑1为第t

1轮的全局模型,η
t
为更新的第t轮的全局模型的学习率,ξ
i
为客户端C
i
的数据集样本。
[0028]2‑
3)在第一轮完成训练后,采用OPTICS聚类方法对收集到的模型参数进行聚
类,将具有足够密度的区域划分为簇,并将客户端划分到不同的簇中。其中,min_samples,x
i
为聚类算法参数。
[0029]上述的抽样聚合优化的多层联邦学习方案,所述步骤(3)中抽样阶段主要是每轮训练中,按照客户端比例从每一个簇中抽取可用的客户端参与训练。其具体过程为:
[0030]3‑
1)在第t轮时,按照客户端C的比例,从每个簇中抽取可用的客户端参与训练,其中,为第t轮时第q个聚合器所在簇被抽取的客户端集合,β为客户端训练比例。
[0031]3‑
2)在该轮训练时,被抽取参与训练的客户端C
i
(本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于抽样聚合优化的多层联邦学习方案,其特征在于,包括以下步骤:(1)初始化:服务器初始化全局模型,广播给所有参与联邦学习训练的客户端;(2)聚类:客户端在本地进行第一轮训练后,采用OPTICS聚类方法对收集到的模型参数进行聚类,将客户端划分到不同的簇中;(3)抽样:每轮训练中,按照客户端比例从每一个簇中抽取可用的客户端参与训练;(4)结合训练:参与训练的客户端结合服务器发送的全局模型以及其他客户端的参数进行训练;(5)聚合及分发:服务器对传回的参数进行加权平均,并向下一轮参与训练的客户端发送本轮除自身以外的参与训练的客户端上传的模型参数。2.根据权利要求1所述的抽样聚合优化的多层联邦学习方案,其特征在于,所述步骤(1)中,初始化阶段主要是服务器初始化全局模型,广播给所有参与联邦学习训练的客户端。其具体过程为:服务器:1

1)服务器Ecs初始化全局模型1

2)服务器Ecs向所有的客户端C
i
(i∈K,K为客户端的总数)广播初始化的全局模型θ0。3.根据权利要求1所述的抽样聚合优化的多层联邦学习方案,其特征在于,所述步骤(2)中,聚类阶段主要是客户端在本地进行第一轮训练后,采用OPTICS聚类方法对收集到的模型参数进行聚类,将客户端划分到不同的簇中。其具体过程为:客户端:2

1)在第一轮,客户端C
i
(0<i≤k)接收到云服务器Ecs广播分发的全局模型θ0。2

2)第t轮中,被抽取参与训练的客户端C
i
(0<i≤k)利用本地数据集的样本进行模型训练,其中,为第t轮第i个客户端更新的模型,θ
t
‑1为第t

1轮的全局模型,η
t
为更新的第t轮的全局模型的学习率,ξ
i
为客户端C
i
的数据集样本。2

3)在第一轮完成训练后,采用OPTICS聚类方法对收集到的模型参数进行聚类,将具有足够密度的区域划分为簇,并将客户端划分到不同的簇中。其中,min_samples,x
i
为聚类算法参数。4.根据权利要求2所述的抽样聚合优化的多层联邦学习方案,其特征在于,所述步骤(3)中,抽样阶段主要是每轮训练中,按照客户端比例从每一个簇中抽取可用的客户端参与训练。其具体过程为:3

1)在第t轮时,按照客户端C的比例,从每个簇中抽取可用的客户端参与训练,其中,为第t轮时第q个聚合器所在簇被抽取的客户端集合,β为客户端训练比例。3

2)在该轮训练时,被抽取参与训练的客户端C
i
(C
i
∈S
t
)接收最新的全局模型参数θ
t
‑1。3

3)在该轮训练时,被抽取参与训练的客户端C
i
(C
i
∈S
t
)进行模型训练。3

4)在该轮训练时,被抽取参与训练的客户端C
i
(C
i
∈S
t
)将训练更新的模型发送至服务器。5.根据权利要求3所述的抽样聚合优化的多层联邦学习方案,其特征在于,所述步骤
(4)中,结合训练主要是参与训练的客户端结合服务器发送的全局模型以及其他客户端的参数进行训练。其具体过程为:服务器:4

1)在第t轮中,服务器Ecs向被抽取参与训练的客户端C
i
(C
i
∈S
t
)传递全局模型θ
t
‑1、上一轮参与训练的客户端传送的全部模型参数u
t
‑1=∑
j∈A
(G
t
‑<...

【专利技术属性】
技术研发人员:张世文陈双任飞翔梁伟
申请(专利权)人:湖南科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1