基于客户端聚类的个性化联邦学习方法、装置及设备制造方法及图纸

技术编号:37879536 阅读:17 留言:0更新日期:2023-06-15 21:08
本发明专利技术公开了基于客户端聚类的个性化联邦学习方法、装置及设备,该方法包括:获取全局模型,对全局模型进行初始化训练,获取每个客户端在初始化训练中产生的梯度;根据客户端的梯度进行聚类分析,确定每个客户端所属的簇;将在每个簇内的客户端训练的深度神经网络的第一隐藏层集合进行共享训练,在每个簇内的客户端训练的深度神经网络的第二隐藏层集合进行个性化训练,直至本地模型收敛后得到个性化模型。解决了传统联邦学习制约个性化模型收敛性能、准确率和精度等技术问题。准确率和精度等技术问题。准确率和精度等技术问题。

【技术实现步骤摘要】
基于客户端聚类的个性化联邦学习方法、装置及设备


[0001]本专利技术涉及基于客户端聚类的个性化联邦学习
,尤其涉及一种基于客户端聚类的个性化联邦学习方法、装置及设备。

技术介绍

[0002]传统的联邦学习假设存在一个模型能同时适用于所有客户端的数据分布,通过提取所有参与客户端的共同知识来得到高质量的全局模型。但是这种模式现在正面临如下挑战:1)数据异构:不同客户端上的数据不满足独立同分布性质;2)客户端异构:客户端的计算和存储能力不同;3)模型异构:不同的客户端需要定制化的模型以适应自身的应用环境。换言之,一个共享模型的表达能力是无法同时拟合所有客户端的分布,并且不一定适用于某些性能与众不同的客户端,最终制约模型准确率的提升。
[0003]例如,物联网场景中某客户端的目标是在全部的人脸图像数据集上训练一个“吸引力”分类器。不同的客户端对“吸引力”的定义不同。客户端A可能认为长发代表吸引力,而客户端B并不赞同。在这种情况下,全局共享模型并不适用于所有客户端。
[0004]个性化联邦学习在享受知识共享优势的同时,能兼顾客户端的数据分布与业务需求的异构性,给客户端提供个性化模型。联邦多任务学习作为联邦学习个性化手段之一,把为不同终端建立模型看作多个任务,并维持一个全局模型作为参考。每个客户端根据当前参考模型和本地数据,通过施加正则项等方法训练自己的个性化模型。但这种方式忽略了客户端间的相似关系且仅参考一个全局模型,制约了收敛性和训练质量的提高。
[0005]在经过一定数量的全局迭代之后,客户端会表现出与其数据分布和模型需求高度相关的梯度,因此梯度可作为客户端相似度聚类的标准。但是深度神经网络梯度的高维特征对聚类算法的计算效率有更高的要求。同时,客户端承载业务具有动态性和多样化的特点,传统算法存在对初始聚类中心敏感的问题。
[0006]为解决上述问题,专利号为CN114492847B的《一种高效个性化联邦学习系统和方法》专利,涉及一种高效个性化联邦学习系统和方法,该系统中的终端设备包括:终端设备数据模块、终端设备模型下载模块、两个终端设备模型训练模块和终端设备模型上传模块,中心服务器包括服务器端数据模块、两个服务器端模型整合模块和服务器端模型派发模块。该专利技术设计合理,其将剪枝处理及模型训练完全放在终端设备进行,降低了中心服务器的负担,提高了处理效率,并且充分考虑数据分布的差异性,实现了模型的个性化功能,能够有效地对不同终端设备上采集到的数据进行分析,在大幅降低通信成本的同时保证用户的隐私信息和个性化,以及终端设备数据缺失情况下的新模型发送。但此类方法的缺点是不适用于客户端数量较大的场景。
[0007]专利号为CN112560991A的《基于混合专家模型的个性化联邦学习方法》专利,涉及一种基于混合专家模型的个性化联邦学习方法,该专利技术为克服大规模无状态的移动联邦环境中私有模型很难实现充分训练的缺陷,提出一种基于混合专家模型的个性化联邦学习方法:所有客户端加入联邦学习共同参与全局模型的训练,得到全局模型参数θG;每个客户端
分别从服务器下载θG,并利用该参数初始化客户端中的特征提取层与个性分类层,利用固定基层方法进行个性化获得个性分类层参数;此时客户端i拥有包括特征提取层参数、全局分类层参数的θG和个性分类层参数,利用这三者初始化特征提取层、全局分类层和个性分类层,共同训练门控模型,得到门控模型参数最终客户端获得特征提取层、全局分类层、个性分类层和门控模型的参数,完成个性化联邦学习。该专利根据通过联邦学习得到的全局模型参数,对个性分类层、门控模型的参数进行微调,再利用全局模型和个性分类层单独训练门控模型,实现个性分类层与全局模型的混合,能够提升个性化能力的同时,保留全局知识;该专利将个性分类层和全局模型作为本地和全局的专家,组成混合专家模型,再使用门控模型来将这些专家结合,并采用特征提取层的输出作为门控模型的输入,使门控模型能更有效划分输入数据。但其算法复杂,带来大量的资源开销,并且计算时间较长。
[0008]专利号为CN112668726A的《一种高效通信且保护隐私的个性化联邦学习方法》专利,涉及一种高效通信且保护隐私的个性化联邦学习方法,包括以下步骤:S1:从中央服务器拉取当前全局模型Wt到所有客户端中,初始化各个客户端的本地模型;S2:执行E轮本地训练,得到新的本地模型;S3:将的模型参数发送到中央服务器;S4:在中央服务器中对接收到的模型参数聚合,得到聚合结果Wt+1;S5:根据Wt+1将所有客户端的本地模型更新;S6:判断是否完成预定迭代次数;若是,则完成个性化联邦学习;若否,则令t=t+1,并返回步骤S2进行下一轮个性化联邦学习。该专利技术提供一种高效通信且保护隐私的个性化联邦学习方法,解决了现有的个性化联邦学习方法没有实现个性化客户端本地模型与全局模型的平衡的问题。但同样不适用于客户端数量较大的场景。

技术实现思路

[0009]本专利技术提供了一种基于客户端聚类的个性化联邦学习方法、装置及设备,解决了传统联邦学习制约个性化模型收敛性能、准确率和精度等技术问题。
[0010]一种基于客户端聚类的个性化联邦学习方法,包括:
[0011]获取全局模型,对所述全局模型进行初始化训练,获取每个客户端在所述初始化训练中产生的梯度;
[0012]根据所述客户端的梯度进行聚类分析,确定每个所述客户端所属的簇;
[0013]将在每个簇内的客户端训练的深度神经网络的第一隐藏层集合进行共享训练,在每个簇内的客户端训练的深度神经网络的第二隐藏层集合进行个性化训练,直至本地模型收敛后得到个性化模型。
[0014]在本专利技术的一种实施例中,所述获取每个客户端在所述初始化训练中产生的梯度,具体包括:将所述全局模型下发至各个客户端,形成对应每个客户端的本地模型;对所述本地模型进行训练,确定每个所述客户端对应的本地模型的损失函数,所述损失函数包括所述本地模型的目标参数;通过随机梯度下降算法不断对所述目标参数进行n次迭代,直到确定所述目标参数使所述损失函数最小化;获取对应每个所述客户端的梯度。
[0015]在本专利技术的一种实施例中,所述根据所述客户端的梯度进行聚类分析,确定每个所述客户端所属的簇,具体包括:根据所述客户端的数据集和所述客户端对应的梯度确定加权客户端;初始化多个球簇的质心和半径;将每个所述加权客户端划分到离它最近的质心所在的球簇中;根据所述半径和任意所述球簇之间的质心距离确定任意两个球簇之间的
邻域关系;根据所述邻域关系和所述加权客户端到所属球簇及其邻域球簇质心的距离,移动球簇中的加权客户端到其邻域球簇中;根据所述加权客户端到所属球簇及其邻域球簇质心的距离,不断将每个所述球簇中的加权客户端进行迭代,直到每个球簇中拥有的加权客户端不变。
[0016]在本专利技术的一种实施例中,根据所述客户端的梯度进行聚类分析,还包括:确定所有球簇半径的平均值和球簇分裂的增量步长;比较每个球簇半径与所述平均值的大小;将所述球簇半径大于所述平均值的球簇进行分裂;确定分裂本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于客户端聚类的个性化联邦学习方法,其特征在于,包括:获取全局模型,对所述全局模型进行初始化训练,获取每个客户端在所述初始化训练中产生的梯度;根据所述客户端的梯度进行聚类分析,确定每个所述客户端所属的簇;将在每个簇内的客户端训练的深度神经网络的第一隐藏层集合进行共享训练,在每个簇内的客户端训练的深度神经网络的第二隐藏层集合进行个性化训练,直至本地模型收敛后得到个性化模型。2.根据权利要求1所述的方法,其特征在于,所述获取每个客户端在所述初始化训练中产生的梯度,具体包括:将所述全局模型下发至各个客户端,形成对应每个客户端的本地模型;对所述本地模型进行训练,确定每个所述客户端对应的本地模型的损失函数,所述损失函数包括所述本地模型的目标参数;通过随机梯度下降算法不断对所述目标参数进行n次迭代,直到确定所述目标参数使所述损失函数最小化;获取对应每个所述客户端的梯度。3.根据权利要求1所述的方法,其特征在于,所述根据所述客户端的梯度进行聚类分析,确定每个所述客户端所属的簇,具体包括:根据所述客户端的数据集和所述客户端对应的梯度确定加权客户端;初始化多个球簇的质心和半径;将每个所述加权客户端划分到离它最近的质心所在的球簇中;根据所述半径和任意所述球簇之间的质心距离确定任意两个球簇之间的邻域关系;根据所述邻域关系和所述加权客户端到所属球簇及其邻域球簇质心的距离,移动球簇中的加权客户端到其邻域球簇中;根据所述加权客户端到所属球簇及其邻域球簇质心的距离,不断将每个所述球簇中的加权客户端进行迭代,直到每个球簇中拥有的加权客户端不变。4.根据权利要求3所述的方法,其特征在于,根据所述客户端的梯度进行聚类分析,还包括:确定所有球簇半径的平均值和球簇分裂的增量步长;比较每个球簇半径与所述平均值的大小;将所述球簇半径大于所述平均值的球簇进行分裂;确定分裂的球簇数量大于等于所述增量步长时,停止分裂。5.根据权利要求3所述的方法,其特征在于,所述根据所述加权客户端到所属球簇及其邻域球簇质心的距离,不断将每个所述球簇中的加权客户端进行迭代,具体包括:确定球簇的稳定域和活动域;若确定所述加权客户端在所述稳定域中,则在当前迭代中不移动所述加权客户端到所述球簇的其他邻域球簇中;将球簇的所述活动域划分为多个环形区域,确定所述加权客户端所属的环形区域;根据所述加权客户端所属的环形区域和所述加权客户端到所属球簇及其邻域球簇质心的距离,移动所述加权客户端到对应的邻域球簇或其所属球簇本身。
6.根据权利要求3所述的方法,其特征在于,所述根据所述半径和任意所述球簇之间的质心距离确定任意...

【专利技术属性】
技术研发人员:朱红高莉莎沙倚天项楠吴越韩硕孙凯李静雅赵天成陈洁蔚郭少勇徐思雅
申请(专利权)人:国网江苏省电力有限公司南京供电分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1