【技术实现步骤摘要】
一种基于相似特征协作的个性化联邦学习方法和系统
[0001]本专利技术涉及联邦学习
,尤其涉及一种基于相似特征协作的个性化联邦学习方法和系统。
技术介绍
[0002]联邦学习(Federated Learning,FL)本质上是一种分布式机器学习框架,其做到了在保障数据隐私安全及合法合规的基础上,实现数据共享、共同建模。它的核心思想是在多个数据源共同参与模型训练时,不需要进行原始数据流转的前提下,仅通过交互模型中间参数进行模型联合训练,原始数据可以不出本地。
[0003]由于数据和模型的异质性,传统FL仍然存在一些实际挑战,适用于克服这两个挑战的有效算法尚未得到充分开发或系统研究。已有解决数据异质性问题的方案有:(1)为不同的局部客户端分配并维护多个全局模型,如聚类FL;(2)利用全局和局部信息为每个客户端生成个性化模型,如个性化FL。这些方法大多依赖基于梯度的聚合,导致了较高的通信成本和严重依赖相同结构的局部模型。因为不同客户端的硬件和计算能力不同,因此模型异构是常见的。基于知识蒸馏的FL通过将教师模型的知识转移到具有不同模型结构的学生模型中来解决。然而,这些方法需要一个额外的公共数据集来对齐学生和教师模型的输出,从而增加了计算成本。且该方法的性能会随着公共数据集和客户端数据集之间的分布差异的增加而显著降低。
[0004]此外,参与联邦学习的客户端,除了训练有用的FL模型之外,可能还有额外的需求。例如:一家制药公司可能希望建立一个模型,通过FL利用来自多个医院的数据来促进药物研究。为了补偿参与 ...
【技术保护点】
【技术特征摘要】
1.一种基于相似特征协作的个性化联邦学习方法,其特征在于,应用于客户端和服务器,所述的服务器用于管理至少两个客户端,每一客户端上均运行一局部模型及用于训练局部模型的局部数据集,所述方法包括:(1)服务器初始化并接收各客户端发送的局部类级特征向量集;(2)服务器根据各客户端发送的局部类级特征向量集,基于各客户端的聚合权重生成每个客户端的个性化类级特征向量集;(3)每个客户端从服务器上下载对应的个性化类级特征向量集,在其局部数据集上通过最小化局部分类误差与局部类级特征向量集和个性化类级特征向量集之间的距离之和来更新其局部模型;由更新后的局部模型获得其更新后的局部类级特征向量集并发送给服务器;(4)重复步骤(2)
‑
(3)直至所有客户端平均训练损失不再下降。2.根据权利要求1所述的基于相似特征协作的个性化联邦学习方法,其特征在于,在某一客户端上,将其局部数据集输入至其局部模型,将分类网络后端负责决策的某个全连接层的输出作为该客户端某个类的特征向量,对属于该类的所有数据样本的特征向量做平均,得到该类的局部类级特征向量。3.根据权利要求2所述的基于相似特征协作的个性化联邦学习方法,其特征在于,各客户端用于提取局部类级特征向量所在的全连接层输出尺寸相同。4.根据权利要求1所述的基于相似特征协作的个性化联邦学习方法,其特征在于,在服务器上,基于各客户端的聚合权重对具有同一类样本的所有客户端的局部类级特征向量进行聚合,得到各客户端的个性化类级特征向量。5.根据权利要求1所述的基于相似特征协作的个性化联邦学习方法,其特征在于,步骤(2)包括:(i)针对客户端i,计算其类j的局部类级特征向量与其他含有类j的客户端上的局部类级特征向量之间的距离得到距离向量其中:j∈[1,|C
i
|],|C
i
|为客户端i上类的数量;M
(j)
表示含有类j的客户端数量;设置为常数;(ii)针对距离向量取距离的反比并进行归一化,得到权重向量其中:表示客户端k对客户端i的类j的聚合权重,且有(iii)计算得到客户端i上的类j的个性化类级特征向量计算公式为:6.根据权利要求5所述的基于相似特征协作的个性化联邦学习方法,其特征在于,步骤
(i)中,所述的距离为欧式距离、曼哈顿距离、夹角余弦距离。7.根据权利要求6所述的基于相似特征协作的个性化联邦学习方法,其特征在于:欧式距离的计算公式为:...
【专利技术属性】
技术研发人员:林博,王晶,岳伟,尹建伟,
申请(专利权)人:浙江大学滨江研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。