聚类联邦学习框架下的主动学习客户选择方法和装置制造方法及图纸

技术编号:34098135 阅读:103 留言:0更新日期:2022-07-11 22:48
本申请涉及一种聚类联邦学习框架下的主动学习客户选择方法和装置。所述方法包括:向用户广播模型参数,以使用户根据所述模型参数估计聚类身份和计算本地模型更新,并根据预先设置的主动学习策略计算主动指标,接收用户发送的主动指标和聚类身份,在所述聚类身份下将主动指标按照大小进行排序,根据排序结果选择用户子集,获取用户子集中每个用户更新本地模型得到的本地参数,计算每个聚类分区下本地参数的平均值,作为下一次迭代时的模型参数。采用本方法能够减小通信成本。用本方法能够减小通信成本。用本方法能够减小通信成本。

【技术实现步骤摘要】
聚类联邦学习框架下的主动学习客户选择方法和装置


[0001]本申请涉及计算机
,特别是涉及一种聚类联邦学习框架下的主动学习客户选择方法和装置。

技术介绍

[0002]作为机器学习(ML)的一个开创性子领域,联邦学习(FL)提供了在通信和隐私约束下的分布式训练。在典型的FL过程中,数据被分散地保存在各个客户端中,中央服务器通过聚合用户本地模型来学习全局模型,在这一学习过程中,中央服务器不需要直接访问客户的数据。在每一轮通信中,更新后的全局模型将被广播到客户端上,每个客户端基于自身数据在本地计算模型更新,之后再将本地更新后的模型发送回中央服务器,如此往复。FL已经成功地在许多数据密集型和隐私保护场景中得到了应用,如推荐系统、图像识别、自动驾驶汽车和对话式人工智能。
[0003]尽管取得了令人满意的性能,但联邦学习仍然面临着一些实际的挑战。一个主要的问题是,在现实世界的应用中,不同客户端之间的数据可能包含它们自己的偏好,并且用户上的数据是以不同的方式生成。因此,这类训练数据不是独立的、同分布的(non
r/>IID),这也本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种聚类联邦学习框架下的主动学习客户选择方法,其特征在于,所述方法包括:向用户广播模型参数,以使用户根据所述模型参数估计聚类身份和计算本地模型更新,并根据预先设置的主动学习策略计算主动指标;所述聚类身份对应于聚类分区;接收用户发送的主动指标和聚类身份,在所述聚类身份下将所述主动指标按照大小进行排序,根据排序结果选择用户子集;获取所述用户子集中每个用户更新本地模型得到的本地参数,计算每个聚类分区下所述本地参数的平均值,作为下一次迭代时的模型参数。2.根据权利要求1所述的方法,其特征在于,根据预先设置的主动学习策略计算主动指标,包括:根据最低置信度计算主动指标为:其中,i∈S
j
,S
j
表示用户聚类集合,n是每个用户的样本量,x
i,l
表示用户i第l个样本的特征,是在模型参数θ
j
下,最大概率的类别标签。3.根据权利要求1所述的方法,其特征在于,预先设置的主动学习策略计算主动指标,包括:根据边界采样计算主动指标为:其中,i∈S
j
,S
j
表示用户聚类集合,n是每个用户的样本量,x
i,j
表示用户i第l个样本的特征,是在模型参数θ
j
下,和分别表示用户i中第l个样本的第一可能和第二可能的类别标签的概率。4.根据权利要求1所述的方法,其特征在于,预先设置的主动学习策略计算主动指标,包括:根据信息熵计算主动指标为:其中,i∈S
j
,S
j
表示用户聚类集合,n是每个用户的样本量,x
i,l
表示用户i第l个样本的特征...

【专利技术属性】
技术研发人员:冯旸赫黄红蓝施伟程光权黄金才
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1