【技术实现步骤摘要】
一种基于局部
‑
全局伪标记的联邦半监督学习方法
[0001]本专利技术涉及人工智能
,尤其是一种基于局部
‑
全局伪标记的联邦半监督学习方法
。
技术介绍
[0002]联邦学习作为一种分布式解决方案最近引起了广泛的研究关注,它允许多个参与客户端协作学习一个全局模型,而无需共享自己的私有数据
。
联邦学习现有的成果主要集中在有监督的环境中,即每个客户端都有完全标记的数据
。
然而在现实场景中,由于注释成本高或专业知识不足,大多数客户端可能没有足够的真实标签数据,而且必须注意的是,有些客户端可能拥有完全未标注的数据
(
例如,医院病人的医疗数据
)。
因此,有学者提出了联邦半监督学习范式,它通过利用客户端存在的大量未标记数据来增强全局模型的性能
。
根据标记数据在客户端和服务器之间的分布情况,可以将联邦半监督学习分为以下三大类:Ⅰ)Labels
‑
at
‑
client
,该场景中客户端拥有由标记数据和未标记数据组成的混合数据集;Ⅱ)Labels
‑
at
‑
server
,该场景中客户端包含一个未标记的数据集,而服务器则包含一个标记数据集;Ⅲ)Labels
‑
at
‑
Partial
‑
Client
,该场景中一部分客户端具有标记数据集,而其余客户端则 ...
【技术保护点】
【技术特征摘要】
1.
一种基于局部
‑
全局伪标记的联邦半监督学习方法,其特征在于,包括以下两个步骤:
S1、
在通信轮次
t
开始时,服务器将全局模型参数传输到活动客户端;每个客户端在接收到参数后再利用全局模型和上一轮通信轮次
t
‑1中训练得到的本地模型在未标记数据的弱增强视图上生成伪标签,并将其作为本地训练强增强视图的目标用于优化交叉熵损失;
S2、
本地训练结束后,每个客户端将本地模型的参数发回到服务器,服务器首先聚合这些参数,然后利用标记数据集对其进行微调,最后得到一个新的全局模型上述交替训练过程重复多次至全局模型收敛后结束
。2.
如权利要求1所述的基于局部
‑
全局伪标记的联邦半监督学习方法,其特征在于,步骤
S1
中,生成伪标签的方法如下:对于客户端
C
u
的未标记数据集使用公式
(1)
和
(2)
一次性标记数据集内所有数据,并通过下列公式
(3)
的方式构建一个固定的伪标记数据集的方式构建一个固定的伪标记数据集的方式构建一个固定的伪标记数据集的方式构建一个固定的伪标记数据集式中,
I(
·
)
是一个指示函数,
DA
w
是弱数据增强操作,
x
u
是未标记数据,是通信轮次
t
中全局模型的参数,
F(
·
)
是一个基于卷积神经网络的编码器,
τ
是置信度阈值;是上一轮通信轮次
t
‑1中训练得到的本地模型参数,
L
是未标记数据集中的类别总数
。3.
如权利要求2所述的基于局部
‑
全局伪标记的联邦半监督学习方法,其特征在于,如果数据集为空,则该客户端的训练过程将直接被跳过;否则,则从数据集
Du
中随机采样一个与等大小的数据集用于辅助训练,其定义如下:其中,是生成的伪标签,是数据集的大小;在客户端的本地训练过程中,数据集和被随机划分为大小为
B
u
的小批次数据
。4.
如权利要求3所述的基于局...
【专利技术属性】
技术研发人员:储节磊,赵晴,李天瑞,吕凤毛,
申请(专利权)人:西南交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。