一种基于异质客户端感知的联邦主动学习方法技术

技术编号：36559953 阅读：18 留言：0更新日期：2023-02-04 17:15

本发明专利技术公开了一种基于异质客户端感知的联邦主动学习方法。初始轮，客户端在自身私有数据上使用交叉熵损失进行本地模型训练；完成本地训练后，上传本地更新至服务器；服务器执行聚合获得新一轮的全局模型，并下发给所有客户端。客户端收到新的全局模型并开始本地训练前，执行采样操作。首轮外，本地训练不仅计算交叉熵损失，客户端还将基于前一轮记录的认知波动信息对抽取的无标签子集进行分类，并额外计算一个对齐损失项，以校准模型的决策边界，避免在不准确模型上浪费标注预算。本发明专利技术解决了现有联邦主动学习方法在异质场景下失效的问题。一方面更有效地衡量了样本信息量，另一方面能训练更准确地模型，从而减少模型的认知波动以提升模型性能。动以提升模型性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于异质客户端感知的联邦主动学习方法

[0001]本专利技术涉及一种机器学习领域中的联邦主动学习方法，尤其涉及一种基于客户端异质感知采样的联邦主动学习方法。

技术介绍

[0002]主动学习是通过识别信息量最大的无标签数据，并从人类专家那里查询其标签来学习一个模型，以解决机器学习中由于高昂的标注成本导致标签数据不足下难以训练高质量模型的问题。然而，由于人力和无标注语料库大小的限制，每个数据所有者单独执行主动学习往往不足以获得可接受的模型精度。而分布式的主动学习利用多个用户合作标注数据和训练模型解决了上述问题。但在这种分布式范式中，原始数据被直接暴露在用户间，导致用户对数据隐私的担忧。
[0003]联邦主动学习将主动学习扩展至有多个客户端和一个服务器的联邦学习中。具体来说，每个客户端标注自己的无标签数据，在本地利用标签数据进行模型训练，并通过与服务器之间关于模型参数而非原始数据的多轮通信来学习一个共享的全局模型，以此克服了数据大小和人力的限制，并减轻了对数据隐私的担忧。
[0004]当前的联邦主动学习是将传统主动学习方法以联邦的形式进行部署，例如：基于不确定度、多样性和预期模型变化的数据采集策略。当客户端数据服从独立同分布的情况下，这些方法能维持较好的表现；但是实际客户端数据往往是服从非独立同分布的，此时客户端的模型训练和采样容易收到其他人的干扰。这些现存的策略往往忽略异质客户端所引起的模型认知变化问题，从而挑选低信息量的样本，导致联邦主动学习的失败。

技术实现思路

[0005]本专利...

【技术保护点】

【技术特征摘要】
1.一种基于异质客户端感知的联邦主动学习方法，其特征在于，包括以下步骤：(1)客户端在自身私有数据上进行本地模型训练；每完成一次本地训练会对每个无标签样本进行推断，并记录模型的预测的一致性结果，用于认知波动的捕获；(2)客户端k完成本地训练后，上传本地更新至服务器；服务器按下式执行聚合获得新一轮的全局模型ω
r
，并下发给所有客户端；其中，N表示所有客户端的总标签集大小，表示客户端k本地训练的标签集大小；(3)客户端收到新的全局模型开始下一轮本地训练前，客户端基于步骤(1)记录的信息统计连续轮内模型预测是否一致并计算累计变化量(4)客户端根据累计变化量的大小和标注预算贪心地从无标签集中挑选出数据并标注记为获得更新的标签集和无标签集公式如下：公式如下：(5)采样完成后，客户端利用捕获的认知信息暂时得将模型过度自信或相对简单的零波动样本移到休眠集获得更新后的休眠集和无标签集；表示为如下公式：获得更新后的休眠集和无标签集；表示为如下公式：只有当无标签集的规模小于给定的唤醒阈值时，将从中随机唤醒T
a
部分冻结数据到无标签池中；(6)完整联邦主动学习重复步骤(1)至步骤(5)，直至满足指定轮或者性能阈值；其中，在每次局部训练之前，除了第一轮，每个客户端k都会从无标签集中随机采样一个大小为的子集代替参与后续进程。2.根据权利要求1所述基于异质客户端感知的联邦主动学习方法，其特征在于，所述步骤(1)包括以下子步骤：(1.1)用表示客户端k在其标签集上连续更新e轮后的模型检查点，表示e轮训练后样本x
i
的预测标签；其中，表示x
i
在最后一层softmax激活后的输出，c表示某一类别；(1.2)对于每一个客户端k在大小为的无标签集上做一次推断，并记录预测结果当x
i
的连续两次推断结果不一致时，记本地模型产生了一次认知变化用一个E维的向量EV来记录E回合内每个样本的历史认知变化；因...

【专利技术属性】
技术研发人员：寿黎但，陈珂，张俊，郁强，李开民，李圣权，毛云青，
申请(专利权)人：城云科技中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人