【技术实现步骤摘要】
基于自步学习与邻接矩阵的标签噪声鲁棒联邦学习方法
[0001]本专利技术涉及分布式机器学习方法领域,具体涉及一种基于自步学习与邻接矩阵的标签噪声鲁棒联邦学习方法。
技术介绍
[0002]联邦学习(Federated Learning):是一种分布式机器学习技术,其中多个设备或者数据源在不共享原始数据的情况下,通过将模型参数在设备之间共享聚合,共同训练一个全局模型,从而实现模型的改进。然而,在实际应用中,由于客户端之间存在能力、偏好、硬件可靠性等方面的差异,导致不同客户端所拥有的数据特征也不尽相同。部分客户端可能具备高质量且无噪声的数据,而另一些客户端则可能面临标签噪声或数据分布偏移等问题,从而影响标签质量,并进一步降低联邦学习模型的准确性和鲁棒性。现有的解决联邦学习标签噪声问题的方法,如引入基准数据集或拒绝噪声客户端参与训练等,均存在引入偏见或丢失信息等缺陷。
[0003]因此,如何有效地减少噪声数据对模型的干扰,并提高模型收敛速度,仍然是一个具有挑战性的问题。
技术实现思路
[0004]本专利技术克服了现有技术的不足,提供一种安全可靠的基于自步学习与邻接矩阵的标签噪声鲁棒联邦学习方法,能够有效地减少噪声数据对模型的干扰,并提高模型收敛速度。
[0005]为达到上述目的,本专利技术采用的技术方案为:一种基于自步学习与邻接矩阵的标签噪声鲁棒联邦学习方法,基于客户端
‑
服务器模式的横向联邦学习框架,进行分布式训练:
[0006]步骤S1,获得可信客户端:从参与横向 ...
【技术保护点】
【技术特征摘要】
1.一种基于自步学习与邻接矩阵的标签噪声鲁棒联邦学习方法,其特征在于:基于客户端
‑
服务器模式的横向联邦学习框架,进行分布式训练:步骤S1,获得可信客户端:从参与横向联邦学习的所有客户端样本中采用互相进行模型评价的方式构建邻接矩阵,通过邻接矩阵选取具有良好数据质量和可靠性的客户端作为可信客户端;步骤S2,根据步骤S1中获得的可信客户端计算所有客户端样本的近邻关系:根据步骤S1中获得的可信客户端进行联邦学习,得到全局联邦模型,使用所述全局联邦模型为所有客户端样本计算近邻关系;步骤S3,自步更新步骤S2获得的样本近邻关系以及标签评估与矫正:对于每个客户端,使用全局联邦模型更新客户端样本的邻接矩阵,获得更新邻接矩阵;计算每个客户端样本的预测标签和原始标签之间的残差;根据更新邻接矩阵将样本分为离群样本与非离群样本;根据残差和邻居标签表示对非离群样本进行标签评估与矫正;步骤S4,离群样本处理:对于离群样本,在前期训练中利用近邻关系将离群样本从训练数据中排除,在后期训练中,在降低学习率之后,逐渐参与训练增强模型的鲁棒数据。2.根据权利要求1所述的一种基于自步学习与邻接矩阵的标签噪声鲁棒联邦学习方法,其特征在于:步骤S2中,对于每个可信客户端,通过所述全局联邦模型得到全连接层特征;使用欧几里得距离来计算客户端中两两样本之间的残差,该残差也可以称之为样本相似度。3.根据权利要求1所述的一种基于自步学习与邻接矩阵的标签噪声鲁棒联邦学习方法,其特征在于:步骤S2中,将所有客户端样本之间的相似度转化成相似度矩阵,并将相似度矩阵转化为邻接矩阵;邻接矩阵用于描述客户端样本之间的近邻关系,将客户端样本分为非离群样本与离群样本。4.根据权利要求1所述的一种基于自步学习与邻接矩阵的标签噪声鲁棒联邦学习方法,其特征在于:步骤S3中,对于每个客户端的每个样本,使用联邦模型的全连接层特征更新客户端样本的邻接矩阵,全连接层特征是深度学习网络模型的最后一层,反应了样本的深度特征,使用该特征计算两两样本之间欧氏距离,更新样本之间的相似度以得到新的相邻关系,获得所述的新邻接矩阵;在联邦学习中每轮更新样本距离,更新邻接矩阵;所述新邻接矩阵反映客户端样本之间的新的相邻关系。5.根据权利要求1所述的一种基于自步学习与邻接矩阵的标签噪声鲁棒联邦学习方法,其特征在于:步骤S3中的自步更新样本近邻关系方法包括:对于每个客户端,使用全局联邦模型重新计算样本标签的全连接层特征,通过归一化指数函数得到预测概率;基于计算的标签预测概率与原始标签之间的残差可以将样本分为两类:一类样本残差较小,认为是可信标签,另一类样本残差较大,认为是不可信样本...
【专利技术属性】
技术研发人员:吴飞,张家宾,季一木,金昊,黄庆花,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。