基于联邦学习的模型训练方法和联邦学习系统技术方案

技术编号：35590685 阅读：15 留言：0更新日期：2022-11-16 15:07

公开了一种基于联邦学习的模型训练方法和联邦学习系统。所述方法应用于包括服务器与N个节点的联邦学习系统，N＞1，并且包括：在模型训练的第i次操作中，执行：服务器将模型参数集合下发给M

全部详细技术资料下载

【技术实现步骤摘要】
基于联邦学习的模型训练方法和联邦学习系统

[0001]本公开涉及机器学习领域，尤其涉及一种基于联邦学习的模型训练方法和联邦学习系统。

技术介绍

[0002]近年来，人工智能迎来了新一波的发展高潮，机器学习在其中扮演了核心角色。为了训练一个表现良好的机器学习模型，需要采集大量高质量的数据。但在大量应用场景中，隐私保护使得无法从用户收集隐私数据到服务器进行集中模型训练，这对机器学习的广泛应用造成障碍。
[0003]为此，能够让参与方在不泄露数据的前提下协同训练一个模型从而克服数据隐私问题的多方联合建模被提出。多方联合建模中一个重要且普遍的场景是联邦学习(FL)。在联邦学习下，用户在本地使用数据按照既定的算法求得模型的更新值(即，梯度)，将更新值反馈给服务器，从而避免本地训练数据被外界知晓。然而，业已发现服务器能够利用特定用户上传的梯度来逆转恢复出该用户的本地训练数据。
[0004]为此，需要一种能够保护联邦学习用户的本地训练数据安全的模型训练方法。

技术实现思路

[0005]本公开要解决的一个技术问题是提供一种基于联邦训练的模型训练方法，它通过巧妙构造与梯度相关的理论上派生的性能维护指标和隐私保护指标，并进行联合优化，能够实现接近“理想”变换梯度的性能维持、隐私保护和实用性的属性。
[0006]根据本公开的第一个方面，提供了一种基于联邦学习的模型训练方法，应用于包括服务器与N个节点的联邦学习系统，N＞1，所述方法包括：在模型训练的第i次操作中，执行：所述服务器将模型参数集合下发给M...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的模型训练方法，应用于包括服务器与N个节点的联邦学习系统，N＞1，所述方法包括：在模型训练的第i次操作中，执行：所述服务器将模型参数集合下发给M
i
个节点，其中，M
i
≤N，M
i
个节点各自使用本地训练样本执行梯度计算以获取原始梯度，并且对与所述原始梯度相关的性能维持指标和隐私保护指标进行联合优化，以求取变换梯度δ
*mi
，其中，m＝1,2,
…
,M
i
；以及所述服务器获取变换梯度δ
*mi
并更新模型参数集合。2.如权利要求1所述的方法，其中，所述性能维持指标表征所述变换梯度δ
*mi
维持模型训练收敛的性能并且是所述原始梯度的函数；以及所述隐私保护指标表征从求取的变换梯度δ
*mi
推出本地训练样本数据的难易度并且是所述原始梯度的函数。3.如权利要求2所述的方法，其中，使用所述性能维持指标表征变换梯度δ
*mi
相距所述原始梯度的距离。4.如权利要求2所述的方法，其中，使用所述隐私保护指标限制从求取的变换梯度δ
*mi
推出的本地训练样本数据x
*mi
相距原始本地训练样本数据x
mi
的距离下界。5.如权利要求4所述的方法，其中，通过调节所述联合优化中的所述性能维持指标和所述隐私保护指标权重来调整所述距离下界。6.如权利要求1所述的方法，其中，对与所述梯度相关的性能维持指标和隐私保护指标进行联合优化，以求取变换梯度δ
*mi
包括：迭代计算以求取满足所述性能维持指标和所述隐私保护指标限制条件下的变换梯度δ
*mi
的优化解。7.如权利要求6所述的方...

【专利技术属性】
技术研发人员：范洺源，周文猛，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人