一种增强隐私保护的联邦学习方法和系统技术方案

技术编号:28036455 阅读:35 留言:0更新日期:2021-04-09 23:18
本说明书涉及机器学习领域,特别涉及一种增强隐私保护的联邦学习方法和系统。所述方法由多个参与方中的任一训练成员实现,其中,所述参与方包括服务器及多个训练成员,该方法包括:获取隐私样本;获取一个或多个与所述隐私样本同类型的扰动样本;基于所述隐私样本与一个或多个扰动样本生成加密样本;基于所述加密样本,与其他参与方进行联邦学习以对待训练模型进行联合训练。

【技术实现步骤摘要】
一种增强隐私保护的联邦学习方法和系统
本说明书涉及机器学习领域,特别涉及一种增强隐私保护的联邦学习方法和系统。
技术介绍
为了得到更好的机器学习模型,通过多个训练成员的数据进行联合训练,以获取训练好的模型。然而在一些联合训练场景中,各训练成员的训练数据可能涉及用户隐私或商业秘密,训练成员不希望这些训练数据泄露。因此,有必要提出一种联邦学习方法,以减少隐私数据泄露的可能,并提高数据的安全性。
技术实现思路
本说明书实施例之一提供一种增强隐私保护的联邦学习方法,所述方法由多个参与方中的任一训练成员实现,其中,所述参与方包括服务器及多个训练成员,该方法包括:获取隐私样本;获取一个或多个与所述隐私样本同类型的扰动样本;基于所述隐私样本与一个或多个扰动样本生成加密样本;基于所述加密样本,与其他参与方进行联邦学习以对待训练模型进行联合训练。本说明书实施例之一提供一种增强隐私保护的联邦学习系统,其包括:隐私样本获取模块,用于获取隐私样本;扰动样本获取模块,用于获取一个或多个与所述隐私样本同类型的扰动样本;加密样本生成模块,本文档来自技高网...

【技术保护点】
1.一种增强隐私保护的联邦学习方法,所述方法由多个参与方中的任一训练成员实现,其中,所述参与方包括服务器及多个训练成员,该方法包括:/n获取隐私样本;/n获取一个或多个与所述隐私样本同类型的扰动样本;/n基于所述隐私样本与一个或多个扰动样本生成加密样本;/n基于所述加密样本,与其他参与方进行联邦学习以对待训练模型进行联合训练。/n

【技术特征摘要】
1.一种增强隐私保护的联邦学习方法,所述方法由多个参与方中的任一训练成员实现,其中,所述参与方包括服务器及多个训练成员,该方法包括:
获取隐私样本;
获取一个或多个与所述隐私样本同类型的扰动样本;
基于所述隐私样本与一个或多个扰动样本生成加密样本;
基于所述加密样本,与其他参与方进行联邦学习以对待训练模型进行联合训练。


2.如权利要求1所述的方法,所述基于所述隐私样本与一个或多个扰动样本生成加密样本,包括:
对所述隐私样本的特征数据和一个或多个扰动样本的特征数据进行加权求和,得到所述加密样本的特征数据;
对所述隐私样本的标签数据和所述一个或多个扰动样本中的至少一个的标签数据进行加权求和,得到所述加密样本的标签数据;
其中,权重系数为随机生成。


3.如权利要求1所述的方法,所述基于所述隐私样本与一个或多个扰动样本生成加密样本,包括:
对所述隐私样本的特征数据和一个或多个扰动样本的特征数据进行加权求和,得到融合特征数据;
生成掩模数据;
将所述掩模数据与所述融合特征数据进行运算,得到所述加密样本的特征数据;
对所述隐私样本的标签数据和所述一个或多个扰动样本的至少一个的标签数据进行加权求和,得到所述加密样本的标签数据;
其中,权重系数为随机生成。


4.如权利要求3所述的方法,所述掩模数据与所述融合特征数据维度相同,所述运算包括将所述掩模数据与所述融合特征数据按位相乘。


5.如权利要求4所述的方法,所述掩模数据包括取值为1的元素与取值为-1的元素,且前述两种元素在所述掩模数据中随机分布。


6.如权利要求1所述的方法,所述扰动样本来自公开数据集和/或所述训练成员的私有样本集。


7.如权利要求6所述的方法,所述扰动样本通过对公开数据集和/或所述训练成员的私有样本集中的样本进行分层采样获得。


8.如权利要求1所述的方法,所述隐私样本的类型包括文本数据、音频数据或者图像数据。


9.一种增强隐私保护的联邦学习系统,其包括:
隐私样本获取模块,用于获取隐私样本;
扰动样本获取模块,用于获取一个或多个与所述隐私样本同类型的扰动样本;
加密样本...

【专利技术属性】
技术研发人员:李龙飞周俊
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1