保护隐私的多方安全计算方法、装置和计算机设备制造方法及图纸

技术编号:35640242 阅读:16 留言:0更新日期:2022-11-19 16:31
本说明书实施例公开了一种保护隐私的多方安全计算方法、装置和计算机设备。所述方法包括:获取第一梯度数据的分片和噪声数据的分片,所述第一梯度数据为损失函数的梯度数据;根据第一梯度数据的分片,通过与其他方进行多方安全计算,获得第二梯度数据的分片,所述第二梯度数据为对第一梯度数据进行裁剪后的梯度数据;根据第二梯度数据的分片和噪声数据的分片,确定第三梯度数据的分片,所述第三梯度数据为添加了噪声数据后的第二梯度数据;根据第三梯度数据的分片,确定模型参数的分片。本说明书实施例既可以在训练过程中对参与方的数据提供隐私保护,还可以对训练后的机器学习模型提供隐私保护。模型提供隐私保护。模型提供隐私保护。

【技术实现步骤摘要】
保护隐私的多方安全计算方法、装置和计算机设备


[0001]本说明书实施例涉及计算机
,特别涉及一种保护隐私的多方安全计算方法、装置和计算机设备。

技术介绍

[0002]在互联网技术与信息技术高速发展的现在,人们已经逐渐步入了大数据时代。在大数据时代,数据通常分散存于多个企业机构中。
[0003]在相关技术中,出于数据安全和保护隐私的考虑,所述多个机构可以通过多方安全计算,联合训练机器学习模型。训练后的机器学习模型用于线上的业务处理,例如风险识别等等。

技术实现思路

[0004]本说明书实施例提供一种保护隐私的多方安全计算方法、装置和计算机设备。
[0005]本说明书实施例的第一方面,提供了一种保护隐私的多方安全计算方法,应用于所述多方中的任意一方,该方法包括:
[0006]获取第一梯度数据的分片和噪声数据的分片,所述第一梯度数据为损失函数的梯度数据;
[0007]根据第一梯度数据的分片,通过与其他方进行多方安全计算,获得第二梯度数据的分片,所述第二梯度数据为对第一梯度数据进行裁剪后的梯度数据;
[0008]根据第二梯度数据的分片和噪声数据的分片,确定第三梯度数据的分片,所述第三梯度数据为添加了噪声数据后的第二梯度数据;
[0009]根据第三梯度数据的分片,确定模型参数的分片。
[0010]本说明书实施例的第二方面,提供了一种保护隐私的多方安全计算装置,应用于所述多方中的任意一方,该装置包括:
[0011]获取单元,用于获取第一梯度数据的分片和噪声数据的分片,所述第一梯度数据为损失函数的梯度数据;
[0012]多方安全计算单元,用于根据第一梯度数据的分片,通过与其他方进行多方安全计算,获得第二梯度数据的分片,所述第二梯度数据为对第一梯度数据进行裁剪后的梯度数据;
[0013]第一确定单元,用于根据第二梯度数据的分片和噪声数据的分片,确定第三梯度数据的分片,所述第三梯度数据为添加了噪声数据后的第二梯度数据;
[0014]第二确定单元,用于根据第三梯度数据的分片,确定模型参数的分片。
[0015]本说明书实施例的第三方面,提供了一种计算机设备,包括:
[0016]至少一个处理器;
[0017]存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如第一方面所述方法的指令。
[0018]本说明书实施例提供的技术方案,通过将多方安全计算技术与差分隐私技术相结合,训练机器学习模型。这样既可以在训练过程中对参与方的数据提供隐私保护,还可以对训练后的机器学习模型提供隐私保护,避免窃取训练后的机器学习模型携带的隐私信息。
附图说明
[0019]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本说明书实施例中保护隐私的多方安全计算方法的流程示意图;
[0021]图2为本说明书实施例中保护隐私的多方安全计算过程的示意图;
[0022]图3为本说明书实施例中保护隐私的多方安全计算装置的结构示意图;
[0023]图4为本说明书实施例中计算机设备的功能结构示意图。
具体实施方式
[0024]下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
[0025]通过多方安全计算技术,可以在联合训练机器学习模型的过程中,保护各参与方的数据隐私。但是专利技术人发现,多方安全计算能够为联合训练机器学习模型的过程提供隐私保护,但无法为训练后的机器学习模型提供隐私保护。例如,机器学习模型的训练依赖于对训练数据的学习。使得,训练后的机器学习模型能够反映训练数据的特性。也就是说,训练后的机器学习模型携带了训练数据的隐私信息。这样,攻击者有可能通过推理攻击(inference attack)或者模型反转攻击等攻击方式,窃取训练后的机器学习模型携带的所述隐私信息。
[0026]差分隐私(differential privacy)可以通过对数据添加噪声扰动达到保护隐私的目的。基于差分隐私技术,可以在联合训练机器学习模型的过程中,通过在梯度数据中添加噪声扰动,减少训练后的机器学习模型中携带的隐私信息,从而为训练后的机器学习模型提供隐私保护。
[0027]以下介绍本说明书实施例中涉及的术语。
[0028]多方安全计算(Secure Muti

Party Computation,MPC),又称为安全多方计算,是一种保护数据隐私安全的技术。多方安全计算能让多个参与方在不泄漏自身数据隐私的情况下进行协同的计算处理。秘密分享(Secret Sharing),又称为秘密共享,是一种用于实现多方安全计算的技术。秘密分享的思想是,将秘密以适当的方式进行拆分,得到多个分片。所述多个分片分别交予不同的参与方保管。单个参与方无法恢复所述秘密。只有若干个参与方协作才能恢复所述秘密。其中,所述分片可以包括加法分片。所述多个分片的和可以等于所述秘密。例如,在一种(t,n)门限秘密分享方案中,将秘密以适当的方式进行拆分,得到n个分片。所述n个分片交予n个参与方保管。单个参与方无法恢复所述秘密,只有至少t个参
与方协作才能恢复所述秘密。如果少于t个参与方,则无法恢复所述秘密。
[0029]所述秘密分享运算可以基于秘密分享协议实现。不同的秘密分享协议用于实现不同种类的秘密分享运算。具体地,秘密分享协议可以包括加法运算协议、乘法运算协议、比较运算协议、比特分解运算协议、后缀或运算协议、取模运算协议、截断运算协议等等。
[0030]所述加法运算协议用于实现基于秘密分享的加法运算。通过所述加法运算协议,可以对多个数据执行基于秘密分享的加法运算,得到所述多个数据的相加结果的分片。例如,Alice持有分片[a]1和分片[b]1。Bob持有分片[a]2和分片[b]2。[a]1+[a]2=a。[b]1+[b]2=b。Alice可以通过所述加法运算协议,将分片[a]1和分片[b]1相加,得到分片[c]1。Bob可以通过所述加法运算协议,将分片[a]2和分片[b]2相加,得到分片[c]2。[c]1+[c]2=c=a+b。
[0031]所述乘法运算协议用于实现基于秘密分享的乘法运算。通过所述乘法运算协议,可以对多个数据执行基于秘密分享的乘法运算,得到所述多个数据的相乘结果的分片。例如,Alice持有分片[a]1和分片[b]1。Bob持有分片[a]2和分片[b]2。[a]1+[a]2=a本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种保护隐私的多方安全计算方法,应用于所述多方中的任意一方,该方法包括:获取第一梯度数据的分片和噪声数据的分片,所述第一梯度数据为损失函数的梯度数据;根据第一梯度数据的分片,通过与其他方进行多方安全计算,获得第二梯度数据的分片,所述第二梯度数据为对第一梯度数据进行裁剪后的梯度数据;根据第二梯度数据的分片和噪声数据的分片,确定第三梯度数据的分片,所述第三梯度数据为添加了噪声数据后的第二梯度数据;根据第三梯度数据的分片,确定模型参数的分片。2.根据权利要求1所述的方法,所述获取第一梯度数据的分片,包括:根据训练数据的分片,通过与其他方进行多方安全计算,获得模型预测结果的分片;根据模型预测结果的分片,通过与其他方进行多方安全计算,获得第一梯度数据的分片。3.根据权利要求1所述的方法,所述获取噪声数据的分片,包括:生成服从预设分布的第一子噪声数据;对第一子噪声数据进行拆分,得到第一子噪声数据的分片;接收其他方发来的第二子噪声数据的分片;根据第一子噪声数据的分片和第二子噪声数据的分片,确定噪声数据的分片。4.根据权利要求3所述的方法,所述对第一子噪声数据进行拆分,包括:将第一子噪声数据拆分为多个分片;向其他方发送第一子噪声数据的分片,以将所述多个分片分配给所述多方。5.根据权利要求1所述的方法,所述获得第二梯度数据的分片,包括:根据第一梯度数据的分片,通过与其他方进行多方安全计算,获得第一梯度数据范数的倒数的分片;根据第一梯度数据范数的倒数的分片和裁剪阈值的分片,通过与其他方进行多方安全计算,获得第一乘积的分片,所述第一乘积为第一梯度数据范数的倒数与裁剪阈值之间的乘积;根据第一乘积的分片和比较基准,通过与其他方进行多方安全计算,获得比较结果的分片,所述比较结果用于表示第一乘积与比较基准之间的大小关系;根据比较结果的分片,确定第二梯度数据的分片。6.根据权利要求5所述的方法,所述获得第一梯度数据范数的倒数的分片,包括:根据g的分片,通过与其他方进行多方安全计算,获得g
·
g的分片,所述g表示第一梯度数据,所述g
·
g表示第一梯度数据的内积;根据g
·
g的分片,通过与其他方进行多方安全计算,获得x的分片和exp的分片,所述x和所述ex...

【专利技术属性】
技术研发人员:吴豪奇王力
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1