异步联邦学习隐私保护方法、系统、介质、设备及终端技术方案

技术编号:35453718 阅读:27 留言:0更新日期:2022-11-03 12:09
本发明专利技术属于机器学习安全技术领域,公开了一种异步联邦学习隐私保护方法、系统、介质、设备及终端,初始化系统并选取随机参数,公开系列参数和签名公钥;用户生成签名以及公私钥对并发送给服务器,服务器将用户身份信息和公钥打包广播给其他用户;用户接收到数据后生成随机参数对应的子秘密以及一次性会话密钥;用户之间生成共享密钥并对用户信息加密;用户待加密信息为加权后的用户本地信息;用户将加掩码后的数据发送给服务器,服务器对数据进行聚合,得到聚合结果;服务器将聚合结果除以最终参与训练用户持有的样本总数,得到全局模型。本发明专利技术的异步联邦学习隐私保护方法保护了联邦学习中用户的隐私性;减少了学习训练的时间,节省了资源。节省了资源。节省了资源。

【技术实现步骤摘要】
异步联邦学习隐私保护方法、系统、介质、设备及终端


[0001]本专利技术属于机器学习安全
,尤其涉及一种异步联邦学习隐私保护方法、系统、介质、设备及终端。

技术介绍

[0002]联邦机器学习,又名联邦学习,是一种机器学习框架,能有效帮助多个机构在保证用户隐私、数据安全以及政府法规要求的前提下,进行数据使用和机器学习建模。在数据量爆发式增长的环境下,联邦学习作为分布式的机器学习范式,可以有效解决数据孤岛问题,让参与方在不共享数据的基础上联合建模,从而在技术上打破数据孤岛。
[0003]目前,联邦学习中的数据安全主要通过安全聚合协议实现,虽然保证了数据安全,但传统的联邦学习并发性不高,会导致学习效率低下的问题。此外,由于参加联邦学习的用户的本地模型更新速度不同,而传统联邦学习的训练中,每一轮聚合必须等待所有参与的用户完成,这样的模型训练对于同步联邦来说是困难且低效率的,会导致落后者问题,这同样也会影响学习的效率。因此提出了异步联邦学习,然而异步联邦学习的特性使得其并不兼容安全聚合协议,因此目前在异步联邦学习中,数据的隐私性和机密性无法得到保证的问题仍然存在。
[0004]通过上述分析,现有技术存在的问题及缺陷为:同步联邦学习存在并发性不高和落后者的问题,需要通过异步学习来提高联邦学习的并发性和训练效率。而异步联邦学习存在用户本地的隐私数据易被泄露的问题,现有的方案尝试改进异步联邦学习中的隐私保护技术,但仍无法很好的平衡异步联邦学习中隐私保护和训练效率。如何在异步联邦学习高效的训练下实现隐私保护,同时不影响训练结果的有效性是现阶段联邦学习中存在的问题。

技术实现思路

[0005]针对现有技术存在的问题,本专利技术提供了一种异步联邦学习隐私保护方法、系统、介质、设备及终端,尤其涉及一种基于安全多方计算的异步联邦学习隐私保护方法、系统、介质、设备及终端。
[0006]本专利技术在异步联邦学习的训练中,为每个参与训练的用户引入了权重系统来提高训练效率,同时提出了一种基于同态哈希函数的验证方案来保证在该权重系统在主动攻击敌手下的安全性。
[0007]本专利技术是这样实现的,一种异步联邦学习隐私保护方法,所述异步联邦学习隐私保护方法包括:本专利技术在异步联邦学习框架中引入了权重系统来提高学习效率,同时提出了一种基于同态哈希函数的验证方案来保证在该权重系统的安全性初始化系统并选取随机参数,公开系列参数和签名公钥;参与训练的用户收到签名私钥生成签名以及公私钥对;每个用户将公钥和签名打包发送给服务器,服务器校验后将用户身份信息和公钥打包广播给其他用户;用户接收到数据后生成随机参数对应的子秘密以及一次性会话密钥并发送给
服务器进行广播;
[0008]用户之间生成共享密钥并对用户信息加密;每个用户的待加密信息为加权后的用户本地信息,权重为该用户持有的样本数量和该用户参加训练时的陈旧度衰减系数;每个用户将加掩码后的数据发送给服务器,服务器对数据进行聚合,得到聚合结果;服务器将聚合结果除以最终参与训练用户持有的样本总数,得到全局模型。
[0009]进一步,所述异步联邦学习隐私保护方法还包括:
[0010]可信第三方初始化系统,在有限域中选取随机参数,公开一系列参数;参与训练的用户用所述参数各自生成两组公私钥对以及签名;用户和服务器的通信经过安全认证信道,每个用户将公钥和签名打包发送给服务器,服务器校验后将用户身份信息、公钥和签名打包广播给其他用户;每个用户接收到数据后验证签名,从有限域中选取随机参数;根据秘密共享算法生成对应的子秘密,再生成私钥对应的子秘密以及用户之间对应的一次性会话密钥,并将子秘密和身份信息以会话密钥加密发送给服务器;服务器将密文广播给对应的用户;
[0011]用户之间生成共享密钥,将之前选取的随机数和所述共享密钥通过伪随机数生成器做掩码对用户的信息加密;每个用户需要加密的信息为用户本地的信息乘以持有的样本数量和参加训练时的陈旧度衰减系数;每个用户生成验证向量,并将加掩码后的数据发送给服务器,服务器广播参加训练的用户列表;用户收到所有用户的列表后计算自己的签名并发送给服务器;
[0012]服务器广播所述签名给对应用户;每个用户收到签名后进行验证,解密服务器之前发送的密文得到子秘密,将掉线用户共享密钥的子秘密和未掉线用户随机数的子秘密发送给服务器,服务器收到所述子秘密后恢复出子秘密对应的原秘密,将所有的掩码数据相加减去通过伪随机数生成器的秘密,最终得到聚合结果;服务器根据聚合结果验证用户的样本数没有作假。
[0013]进一步,所述异步联邦学习隐私保护方法包括以下步骤:
[0014]步骤一,可信第三方初始化系统,在方案中用于生成所有的系统参数。可信第三方在有限域中选取随机参数,公开一系列参数和用户的签名公钥;每个用户生成密钥,参与训练的用户从可信第三方接收签名私钥生成签名,用公开参数生成公私钥对,打包发送给服务器;
[0015]步骤二,用户生成密文,在方案中用于在用户之间生成构造掩码所需的密钥,并将这些密钥秘密的发送给所有的用户。每个用户从有限域中选取随机参数,并根据秘密共享算法生成随机参数对应的子秘密和私钥对应的子秘密,用一次性会话密钥加密所述子秘密和身份信息,作为密文发送给服务器;
[0016]步骤三,用户生成带系数加掩码本地数据,在方案中用于将每个用户的本地加权数据加密,以此来保证用户隐私数据的安全性。每个用户将之前选取的随机数和与其他用户之间生成的共享密钥做掩码,对用户带系数的本地数据加掩码加密;生成验证向量,并将加掩码后的数据发送给服务器;
[0017]步骤四,服务器解码并聚合,在方案中用于在服务器端安全的聚合数据,即本方案的最终输出结果。每个用户解密服务器发送的密文得到子秘密,根据其他用户是否掉线发送对应子秘密,服务器恢复出所述子秘密对应的原秘密后恢复掩码,进而得到聚合结果;服
务器生成验证向量,根据聚合结果验证用户的样本数没有作假。
[0018]进一步,所述异步联邦学习隐私保护方法还包括:
[0019](1)可信第三方进行初始化,给出一个安全参数k,产生(q,g,G,H),其中q是一个素数,G是阶为q的群,g是G的一个生成元,H:{0,1}
*

{0,1}
k
是哈希函数,在中Z
q
随机选择x作为签名密钥d
SK
,计算d
PK
=(g
x mod q,g,q)作为签名验证密钥,其中Z
q
代表有限域,同时给出一个用于秘密恢复的门限值t和参加训练的用户数量n,发布公共参数GPK=(G,q,g,H,t,n,d
PK
,(δ,ρ)),其中(δ,ρ)∈Z
q
为同态哈希函数中的密钥;对于1≤a≤n身份信息为
a
的用户,收到可信第三方发布的签名密钥和其他用户b公开的签名验证密钥用户生成密钥,用户a在中Z
q
随机选择两个不同的x1和x本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异步联邦学习隐私保护方法,其特征在于,所述异步联邦学习隐私保护方法包括:初始化系统并选取随机参数,公开系列参数和签名公钥;参与训练的用户收到签名私钥生成签名以及公私钥对;用户将公钥和签名打包发送给服务器,服务器校验后将用户身份信息和公钥打包广播给其他用户;用户接收到数据后生成随机参数对应的子秘密以及一次性会话密钥并发送给服务器进行广播;用户之间生成共享密钥并对用户信息加密;用户待加密信息为加权后的用户本地信息,权重为用户持有的样本数量和用户参加训练时的陈旧度衰减系数;用户将加掩码后的数据发送给服务器,服务器对数据进行聚合,得到聚合结果;服务器将聚合结果除以最终参与训练用户持有的样本总数,得到全局模型。2.如权利要求1所述异步联邦学习隐私保护方法,其特征在于,所述异步联邦学习隐私保护方法还包括:可信第三方初始化系统,在有限域中选取随机参数,公开一系列参数;参与训练的用户用所述参数各自生成两组公私钥对以及签名;用户和服务器的通信经过安全认证信道,用户将公钥和签名打包发送给服务器,服务器校验后将用户身份信息、公钥和签名打包广播给其他用户;用户接收到数据后验证签名,从有限域中选取随机参数;根据秘密共享算法生成对应的子秘密,再生成私钥对应的子秘密以及用户之间对应的一次性会话密钥,并将子秘密和身份信息以会话密钥加密发送给服务器;服务器将密文广播给对应的用户;用户之间生成共享密钥,将之前选取的随机数和所述共享密钥通过伪随机数生成器做掩码对用户的信息加密;用户需要加密的信息为用户本地的信息乘以持有的样本数量和参加训练时的陈旧度衰减系数;用户生成验证向量,并将加掩码后的数据发送给服务器,服务器广播参加训练的用户列表;用户收到所有用户的列表后计算自己的签名并发送给服务器;服务器广播所述签名给对应用户;用户收到签名后进行验证,解密服务器之前发送的密文得到子秘密,将掉线用户共享密钥的子秘密和未掉线用户随机数的子秘密发送给服务器,服务器收到所述子秘密后恢复出子秘密对应的原秘密,将所有的掩码数据相加减去通过伪随机数生成器的秘密,最终得到聚合结果;服务器根据聚合结果验证用户的样本数没有作假。3.如权利要求1所述异步联邦学习隐私保护方法,其特征在于,所述异步联邦学习隐私保护方法包括以下步骤:步骤一,可信第三方初始化系统,在有限域中选取随机参数,公开一系列参数和用户的签名公钥;用户生成密钥,参与训练的用户从可信第三方接收签名私钥生成签名,用公开参数生成公私钥对,打包发送给服务器;步骤二,用户生成密文,用户从有限域中选取随机参数,并根据秘密共享算法生成随机参数对应的子秘密和私钥对应的子秘密,用一次性会话密钥加密所述子秘密和身份信息,作为密文发送给服务器;步骤三,用户生成带系数加掩码本地数据,用户将之前选取的随机数和用户之间生成的共享密钥做掩码,对用户带系数的本地数据加码加密;生成验证向量,并将加掩码后的数据发送给服务器;
步骤四,服务器解码并聚合,用户解密服务器发送的密文得到子秘密,根据其他用户是否掉线发送对应子秘密,服务器恢复出所述子秘密对应的原秘密后恢复掩码,进而得到聚合结果;服务器生成验证向量,根据聚合结果验证用户的样本数没有作假。4.如权利要求1所述异步联邦学习隐私保护方法,其特征在于,所述异步联邦学习隐私保护方法还包括:(1)可信第三方进行初始化,给出一个安全参数k,产生(q,g,G,H),其中q是一个素数,G是阶为q的群,g是G的一个生成元,H:{0,1}
*

{0,1}
k
是哈希函数;在中Z
q
随机选择x作为签名密钥d
SK
,计算d
PK
=(g
x mod q,g,q)作为签名验证密钥,其中Z
q
代表有限域,同时给出一个用于秘密恢复的门限值t和参加训练的用户数量n,发布公共参数GPK=(G,q,g,H,t,n,d
PK
,(δ,ρ)),其中(δ,ρ)∈Z
q
为同态哈希函数中的密钥;对于1≤a≤n身份信息为a的用户,收到可信第三方发布的签名密钥和其他用户b公开的签名验证密钥用户生成密钥,用户a在中Z
q
随机选择两个不同的x1和x2,生成两对公私钥对,一对公私钥对为其中同理,另一对公私钥对为其中这两对密钥前者用于认证加密,后者用于生成掩码;用户a通过可信第三方获取签名密钥对消息签名生成对消息签名生成其中k∈Z
q
为用户a选择的随机数;将打包发送给服务器;服务器只判断发送数据的用户数是否大于门限值t,并将当前的用户记作U1,当且仅当|U1|≥t成立时再执行下一步;服务器打包广播给其他用户b;(2)用户生成密文,用户a收到服务器广播其他用户b的消息,用b的验证密钥验证是否成立,并在有限域中选择一个随机数β
a
,根据门限值t,产生对于其他用户b的秘密β
a
和的秘密份额β
a,b
和其中b∈U1;用户a用自己私钥和其他用户b公开的公钥和其他用户b公开的公钥产生一次性会话密钥且key
a,b
=key
b,a
;用户a用一次性会话密钥key
a,b
加密身份信息和两个秘密份额,产生给其他用户b的密文消息服务器只判断发送数据的用户数是否大于门限值t,并将当前的用户记作U2,当且仅当|U2|≥t成立时再执行下一步;服务器广播密文给对应用户;用户生成带系数加掩码本地数据,用户a从服务器收到对应的密文并存储在本地,计算和其他用户b的共享密钥s
a,b
用于生成掩码;将之前选择的随机数β
a
和与其他用户b的共享密钥s
a,b<...

【专利技术属性】
技术研发人员:张应辉曹大禹刘伟韩刚郑东
申请(专利权)人:西安邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1