【技术实现步骤摘要】
一种数据共享的两阶段隐私保护方法
[0001]本专利技术涉及分布训练过程中的数据隐私保护方法,尤其涉及一种数据共享的两阶段隐私保护方法。
技术介绍
[0002]随着《通用数据保护条例》(GDPR)的出台,工业界和学术界开始更加关注数据隐私保护。尤其在分布式训练过程中,客户端和中心服务器共享的数据可能会被泄露,从而导致不必要的经济损失。为了解决这个问题,国内外研究学者在分布式训练过程中涉及的数据泄露问题也提出了很多解决方案。差分隐私、安全多方计算技术和同态加密是广泛采用的严格隐私概念。然而,在实际系统中应用这些方案并不容易。
[0003]此外,现存方法通常向数据中添加噪声使得数据模糊化,以此保护数据。但是,随着噪声被添加,数据质量也会随之降低。由于深度学习模型的复杂计算,这些方法难以在深度学习中扩展。并且,大多数方案使用相同的方法来加密不同阶段的数据。其结果并不满足不同阶段的具体需求。例如:在客户端将数据上传到中心服务器阶段,此阶段的保护目的是,确保其数据不被其他非授权通信方获取。在客户端将数据从中心服务器下载的阶段, ...
【技术保护点】
【技术特征摘要】
1.一种数据共享的两阶段隐私保护方法,针对一个中心服务器和多个客户端进行数据共享;其特征在于,包括如下步骤:(1)分布式训练初始化阶段:中心服务器生成初始模型和密钥对,所述密钥对包括公钥和私钥,向各客户端分发初始模型和公钥,中心服务器保存私钥;(2)数据上传阶段:初始化后,每个客户端在本地训练初始模型,并将训练好的数据上传到中心服务器;所述客户端在将数据上传到中心服务器之前,使用中心服务器的公钥执行多对一同态加密;(3)数据安全聚合阶段:中心服务器接受到客户端上传的所有加密数据之后,对所有数据进行聚合和解密;(4)数据下载阶段:采用数字签名进行数据保护,中心服务器生成签名后,将签名与数据一起发送给每个客户端;(5)客户端进行新一轮训练;经过多轮迭代,输出最终模型。2.根据权利要求1所述的一种数据共享的两阶段隐私保护方法,其特征在于,在分布式训练初始化阶段,中心服务器通过从模型提供者下载初始模型或从可信客户端收集数据集来训练初始模型。3.根据权利要求2所述的一种数据共享的两阶段隐私保护方法,其特征在于,所述初始模型为神经网络模型。4.根据权利要求3所述的一种数据共享的两阶段隐私保护方法,其特征在于,在数据上传阶段中,所述多对一同态加密的具体内容为:假设有n个客户端,客户端i上传的数据为w
i
,i=1,2,3
…
n;使用中心服务器的公钥pk对数据进行多对一同态加密得到加密数据使用中心服务器的公钥pk对数据进行多对一同态加密得到加密数据向中心服务器上传加密数据5.根据权利要求4所述的一种数据共享的两阶段隐私保护方法,其特征在于,所述数据安全聚合阶段具体包括如下内容:中心服务器接受到客户端上传的加密数据对其进行安全聚合,得到更新的数据其中,是密文操作符号;在安全聚合后进行数据解密,中心...
【专利技术属性】
技术研发人员:毛莺池,郭宏乐,屠子健,吴明波,王龙宝,程杨堃,吴俊,平萍,
申请(专利权)人:河海大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。