基于生成对抗网络的多方数据共享方法及相关设备技术

技术编号:33344186 阅读:32 留言:0更新日期:2022-05-08 09:35
本申请提供一种基于生成对抗网络的多方数据共享方法及相关设备,方法包括:逐个发送随机向量到生成器网络进行处理,得到每个随机向量对应的合成数据;将全部随机向量对应的合成数据发送到每个判别器网络进行判别,得到每个判别器网络的判别结果,根据每个判别器网络的判别结果计算每个随机向量对应的合成数据的平均接受概率;将预设概率与每个随机向量对应的合成数据的平均接受概率进行比较,当某个随机向量对应的合成数据的平均接受概率大于等于预设概率时,将该随机向量对应的合成数据作为共享数据。通过本方法可以使得最终共享的数据具有较高的效用。数据具有较高的效用。数据具有较高的效用。

【技术实现步骤摘要】
基于生成对抗网络的多方数据共享方法及相关设备


[0001]本申请涉及数据共享技术,特别涉及一种基于生成对抗网络的多方数据共享方法及相关设备。

技术介绍

[0002]隐私保护的多方数据共享技术为解决多方数据共享带来的隐私泄露问题提供了一种可行的方案。近年来提出的差分隐私(Differential Privacy,DP)技术为解决数据共享带来的隐私泄露问题提供了一种可行的方案。与传统的基于匿名的隐私模型不同,差分隐私为敏感数据提供了一种严格的,可量化的隐私保护方法。通过在统计结果中加入适量噪音以确保修改数据集中一条记录不会对统计结果造成显著的影响,从而实现隐私保护的要求。
[0003]多方数据共享可以由每一方单独在隐私保护约束下将自身的局部数据集发布出去来实现。具体方式可以是:每个数据拥有者利用自身的局部数据集构建一个生成式模型,然后利用学到的生成式模型进行数据的生成,最后将每一方生成的数据整合,形成共享数据集。然而,由于每个局部数据集的数据记录数量有限,因此,学得的生成模型难以保持较好的泛化能力,从而导致最终得到的共享数据的效用差。...

【技术保护点】

【技术特征摘要】
1.一种基于生成对抗网络的多方数据共享方法,其中,所述生成对抗网络包括生成器网络和至少一个判别器网络,其特征在于,包括:逐个发送随机向量到所述生成器网络进行处理,得到每个所述随机向量对应的合成数据;将全部所述随机向量对应的合成数据发送到每个所述判别器网络进行判别,得到所述每个判别器网络的判别结果,根据所述每个判别器网络的判别结果计算每个所述随机向量对应的合成数据的平均接受概率;将预设概率与每个所述随机向量对应的合成数据的平均接受概率进行比较,当某个所述随机向量对应的合成数据的平均接受概率大于等于所述预设概率时,将该随机向量对应的合成数据作为共享数据。2.根据权利要求1所述的方法,其特征在于,所述基于生成对抗网络的多方数据共享方法,还包括:统计得到的所述共享数据的数量,当所述共享数据的数量达到预设的阈值时,停止生成所述合成数据。3.根据权利要求1所述的方法,其特征在于,所述生成对抗网络的训练步骤,包括:分别发送初始生成对抗网络中的生成器网络合成的合成数据到每个所述初始生成对抗网络中的每个判别器网络;分别抽取与所述初始生成对抗网络中每个判别器网络对应的本地数据记录到所述初始生成对抗网络中的每个判别器网络;判别所述数据生成记录和所述本地数据记录,得到所述初始生成对抗网络中的每个判别器网络输出的判别结果;根据所述判别结果分别计算所述初始生成对抗网络中的每个判别器网络的损失函数;根据所述初始生成对抗网络中的每个判别器网络的损失函数分别计算所述初始生成对抗网络中的每个判别器网络的梯度信息;采用差分隐私噪声分别扰动所述初始生成对抗网络中的每个判别器网络的梯度信息;根据扰动后的梯度信息更新所述初始生成对抗网络中的每个判别器网络的参数,得到下一轮迭代中的判别器网络;根据更新参数后的判别器网络对所述初始生成对抗网络中的生成器网络进行更新,得到更新后的生成器网络作为下一轮迭代中的生成器网络,直至迭代结束得到所述训练好的生成对抗网络。4.根据权利要求3所述的方法,其特征在于,迭代训练所述初始生成对抗网络中的生成器网络和每一个所述初始生成对抗网络中的判别器网络,以得到所述训练好的生成对抗网络,还包括:预先设置迭代轮数阈值,当迭代轮数达到所述迭代轮数阈值时,停止迭代训练,输出这一轮迭代训练出的生成对抗网络作为所述...

【专利技术属性】
技术研发人员:苏森程祥王振亚梁锦涛杨皓程
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1