一种基于生成对抗网络的隐私保护数据生成方法技术

技术编号：37239118 阅读：10 留言：0更新日期：2023-04-20 23:20

本发明专利技术公开了一种基于生成对抗网络的隐私保护数据生成方法，涉及数据生成领域，包括如下步骤：构建前置自编码器；构建生成对抗网络模型；将自编码器应用于生成对抗网络模型的数据生成。该方法使用预训练的自编码器将给定数据集映射到低维连续空间，通过低维空间中的生成器和原始数据空间中的鉴别器进行对抗学习从而获得具有模拟真实数据的生成模型。该方法可以有效解决在隐私保护政策下，在获取训练数据时经常收到限制而导致训练数据集匮乏问题。题。题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于生成对抗网络的隐私保护数据生成方法

[0001]本专利技术涉及数据生成领域，具体是一种基于生成对抗网络的隐私保护数据生成方法。

技术介绍

[0002]随着大数据技术的发展和进步，大数据对经济发展、社会治理和人民生活产生了巨大影响，给人们带来精确、便捷服务端同时，也潜在着泄露用户隐私信息的风险。为了降低隐私泄露造成的负面影响，有关部门不断通过完善隐私保护法律法规对企业及个人进行监管，以此减少或限制数据的共享和开放。
[0003]在这样的背景下，大数据分析时常常会遇到数据匮乏、训练样本过少等问题。为了解决该问题，基于深度学习的数据生成方法应运而生。深度生成模型是一种高度灵活和可表达的无监督学习方法，能够捕捉复杂高维数据的潜在结构。训练好的深度生成模型可以有效模拟高维数据复杂分布，生成与原始数据相似的合成数据。
[0004]传统的隐私保护数据生成方法采用对用户隐私信息进行移除或匿名化的方式以达到隐私保护的效果，该方法存在着明显的弊端：可通过匿名数据集与其他公开的数据集结合起来，重新识别到用户的隐私保护数据，且该方法随着更多信息被匿名化，会导致数据集的效用降低。
[0005]为此，如何在安全、高效用性的前提下，设计一种用于隐私保护数据生成的方法是目前数据生成领域亟需解决的问题。

技术实现思路

[0006]本专利技术的目的在于提供一种基于生成对抗网络的隐私保护数据生成方法，以解决数据生成领域隐私保护数据样本少、数据效用性低的问题。
[0007]本专利技术的创新之处在于：提...

【技术保护点】

【技术特征摘要】
1.一种基于生成对抗网络的隐私保护数据生成方法，其特征在于，所述的基于生成对抗网络的隐私保护数据生成方法，包括：步骤1、构建前置自编码器；步骤2、构建生成对抗网络模型；步骤3、将自编码器应用于生成对抗网络模型的数据生成。2.根据权利要求1所述的一种基于生成对抗网络的隐私保护数据生成方法，其特征在于，所述构建前置自编码器的过程具体为：对自编码器的解码输出层进行修改，将混合层的数据进行切割输出，在其后放置N+1个并行的属性输出层。3.根据权利要求2所述的一种基于生成对抗网络的隐私保护数据生成方法，其特征在于，构建前置自编码器过程中，自编码器的编码器网络由两层全连接网络NN构成，解码器网络从编码空间获得输入，通过两层全连接网络NN后进入N...

【专利技术属性】
技术研发人员：张越，何兴国，赖春媚，
申请(专利权)人：广州图灵科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人