用户数据发布方法及装置制造方法及图纸

技术编号:42904411 阅读:26 留言:0更新日期:2024-09-30 15:20
本申请公开了一种用户数据发布方法及装置,用户数据发布方法包括:获取用户数据;对用户数据进行采样处理,得到样本数据;通过特征提取器对样本数据进行特征提取,得到特征向量;对特征向量进行裁剪,以得到裁剪向量,裁剪用于限制特征向量的二范数的最大值;对裁剪向量进行混合,得到混合向量;在混合向量中添加高斯噪声,以得到发布数据。通过特征提取器提取样本数据中的特征,然后对特征提取后的特征向量进行裁剪混合,在特征空间的混合可以减少混合对数据效用的影响,极大地提升发布数据的效用。

【技术实现步骤摘要】

本申请涉及计算机,特别涉及一种用户数据发布方法及装置


技术介绍

1、信息技术的高速发展使得各类数据的发布、采集、存储和分析变得方便快捷。例如,账户密码,隐私图片,职业收入等;如果数据拥有者直接发布隐含的敏感信息而不采用合适的数据保护技术,将可能造成个人的隐私泄露。越来越多的机构采用差分隐私(differential privacy,dp)来保证数据的隐私信息。差分隐私提供了一个数据操作对隐私泄露多少或保护强弱的数学定义。差分隐私提供一个量化指标用来衡量隐私保护程度:隐私预算ε。ε越小,差分隐私提供的保护越强,隐私泄露越少。

2、然而,现有的数据发布算法存在以下问题:经过隐私化处理的数据与真实数据差距较大,使得隐私化处理的数据的数据效用较低,例如若将隐私化处理的数据作为机器学习的样本,则导致满足dp的训练算法的优化效果差,进而导致训练好的生成模型质量较差。


技术实现思路

1、本申请实施例提供一种用户数据发布方法及装置,通过特征提取器提取样本数据中的特征,然后对特征提取后的特征向量进行裁剪混合,在特本文档来自技高网...

【技术保护点】

1.一种用户数据发布方法,其特征在于,包括:

2.如权利要求1所述用户数据发布方法,其特征在于,所述对所述用户数据进行采样处理,得到样本数据包括:

3.如权利要求1或2所述用户数据发布方法,其特征在于,所述用户数据发布方法包括:

4.如权利要求1至3任一项所述用户数据发布方法,其特征在于,所述对所述特征向量进行裁剪,以得到裁剪向量包括:

5.如权利要求1至4任一项所述用户数据发布方法,其特征在于,所述对所述裁剪向量进行混合,得到混合向量包括:

6.如权利要求1至5任一项所述用户数据发布方法,其特征在于,所述用户数据发布方法还包括...

【技术特征摘要】

1.一种用户数据发布方法,其特征在于,包括:

2.如权利要求1所述用户数据发布方法,其特征在于,所述对所述用户数据进行采样处理,得到样本数据包括:

3.如权利要求1或2所述用户数据发布方法,其特征在于,所述用户数据发布方法包括:

4.如权利要求1至3任一项所述用户数据发布方法,其特征在于,所述对所述特征向量进行裁剪,以得到裁剪向量包括:

5.如权利要求1至4任一项所述用户数据发布方法,其特征在于,所述对所述裁剪向量进行混合,得到混合向量包括:

6.如权利要求1至5任一项所述用户数据发布方法,其特征在于,所述用户数据发布方法还包括:

7.如权利要求1至6任一项所述用户数据发布方法,其特征在于,所述用户数据包括原始数据和标签...

【专利技术属性】
技术研发人员:李冬皓王森张弓
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1