一种基于差分隐私保护的数据共享方法及装置制造方法及图纸

技术编号:27976104 阅读:24 留言:0更新日期:2021-04-06 14:10
本发明专利技术提供一种基于差分隐私保护的数据共享方法及装置,所述方法包括:将包括敏感数据的原始数据集划分为N个子数据集;采取差分隐私保护算法,为各个子数据集提供差分隐私保护;提供多个数据查询接口,供外部系统使用差分隐私保护数据,更新隐私预算值。根据本发明专利技术的方案,为含有敏感数据的原始数据集提供差分隐私保护,从而使数据需求单位可以安全地使用这些数据,满足其业务需求。

【技术实现步骤摘要】
一种基于差分隐私保护的数据共享方法及装置
本专利技术涉及数据处理领域,尤其涉及一种基于差分隐私保护的数据共享方法及装置。
技术介绍
2015年国务院印发了《促进大数据发展行动纲要》,数据这个概念开始得到大家广泛认知并且重视。从2015年国内第一个贵阳大数据交易所挂牌以来,官方数据交易中心已经成立了数十个,商业的数据交易平台更加数不胜数。我国作为数据大国,无论数据量,还是市场规模都保持多年的显著增长。国内目前数据市场的规模已经超过8000亿元,超过2014年的十余倍。2020年3月,中共中央国务院发布的《关于构建更加完善的要素市场化配置体制机制的意见》中,首次提出将数据与土地、劳动力、资本和技术并称为五大要素。由此可以看出,数据作为新型生产力的重要因素,将成为继石油、电力之后,成为以信息技术为基础的第四次工业革命的重要驱动力,这一概念已经得到国家的认可并会得到积极的推进。但是另一方面,数据不同于其他四个生产力要素的一个显著特点是其具有较大的安全性问题。特别是包含大量敏感数据的某些行业中,这些数据敏感、数据价值高,例如能够提高银行信本文档来自技高网...

【技术保护点】
1.一种基于差分隐私保护的数据共享方法,其特征在于,包括以下步骤:/n步骤S201:将包括敏感数据的原始数据集划分为N个子数据集;/n步骤S202:采取差分隐私保护算法,为各个子数据集提供差分隐私保护;/n步骤S203:提供多个数据查询接口,供外部系统使用差分隐私保护数据,更新隐私预算值。/n

【技术特征摘要】
1.一种基于差分隐私保护的数据共享方法,其特征在于,包括以下步骤:
步骤S201:将包括敏感数据的原始数据集划分为N个子数据集;
步骤S202:采取差分隐私保护算法,为各个子数据集提供差分隐私保护;
步骤S203:提供多个数据查询接口,供外部系统使用差分隐私保护数据,更新隐私预算值。


2.如权利要求1所述的基于差分隐私保护的数据共享方法,其特征在于,所述差分隐私保护算法包括添加噪声算法和隐私预算算法。


3.如权利要求2所述的基于差分隐私保护的数据共享方法,其特征在于,所述添加噪声算法为随机噪声算法,采集Laplace机制向查询结果中加入服从Laplace分布的随机噪声;设记位参数为0,需要保护的数值的x,尺度参数a的Laplace分布为Lap(a),其概率密度函数为:



设D为脱敏子数据集,F(D)为脱敏子数据集D的查询结果;
设D’为D的邻近脱敏子数据集,F(D’)为邻近脱敏子数据集D’的查询结果;
有M(F(D))=M(F(D’)),则隐私保护算法M为D提供差分隐私保护。
其中,M(F(D))=F(D)+p(x),M(F(D’))=F(D’)+p(x)。


4.如权利要求2所述的基于差分隐私保护的数据共享方法,其特征在于,所述隐私预算算法,查询分为高预算查询和低预算查询两类。


5.一种基于差分隐私保护的数据共享装置,其特征在于,所述装置包括:
划分模块:配置为将包括敏感数据的原始数据集划分为N个子数据集;
隐私保护模块:配置为采取差分隐私保护算法,为各个子数据集提供差分隐私保护;
查询模...

【专利技术属性】
技术研发人员:孙亚东王志海喻波何晋昊魏力
申请(专利权)人:北京明朝万达科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1