【技术实现步骤摘要】
一种误差约束条件下的差分隐私保护方法及系统
本专利技术属于数据挖掘领域,涉及一种误差约束条件下的差分隐私保护方法及系统。
技术介绍
对于数据驱动的应用来说,如基于位置的服务(LBS)、疾病监测和社交网络等,上传个人精确数据是数据所有者获得更好服务的必要条件。例如,在基于位置服务的应用程序中,将个人的精确位置上传到服务提供商可以获得更好的购物建议和路线规划;在疾病监测应用中,上传个人的身体状况数据可以防止某些疾病的爆发。用户上传个人数据对于知识发现和获取更好的服务有着显著的益处,但服务器汇总的数据可能包含个人的敏感信息(如个人住址、健康状况),未经处理的数据可能会泄露个人隐私,而数据所有者出于隐私考虑可能不愿意上传其真实数据值。因此,如何保护个人的隐私已经成为数据聚合和挖掘中的一个重要问题。为了解决这个问题,Dwork提出了差分隐私保护框架,通过对用户数据加入噪声扰动来保护个人隐私。差分隐私对攻击者的背景知识没有限制,是一种从数学上严格定义保护强度和数据可用性的隐私保护手段。由于差分隐私可以提供理论上完备的隐私安全性保 ...
【技术保护点】
1.一种误差约束条件下的差分隐私保护方法,其特征在于:该方法包括以下步骤,/n步骤S1,根据待保护数据的维度和设定的参数计算截断拉普拉斯噪声的概率密度函数,并生成对应维度的噪声;/n步骤S2,根据待保护数据X的维度对X进行扰动;/n步骤S3,根据待保护数据的维度利用粒子滤波对扰动结果进行优化,得到优化后的扰动结果;若待保护数据X是一维数据,执行步骤S3-1至S3-4;若待保护数据X是二维数据,则跳转至步骤S4;/n步骤S4,利用粒子滤波对扰动结果进行优化,得到优化后的扰动结果。/n
【技术特征摘要】
1.一种误差约束条件下的差分隐私保护方法,其特征在于:该方法包括以下步骤,
步骤S1,根据待保护数据的维度和设定的参数计算截断拉普拉斯噪声的概率密度函数,并生成对应维度的噪声;
步骤S2,根据待保护数据X的维度对X进行扰动;
步骤S3,根据待保护数据的维度利用粒子滤波对扰动结果进行优化,得到优化后的扰动结果;若待保护数据X是一维数据,执行步骤S3-1至S3-4;若待保护数据X是二维数据,则跳转至步骤S4;
步骤S4,利用粒子滤波对扰动结果进行优化,得到优化后的扰动结果。
2.根据权利要求1所述的一种误差约束条件下的差分隐私保护方法,其特征在于:所述步骤S1具体为:
步骤S1-1,判断待保护数据X={x1,x2,…,xn}的维度,若X是一维数据,则进入步骤S1-2;若X是二维数据,则进入步骤S1-3;
步骤S1-2,根据设定的隐私保护强度ε和误差上限α计算一维截断拉普拉斯噪声的概率密度函数f(y),f(y)由如下公式计算得到:
其中Δf是待保护数据X的敏感度函数;
步骤S1-3,根据设定的隐私保护强度ε和误差上限α计算平面截断拉普拉斯噪声的概率密度函数f(z),f(z)由如下公式计算得到:
步骤S1-4,根据S1-2和S1-3的截断拉普拉斯概率密度函数生成对应的一维和二维拉普拉斯噪声序列Y={y1,…,yi,…yn}和Z={z1,…,zi,…zn}。
3.根据权利要求1所述的一种误差约束条件下的差分隐私保护方法,其特征在于:所述步骤S2具体为:
步骤S2-1,若待保护数据X是一维数据,将步骤S1-2得到的一维截断拉普拉斯噪声加入到X中,得到扰动结果x′i:
x′i=xi+yi,i=1,2,…,n
其中,xi∈X,yi∈Y,X′={x′1,…,x′i,…,x′n};
步骤S2-2,若待保护数据X是二维数据,将步骤S1-3得到的平面截断拉普拉斯噪声加入到X中,得到扰动结果
其中,zi∈Z,
4.根据权利要求1所述的一种误差约束条件下的差分隐私保护方法,其特征在于:所述步骤S3具体为:
步骤S3-1,若待保护数据X是一维数据,计算重要概率密度函数p(xi|x′1:i),计算方式如下:
其中,x′i∈X′,函数p(·)表示概率密度函数;
步骤S3-2,从p(x1|x′1:1),p(x2|x′1:2),…,p(xi|x′1:i)中随机抽取M个样本q1(x1),q2(x2),…,qM(xM),计算M个样本对应的权重wk(xk):
步骤S3-3,将步骤S3-2得到的权重wk(xk)归一化得到更新后的权重w′k(xk):
步骤S3-4,计算扰动结果x′k经过粒子滤波后的优化值,得到优化后的发布结果X″={x″1,…,x″k,…,x″n},其中x″k的计算...
【专利技术属性】
技术研发人员:王豪,王昭琨,吴婷婷,夏英,张旭,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。