The invention discloses a differential privacy protection method based on attribute correlation, which belongs to the field of information security technology. With the idea of projection transformation, the invention proposes a new privacy protection method for attribute related. This method not only considers the correlation between attributes, but also uses this correlation to reduce the noise. The maximum information coefficient is used to measure the correlation of sensitive attributes, and the maximum information coefficient matrix is constructed. The projection operator is constructed to obtain the projection matrix. The use of this structure reduces the dimension and reduces the number of noises required under the same privacy guarantee.
【技术实现步骤摘要】
一种基于属性相关的差分隐私保护方法
本专利技术属于信息安全
,具体涉及一种基于属性相关的差分隐私保护方法。
技术介绍
差分隐私保护数据发布根据实现环境不同可分为两种,即交互式数据发布和非交互式数据发布。在交互式环境下,用户向数据管理者提出查询请求,数据管理者根据查询请求对数据集进行操作并将结果进行必要的干扰后反馈给用户,用户不能看到数据集全貌,从而保护数据集中的个体隐私。在非交互式环境下,数据管理者针对所有可能的查询,在满足差分隐私的条件下一次性发布所有查询的结果。或者,数据管理者发布一个原始数据集的“净化”版本,这是一个不精确的数据集,用户可对该版本的数据集自行进行所需的查询操作。
技术实现思路
本专利技术的目的是为了解决现有隐私保护方法存在发布数据的可用性差,信息的隐匿率过高的问题,提出的一种基于属性相关的差分隐私保护方法。本专利技术的目的是这样实现的:一种基于属性相关的差分隐私保护方法,其特征在于,包含以下步骤:步骤一设输入样本X=[X1,X2,…XN],N为样本个数,每一个样本Xl=[xl1,xl2,…,xln]T∈Rn,对输入数据X进行标准化:得到标准化矩阵计算矩阵Z的最大信息系数矩阵Ci,j=MIC(zi,zj);其特征在于:给定有序对数据集D={(xi,yi),i=1,2,...,n},将X轴分成数量为x的格子,将Y轴分成了数量为y的格子,从而得出x×y格式的网格划分,并且用G表示,把位于D点同时进入了G中的网格而存在的比例判定为它的概率分配D|G;所有的数据集D,当其具有一定的固定性时,每一个网格划分都有它自己的概率分布特征D|G;最大信 ...
【技术保护点】
1.一种基于属性相关的差分隐私保护方法,其特征在于,包含以下步骤:步骤一 设输入样本X=[X1,X2,…XN],N为样本个数,每一个样本Xl=[xl1,xl2,…,xln]T∈Rn,对输入数据X进行标准化:得到标准化矩阵计算矩阵Z的最大信息系数矩阵Ci,j=MIC(zi,zj);其特征在于:给定有序对数据集D={(xi,yi),i=1,2,...,n},将X轴分成数量为x的格子,将Y轴分成了数量为y的格子,从而得出x×y格式的网格划分,并且用G表示,把位于D点同时进入了G中的网格而存在的比例判定为它的概率分配D|G;所有的数据集D,当其具有一定的固定性时,每一个网格划分都有它自己的概率分布特征D|G;最大信息系数MIC定义为:
【技术特征摘要】
1.一种基于属性相关的差分隐私保护方法,其特征在于,包含以下步骤:步骤一设输入样本X=[X1,X2,…XN],N为样本个数,每一个样本Xl=[xl1,xl2,…,xln]T∈Rn,对输入数据X进行标准化:得到标准化矩阵计算矩阵Z的最大信息系数矩阵Ci,j=MIC(zi,zj);其特征在于:给定有序对数据集D={(xi,yi),i=1,2,...,n},将X轴分成数量为x的格子,将Y轴分成了数量为y的格子,从而得出x×y格式的网格划分,并且用G表示,把位于D点同时进入了G中的网格而存在的比例判定为它的概率分配D|G;所有的数据集D,当其具有一定的固定性时,每一个网格划分都有它自己的概率分布特征D|G;最大信息系数MIC定义为:步骤...
【专利技术属性】
技术研发人员:董宇欣,陈福坤,褚慈,谢晓东,印桂生,韩启龙,王红滨,万丽,秦帅,白云鹏,
申请(专利权)人:哈尔滨工程大学,
类型:发明
国别省市:黑龙江,23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。