一种基于属性相关的差分隐私保护方法技术

技术编号：19389054 阅读：35 留言：0更新日期：2018-11-10 02:05

本发明专利技术公开了一种基于属性相关的差分隐私保护方法，属于信息安全技术领域。本发明专利技术采取投影转换的思想，提出了新的面向属性相关的隐私保护方法。该方法不仅考虑了属性之间存在相关性的情况，而且利用这种相关关系减少噪声的加入。即利用最大信息系数衡量各敏感属性相关关系，构建最大信息系数矩阵；从而构造投影算子，获得投影矩阵，该结构的使用使得维度降低，在提供相同的隐私保证的情况下，所需噪声数减少。

A differential privacy protection method based on attribute correlation

The invention discloses a differential privacy protection method based on attribute correlation, which belongs to the field of information security technology. With the idea of projection transformation, the invention proposes a new privacy protection method for attribute related. This method not only considers the correlation between attributes, but also uses this correlation to reduce the noise. The maximum information coefficient is used to measure the correlation of sensitive attributes, and the maximum information coefficient matrix is constructed. The projection operator is constructed to obtain the projection matrix. The use of this structure reduces the dimension and reduces the number of noises required under the same privacy guarantee.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于属性相关的差分隐私保护方法
本专利技术属于信息安全
，具体涉及一种基于属性相关的差分隐私保护方法。
技术介绍
差分隐私保护数据发布根据实现环境不同可分为两种，即交互式数据发布和非交互式数据发布。在交互式环境下，用户向数据管理者提出查询请求，数据管理者根据查询请求对数据集进行操作并将结果进行必要的干扰后反馈给用户，用户不能看到数据集全貌，从而保护数据集中的个体隐私。在非交互式环境下，数据管理者针对所有可能的查询，在满足差分隐私的条件下一次性发布所有查询的结果。或者，数据管理者发布一个原始数据集的“净化”版本，这是一个不精确的数据集，用户可对该版本的数据集自行进行所需的查询操作。
技术实现思路
本专利技术的目的是为了解决现有隐私保护方法存在发布数据的可用性差，信息的隐匿率过高的问题，提出的一种基于属性相关的差分隐私保护方法。本专利技术的目的是这样实现的：一种基于属性相关的差分隐私保护方法，其特征在于，包含以下步骤：步骤一设输入样本X＝[X1,X2,…XN]，N为样本个数，每一个样本Xl＝[xl1,xl2,…,xln]T∈Rn，对输入数据X进行标准化：得到标准化矩阵计算矩阵Z的最大信息系数矩阵Ci,j＝MIC(zi,zj)；其特征在于：给定有序对数据集D＝{(xi，yi)，i＝1，2，...，n}，将X轴分成数量为x的格子，将Y轴分成了数量为y的格子，从而得出x×y格式的网格划分，并且用G表示，把位于D点同时进入了G中的网格而存在的比例判定为它的概率分配D|G；所有的数据集D，当其具有一定的固定性时，每一个网格划分都有它自己的概率分布特征D|G；最大信...

【技术保护点】
1.一种基于属性相关的差分隐私保护方法，其特征在于，包含以下步骤：步骤一设输入样本X＝[X1,X2,…XN]，N为样本个数，每一个样本Xl＝[xl1,xl2,…,xln]T∈Rn，对输入数据X进行标准化：得到标准化矩阵计算矩阵Z的最大信息系数矩阵Ci,j＝MIC(zi,zj)；其特征在于：给定有序对数据集D＝{(xi，yi)，i＝1，2，...，n}，将X轴分成数量为x的格子，将Y轴分成了数量为y的格子，从而得出x×y格式的网格划分，并且用G表示，把位于D点同时进入了G中的网格而存在的比例判定为它的概率分配D|G；所有的数据集D，当其具有一定的固定性时，每一个网格划分都有它自己的概率分布特征D|G；最大信息系数MIC定义为：

【技术特征摘要】
1.一种基于属性相关的差分隐私保护方法，其特征在于，包含以下步骤：步骤一设输入样本X＝[X1,X2,…XN]，N为样本个数，每一个样本Xl＝[xl1,xl2,…,xln]T∈Rn，对输入数据X进行标准化：得到标准化矩阵计算矩阵Z的最大信息系数矩阵Ci,j＝MIC(zi,zj)；其特征在于：给定有序对数据集D＝{(xi，yi)，i＝1，2，...，n}，将X轴分成数量为x的格子，将Y轴分成了数量为y的格子，从而得出x×y格式的网格划分，并且用G表示，把位于D点同时进入了G中的网格而存在的比例判定为它的概率分配D|G；所有的数据集D，当其具有一定的固定性时，每一个网格划分都有它自己的概率分布特征D|G；最大信息系数MIC定义为：步骤...

【专利技术属性】
技术研发人员：董宇欣，陈福坤，褚慈，谢晓东，印桂生，韩启龙，王红滨，万丽，秦帅，白云鹏，
申请(专利权)人：哈尔滨工程大学，
类型：发明
国别省市：黑龙江,23

全部详细技术资料下载我是这个专利的主人