一种差分隐私空间分解方法和系统技术方案

技术编号：20160928 阅读：48 留言：0更新日期：2019-01-19 00:13

本发明专利技术公开了一种差分隐私空间分解方法，包括：获取d维点数据集，根据该d维点数据集生成用于构建β树的完整域Ω、以及该完整域Ω中的点计数cnt，并从包括拉普拉斯噪声的文件中读取所有拉普拉斯噪声数据，利用得到的完整域Ω、以及该完整域Ω中的点计数cnt创建d维点数据集的β树，在创建好的β树的每个叶子节点的点计数中增加拉普拉斯噪声数据中的任意一个乘以噪声系数后得到的乘积，其中对于不同的叶子节点而言，选择使用不同的拉普拉斯噪声数据。本发明专利技术能够解决现有基于普拉斯分布的差分隐私空间分解方法存在的中间节点的隐私容易暴露、区域分解不精确导致噪声代价高、以及难以准确确定空间分解隐私树的深度的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种差分隐私空间分解方法和系统
本专利技术属于隐私保护
，更具体地，涉及一种差分隐私空间分解方法和系统。
技术介绍
差分隐私作为一种新出现的隐私保护框架，其通过向查询或者分析结果中添加适当噪音，从而达到隐私保护的效果。在差分隐私保护过程中，基于安全考量，需要将整个域递归地分解成子域，以生成分层的隐私树，并向隐私树中的每个节点的点计数添加拉普拉斯噪声，这一过程被称为差分隐私空间分解。然而，现有基于拉普拉斯分布的差分隐私空间分解方法存在一些不可忽略的技术问题：第一，由于拉普拉斯分布对于原点是对称的，在空间分解隐私树中，每一个中间节点的点个数等于其所有子节点的点个数之和，因此当所有子节点的拉普拉斯噪声之和被抵消时，会导致中间节点的隐私被暴露；第二，现有的方法在空间分解隐私树的所有节点上都增加了噪声，从根节点到叶子节点的噪声会使得区域分解不精确，同时也导致了更高的噪声代价；第三，现有方法难以准确确定空间分解隐私树的深度，空间分解隐私树的深度过大会导致添加到隐私树的噪声增加，深度过小则会导致分解的子域数量过小，进而造成查询或者分析结果会不准确。
技术实现思路
针对现有技术的以上缺陷或改进需求，本专利技术提供了一种差分隐私空间分解方法和系统，其目的在于，解决现有基于拉普拉斯分布的差分隐私空间分解方法存在的中间节点的隐私容易暴露、区域分解不精确导致噪声代价高、以及难以准确确定空间分解隐私树的深度的技术问题。为实现上述目的，按照本专利技术的一个方面，提供了一种差分隐私空间分解方法，包括以下步骤：(1)获取d维点数据集，根据该d维点数据集生成用于构建β树的完整域Ω、以及该...

【技术保护点】
1.一种差分隐私空间分解方法，其特征在于，包括以下步骤：(1)获取d维点数据集，根据该d维点数据集生成用于构建β树的完整域、以及该完整域中的点计数，并从包括拉普拉斯噪声的文件中读取所有拉普拉斯噪声数据；其中d是大于或等于2的自然数；(2)利用步骤(1)中得到的完整域、以及该完整域中的点计数创建d维点数据集的β树；(3)在创建好的β树的每个叶子节点的点计数中增加拉普拉斯噪声数据中的任意一个乘以噪声系数后得到的乘积，其中对于不同的叶子节点而言，选择使用不同的拉普拉斯噪声数据。

【技术特征摘要】
1.一种差分隐私空间分解方法，其特征在于，包括以下步骤：(1)获取d维点数据集，根据该d维点数据集生成用于构建β树的完整域、以及该完整域中的点计数，并从包括拉普拉斯噪声的文件中读取所有拉普拉斯噪声数据；其中d是大于或等于2的自然数；(2)利用步骤(1)中得到的完整域、以及该完整域中的点计数创建d维点数据集的β树；(3)在创建好的β树的每个叶子节点的点计数中增加拉普拉斯噪声数据中的任意一个乘以噪声系数后得到的乘积，其中对于不同的叶子节点而言，选择使用不同的拉普拉斯噪声数据。2.根据权利要求1所述的差分隐私空间分解方法，其特征在于，步骤(1)具体包括以下子步骤：(1-1)从预设区域中确定多个地理坐标的极值点；(1-2)获取d维点数据集，并从d维点数据集中选择地理坐标位于步骤(1-1)所选择的多个极值点构成的区域以内的d维点，构成新的数据集D，选择的d维点的总数即为点计数；(1-3)根据构成的新的数据集D中地理坐标的极值构建完整域。3.根据权利要求1所述的差分隐私空间分解方法，其特征在于，步骤(1)具体包括以下子步骤：(1-1)从预设区域中确定多个地理坐标的极值点。(1-2)根据多个地理坐标的极值点构建完整域。4.根据权利要求1至3中任意一项所述的差分隐私空间分解方法，其特征在于，步骤(2)具体包括以下子步骤：(2-1)创建根节点，将该根节点的域的范围设置为完整域的范围，并将根节点标记为已被访问；(2-2)根据创建的根节点创建n个子节点，并将所有n个子节点标记为未被访问，其中n表示β树的扇出数，其为大于或等于2的自然数；(2-3)将该根节点的域平均分配给n个子节点，对每个子节点而言，如果其所分配到的域的大小大于域阈值θ，并且数据集D中落入该子节点的域中的d维点的数量大于点计数阈值，则根据该子节点继续创建其下层的n个子节点，然后对于其下层的n个子节点中的每一个继续上述判断和创建其下层子节点的过程，如果该子节点不满足其所分配到的域的大小大于域阈值θ，或者数据集D中落入该子节点的域中的d维点的数量大于点计数阈值，则将该子节点标记为已被访问，最终生成β树。5.根据权利要求1至4中任意...

【专利技术属性】
技术研发人员：周可，李春花，李晓翠，汪洋涛，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人