【技术实现步骤摘要】
一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法
本专利技术涉及数据隐私发布
,具体来说是一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法。
技术介绍
近年来,移动社交网络、车联网等许多实际热门应用产生了大量二维空间数据,使得二维空间数据及其统计数据的采集和使用越来越便捷。随着信息技术的发展,需要将大量的用户数据进行发布,为数据挖掘、分析处理等工作提供支持,然而这些数据的直接发布会给个人隐私造成威胁,用户的隐私保护问题亟需得到保护。针对这一问题,传统基于K匿名的隐私保护技术需要对攻击者的能力和背景知识进行假设估计,在实际应用中存在一定局限性。目前,差分隐私技术作为一种新出现的隐私保护框架,通过对发布数据进行随机扰动,能够为防止攻击者在任意背景知识下的攻击提供有力保护,在数据安全发布领域得到了广泛应用。然而二维空间大数据尤为庞大,实际生活中的大数据随着区域不同,其分布变化多样,与差分隐私模型相结合后长范围查询误差累积问题严重,所带来的噪音误差造成了数据的可用性降低,因此,在二维空间数据发布时如何平衡数据的隐私安全和数据的可用性,是当前隐私保护技术的一个主要目的。对于二维空间统计数据的发布,通常需要将数据集进行划分,其中常用的有基于网格结构和树结构的划分方法。在网格划分方法中,均匀网格划分算法(见文献QardajiW,YangW,LiN.DifferentiallyPrivateGridsforGeospatialData[C]//2013IEEE29thInternat ...
【技术保护点】
1.一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法,其特征在于,包括以下步骤:/n11)二维空间数据的获取,获取待进行隐私发布的二维空间数据;/n12)网格区域的划分:对二维空间数据进行聚类,将二维空间数据根据密度聚类形成自适应网格,将数据空间划分为不同密度的区域;/n13)自适应网格区域的划分处理:对自适应网格区域中数据分布最为稀疏的区域计数根据隐私预算直接添加噪音;对剩余密度区域作为密集区域采用四叉树分割数据空间,将粗粒度区域进一步划分为均匀细粒度区块,以降低区域内的均匀假设误差;/n14)对四叉树进行后置处理:对于纵向结构,采用重构算法自底向上改进四叉树,有效减小均匀假设误差;对于横向结构,结合抽样排序和贪心算法,将四叉树划分结果分层合并,有效减小长范围区间查询的误差累计;/n15)二维空间数据差分隐私的发布:对密集区域添加噪音分配隐私预算:将四叉树与个性化分配隐私预算相结合,根据需求个性化调整相邻两层分配的隐私预算;对四叉树分层添加噪音后融合已添加噪声的稀疏区域后对外发布数据。/n
【技术特征摘要】
1.一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法,其特征在于,包括以下步骤:
11)二维空间数据的获取,获取待进行隐私发布的二维空间数据;
12)网格区域的划分:对二维空间数据进行聚类,将二维空间数据根据密度聚类形成自适应网格,将数据空间划分为不同密度的区域;
13)自适应网格区域的划分处理:对自适应网格区域中数据分布最为稀疏的区域计数根据隐私预算直接添加噪音;对剩余密度区域作为密集区域采用四叉树分割数据空间,将粗粒度区域进一步划分为均匀细粒度区块,以降低区域内的均匀假设误差;
14)对四叉树进行后置处理:对于纵向结构,采用重构算法自底向上改进四叉树,有效减小均匀假设误差;对于横向结构,结合抽样排序和贪心算法,将四叉树划分结果分层合并,有效减小长范围区间查询的误差累计;
15)二维空间数据差分隐私的发布:对密集区域添加噪音分配隐私预算:将四叉树与个性化分配隐私预算相结合,根据需求个性化调整相邻两层分配的隐私预算;对四叉树分层添加噪音后融合已添加噪声的稀疏区域后对外发布数据。
2.根据权利要求1所述的一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法的二维空间数据差分隐私发布方法,其特征在于,所述网格区域的划分包括以下步骤:
21)根据待发布的二维数据集合L,创建两个集合:一个只包含所有横坐标位置记为Lx,另一个只包含所有纵坐标位置记为LY;
22)定义横坐标和纵坐标的区间长度Δx和Δy,分别根据Lx、LY计算区间的密度,对区间进行密度判定,密度相似的临近区间进行聚类,形成横坐标和纵坐标的稠密区间和稀疏区间;
23)根据区间划分结果,对二维数据集合L进行密度自适应网格划分,得到粗粒度区块,得到不同密度的区域。
3.根据权利要求1所述的一种基于四叉树自适应划分技术的二维空间数据差分隐私发布方法的二维空间数据差分隐私发布方法,其特征在于,所述自适应网格区域划分处理包括以下步骤:
31)对于位于稀疏区域的第一层区块,不再划分,直接对其原始计数结果添加隐私预算为ε的Laplace噪声;
32)...
【专利技术属性】
技术研发人员:金媛媛,刘胜军,谢飞,倪志伟,卜凡耀,陈千,朱旭辉,周芳,倪丽萍,
申请(专利权)人:合肥城市云数据中心股份有限公司,合肥工业大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。