【技术实现步骤摘要】
基于非均匀四叉树的位置大数据差分隐私划分发布方法
本专利技术属于大数据应用领域和隐私保护领域,具体涉及一种基于非均匀四叉树结构的位置大数据差分隐私划分发布方法,可用于大数据发布系统、智能交通系统、车联网、LBS系统、位置广告推送等众多应用领域的集中式位置大数据发布及隐私保护。
技术介绍
作为互联网的“天然入口”,位置大数据被广泛应用于移动互联网、车联网、智能交通系统、基于位置的服务系统、社交网络等大数据热门领域。用户的位置信息经过集中式大数据发布平台的汇聚、融合、分析和加工,按照不同的需求和模式提供给各行业的科学研究、决策支持和大众服务。但是,位置信息具有很强的隐私性,恶意攻击者可能借助大数据分析软件对用户的位置信息进行收集、推理、分析、挖掘,不但可以获知用户曾经访问过哪些地点,还可以推测用户当前的具体位置,甚至可以较准确的预测用户将来的行动轨迹,导致生活习惯、健康状况、兴趣爱好、经济条件等个人隐私信息泄露,严重时甚至危害财产和生命安全。因此,解决位置信息使用过程中的隐私保护问题,已经成为制约位置大数据应用发展最为迫切的任务 ...
【技术保护点】
1.基于非均匀四叉树的位置大数据差分隐私划分发布方法,其特征在于,其步骤为:/n(1)根据待发布位置大数据集合确定划分结构与划分深度:设定划分停止的条件为:当前区域内不包含位置点信息,或者当前区域范围小于划分尺寸的下限,或者当前区域内位置点分布状态满足设定的均匀条件;如果待发布位置大数据集合不满足上述停止条件,则将其分解为只包含经度坐标和只包含纬度坐标的两个集合,分别从经度方向和纬度方向将整个位置大数据集覆盖的空间范围平均分割为m个子区域,并计算经度和纬度方向的概率分布密度。选择概率分布密度大于设定阈值的第一个经度值和纬度值作为划分点,将当前区域分割为四个大小不等的子区域; ...
【技术特征摘要】
1.基于非均匀四叉树的位置大数据差分隐私划分发布方法,其特征在于,其步骤为:
(1)根据待发布位置大数据集合确定划分结构与划分深度:设定划分停止的条件为:当前区域内不包含位置点信息,或者当前区域范围小于划分尺寸的下限,或者当前区域内位置点分布状态满足设定的均匀条件;如果待发布位置大数据集合不满足上述停止条件,则将其分解为只包含经度坐标和只包含纬度坐标的两个集合,分别从经度方向和纬度方向将整个位置大数据集覆盖的空间范围平均分割为m个子区域,并计算经度和纬度方向的概率分布密度。选择概率分布密度大于设定阈值的第一个经度值和纬度值作为划分点,将当前区域分割为四个大小不等的子区域;按照深度优先原则遍历四个子区域,并迭代上述划分过程直到满足划分停止条件;
(2)为各划分区域分配差分隐私预算:按照“先纵向几何分配,再横向比例调整”的原则,首先根据步骤(1)得到的划分深度计算各层应当分配的几何隐私预算值;然后在非均匀四叉树划分结构的每一层中,根据同一棵子树内四个节点的密度比例进行隐私预算的局部调整;
(3)根据差分隐私模型生成位置大数据统计发布信息。首先根据步骤(1)得到的非均匀四叉树划分结构统计各子区域范围内的位置点数量;然后根据步骤(2)得到的各区域差分隐私预算计算对应区域应当添加的Laplace噪声值;最后将所有划分区域的原始统计值与差分隐私噪声相加,得到最终的位置大数据统计发布信息。
2.根据权利要求1所述的基于非均匀四叉树的位置大数据差分隐私划分发布方法,其特征在于,步骤(1)确定划分结构与划分深度时,划分算法实现的具体步骤包括:
(1)设定划分停止的最小区域范围为MinSize=0.0005(对应大约50×50m的矩形区域);
(2)设定划分停止的区域均匀条件为SDR≤3,并根据下式计算区域的标准偏差半径(StandardDeviationRadius,SDR):
其中xi和yi是区域内某个位置点的经纬度坐标;和代表该区域所有位置点的经度和纬度平均值;
(3)将待发布位置大数据集合覆盖的空间区域设置为当前节点,如果当前节点不满足上述停止条件,则将其分解为一个只包...
【专利技术属性】
技术研发人员:晏燕,高鑫,王冰倩,丛一鸣,
申请(专利权)人:兰州理工大学,
类型:发明
国别省市:甘肃;62
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。