【技术实现步骤摘要】
一种位置大数据统计发布方法及系统
[0001]本专利技术涉及数据隐私保护
,特别是涉及一种位置大数据统计发布方法及系统。
技术介绍
[0002]位置大数据的统计发布可以为用户提供准确及时的交通和路况拥堵信息,帮助人们规划合理的出行时间和路线,获得高精度的LBS服务,同时有助于减少交通拥塞并减少不必要的资源浪费。但是,对位置信息的不当发布和反向分析推理容易导致用户具体位置、运动轨迹、生活习惯、健康状况、兴趣爱好、经济条件等个人隐私的泄露,甚至危害财产和生命安全。因此,解决位置大数据发布使用过程中的隐私保护问题,已经成为制约位置大数据应用发展最为迫切的任务。
[0003]位置大数据的统计划分发布方法依据特定的索引结构对二维空间进行结构划分和索引,对每一个索引区域内的用户数据量进行统计和发布,减少了对用户真实位置信息的泄露风险。通过对索引区域内真实位置点的统计值添加差分隐私噪声,还可以进一步提高发布位置统计数据的隐私保护效果。在保证用户位置隐私安全的前提下,提供精确而高效的位置统计发布数据,是位置大数据统计划分发布的终极目标。由于差分隐私噪声的添加和二维空间区域的均匀性假设问题,使得位置大数据的统计划分发布结果与真实统计值之间存在一定误差。因此,二维空间划分结构的合理性是直接关系到位置大数据统计划分发布数据可用性的关键因素。
[0004]现有的二维空间统计划分发布方法,主要存在以下的缺点:1)自顶向下分割二维空间时难以确定划分停止的条件,导致划分层次过细时引入较多的噪声误差,划分层次不足时降低了范围计
【技术保护点】
【技术特征摘要】
1.一种位置大数据统计发布方法,其特征在于,包括:将采集的历史位置大数据按照设定的时间单元划分为多个第一集合;将各所述第一集合按照发布时间间隔划分为多个第二集合;获取各所述第二集合中位置大数据的二维空间区域;将各所述二维空间区域划分为多个大小相同的网格,并确定各所述网格的密度;各所述网格的密度为各所述网格中位置点的数量;通过循环对所述二维空间区域进行网格区域划分,每次循环按照滑动长度依次选定网格区域,每个网格区域包括按照滑动长度每次滑动形成的滑动窗内的所有网格,并根据设定的网格区域合并条件对选定网格区域内的网格是否合并进行记录;滑动长度随着循环次数的增加而增大;根据所述二维空间区域中各网格的是否合并的记录生成所述二维空间区域对应的划分结构矩阵;将所有所述第一集合中相同发布时间的各所述第二集合生成的划分结构矩阵构成三维时空序列;以各所述三维时空序列作为输入,与各所述三维时空序列对应的预测发布时间对应的划分结构矩阵作为输出训练深度学习模型,将训练好的深度学习模型作为划分结构预测模型;获得待预测发布时间之前的历史位置大数据对应的多个三维时空序列;按照发布时间的先后顺序将待预测发布时间之前的历史位置大数据对应的多个三维时空序列输入所述划分结构预测模型,输出对应发布时刻的预测划分结构矩阵;根据所述预测划分结构矩阵对所述预测划分结构中各子区域分配差分隐私预算,并将所述预测划分结构矩阵中各子区域的原始密度值与所述子区域分配的差分隐私预算产生的Laplace噪声相加,得到各子区域的加噪发布统计值;按照发布时间顺序,发布各预测划分结构矩阵对应的加噪发布统计值。2.根据权利要求1所述的位置大数据统计发布方法,其特征在于,所述通过循环对所述二维空间区域进行网格区域划分,每次循环按照滑动长度依次选定网格区域,每个网格区域包括按照滑动长度每次滑动形成的滑动窗内的所有网格,并根据设定的网格区域合并条件对选定网格区域内的网格是否合并进行记录;滑动长度随着循环次数的增加而增大,具体包括:根据二维空间区域构建N
×
N的初始矩阵;所述二维空间区域包括N
×
N个网格,所述初始矩阵中每个元素与二维空间区域中网格一一对应,所述初始矩阵中每个元素的初始值为h,N=2
h
;每次循环时,按照滑动长度依次选定所述二维空间区域内相应数量的网格区域;判断选定的网格区域是否满足所述设定的网格区域合并条件;若选定的网格满足所述设定的网格区域合并条件,则将初始矩阵中对应网格区域中每个元素值均减1;判断所述滑动长度是否小于N;若所述滑动长小于N,则增大所述滑动长度,按照增大后的所述滑动长度依次选定所述二维空间区域内的网格区域,返回步骤“判断选定的网格区域是否满足所述设定的网格区
域合并条件”;若所述滑动长不小于N,则将当前所述初始矩阵作为所述二维空间区域对应的划分结构矩阵。3.根据权利要求1所述的位置大数据统计发布方法,其特征在于,所述设定的网格区域合并条件为根据滑动长度选定的所有网格密度均满足:和其中,C
i
′
表示根据滑动长度选定的的第i
′
个网格的网格密度,i
′
=1,2,
…
,m,m表示根据滑动长度选定区域内的网格的数量,表示根据滑动长度选定区域内的网格密度均值。4.根据权利要求1所述的位置大数据统计发布方法,其特征在于,所述根据所述预测划分结构矩阵对所述预测划分结构中各子区域分配差分隐私预算,并将所述预测划分结构矩阵中各子区域的原始密度值与所述子区域分配的差分隐私预算产生的Laplace噪声相加,得到各子区域的加噪发布统计值,具体包括:获得预测划分结构矩阵中的最大划分等级,所述最大划分等级标记为h
*
;遍历所述预测划分结构矩阵中所有的子区域,若子区域的划分等级i等于h
*
,则该子区域的加噪发布统计值为C
i
表示该子区域对应的位置点密度,Laplace()表示拉普拉斯变换,S表示预设的全局敏感度,ε
i
表示划分等级i的隐私预算,ε表示总体隐私预算,若子区域的划分等级i小于h
*
,则该子区域的加噪发布统计值为5.根据权利要求1所述的位置大数据统计发布方法,其特征在于,所述深度学习模型为ConvLSTM深度学习模型。6.一种位置大数据统计发布系统,其特征在于,包括:第一...
【专利技术属性】
技术研发人员:晏燕,丛一鸣,张雄,孙子超,董卓越,李靖,徐飞,
申请(专利权)人:兰州理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。