当前位置: 首页 > 专利查询>安徽大学专利>正文

一种基于差分隐私的移动用户的轨迹隐私保护方法及系统技术方案

技术编号:19938656 阅读:23 留言:0更新日期:2018-12-29 06:47
本发明专利技术公开了一种基于差分隐私的移动用户的轨迹隐私保护方法,该方法应用于服务器,并作用于m个通信基站L={l1,l2,…lm},n个用户U={u1,u2,…un}所构成的移动场景中,其中li其表示第i个通信基站的位置,1≤i≤m;uj表示第j个用户,1≤j≤n,该方法包括以下步骤:S1、初始化阶段;S2、数据聚合阶段;S3、数据扰动阶段;S4、数据发布阶段。本发明专利技术还公开了一种基于差分隐私的移动用户的轨迹隐私保护系统。本发明专利技术通过对通信基站覆盖的用户人数进行扰动,而不同于其他方案通过对每个用户的位置进行扰动,这样大大降低了隐私预算的使用,保证了数据的可用性,并且减小了计算开销。

【技术实现步骤摘要】
一种基于差分隐私的移动用户的轨迹隐私保护方法及系统
本专利技术涉及网络与信息安全
,尤其涉及一种基于差分隐私的移动用户的轨迹隐私保护方法及系统。
技术介绍
随着互联网技术的飞速发展,大数据时代随之到来,移动设备的普及使得人类的移动数据可以通过蜂窝网络和移动应用程序被广泛地收集起来,并且由于学术研究和商业目的被公开地发布出去。然而,这种数据发布的一个主要问题是如何保护移动用户的隐私?为了保护用户的隐私,数据拥有者(运营商)往往只会发布聚合的移动数据,而不是提供每个用户的轨迹记录,例如在特定的时间戳内,发布基站覆盖范围内的用户数量。这种聚合后的用户移动统计数据在交通调度和商业智能化等众多应用中具有很大的实用价值。更重要的是,这些数据提供者大多认为,这种通过发布聚合后的统计数据可以保护用户的隐私,因为敌手无法从聚合数据中区分出特定的某个用户。最新的研究表明,发布聚合后用户移动性统计数据可能会导致其移动轨迹中的隐私泄露,这主要是因为人类移动过程中存在的两个关键特征。首先,单个用户的移动模式具有连贯性和规则性,这使得对于单个用户的轨迹具有高度的可预测性。其次,任意一个用户的移动模式与其他用户移动模式明显不同,这使得对手能够特定地重新识别出某个用户的轨迹。虽然对于某一个时间戳下的聚合数据,很难从中区分出每个用户的记录,但是连续时间下,根据上述的用户的移动特性,就可以从聚合数据中恢复出用户的运动轨迹,进而从中重新获取特定用户的运动轨迹。所以有效的的保护移动设备用户的轨迹隐私问题是至关重要的。
技术实现思路
本专利技术的目的在于提供了一种基于差分隐私的移动用户的轨迹隐私保护方法及系统,通过使用差分隐私中的拉普拉斯机制来保护用户的位置隐私,从而防止了具有任何背景知识的敌手对用户的移动轨迹的恢复。本专利技术是通过以下技术方案实现的:一种基于差分隐私的移动用户的轨迹隐私保护方法,该方法应用于服务器,并作用于m个通信基站L={l1,l2,…lm},n个用户U={u1,u2,…un}所构成的移动场景中,其中li其表示第i个通信基站的位置,1≤i≤m;uj表示第j个用户,1≤j≤n,该方法包括以下步骤:S1、初始化阶段:当用户uj进入通信基站li的覆盖范围内,通信运营商的服务器将会记录下用户的相关信息:匿名化后的用户ID号,访问的通信基站位置信息,以及访问时间t;S2、数据聚合阶段:服务器将一段时间内收集到的用户的相关信息按照一定的时间间隔进行统计聚合,提取出每个时间段内每个用户访问最频繁的通信基站的位置信息,并计算出该时间段下每个通信基站内包含的用户总人数表示时间t下,通信基站li覆盖的用户总人数,1≤i≤m;S3、数据扰动阶段:根据人类的移动特性,将时间划分为白天时间阶段、晚上时间阶段以及深夜时间阶段,通过计算出每个时间段下的各个基站人数的分布情况引用差分隐私机制对这三个时间段下的数据进行不同的扰动处理;S4、数据发布阶段:通信运营商将处理后的数据发布出去。作为本专利技术的优选方式之一,所述步骤S2的数据聚合阶段具体包括以下操作流程:(1)时间段划分:根据对用户移动轨迹的分辨率的要求,按照不同时间间隔进行划分,时间间隔越大,则用户移动轨迹的分辨率越小;时间间隔越小,用户移动轨迹越精确;(2)位置提取:划分好时间间隔后,用户在某一时间间隔内会出现1个或多个不同通信基站访问记录,此时我们将提取出这些通信基站中,用户访问最频繁的基站作为该时间段下用户所访问的位置;(3)数据统计:通过步骤(2),可以知道在每个时间戳下,用户只可能访问一个通信基站,因此计算出在时间戳t下,每个基站(l1,l2,…lm)覆盖区域内用户的访问数量从而可以获得实时情况下,某个地区每个通信基站的覆盖区域内用户数的分布情况,即数据集作为本专利技术的优选方式之一,所述步骤S3的数据扰动阶段具体包括:(1)在白天时间段下,设为早上7点到晚上6点间,用户的基站访问位置在处于不断更新变换的状态;此时相邻时刻数据集Dt-1和Dt的用户人数分布差异较大,我们对每个时间下的数据集Dt直接引入满足ε-差分隐私的拉普拉斯机制来添加符合拉普拉斯分布的扰动噪声(2)在晚上时间段,设为晚上6点到晚上11点之间,用户的基站访问位置更新速度降低;此时相邻时刻数据集Dt-1和Dt的用户人数分布仍具有差异,但差异处于时而大时而很小的情况;(3)在深夜时间段,设为晚上11点到第二天早晨7点间,用户的基站访问位置将不会发生变化,此时相邻时刻数据集Dt-1和Dt的用户分布差几乎不变;用户的轨迹隐私只用在移动过程中才会暴露出来,此时直接用原始数据进行发布。作为本专利技术的优选方式之一,为了满足基站总人数n不发生变化,所述步骤(1)中只对前m-1个基站进行扰动处理,前m-1个基站引入的噪声向量为Noisem-1=(x1,x2,…,xm-1),第m个基站加入的噪声将根据前m-1个基站加入的噪声和取相反数,作为本专利技术的优选方式之一,在所述步骤(2)中:当相邻时刻数据集Dt-1和Dt的用户分布差异较大的情况下,只需计算出当前时刻的数据集Dt和前一个时刻发布出去的数据集Dt-1之间的分布差值,并与设定好的固定阈值T进行比较,判断是否对当前数据集进行扰动处理;因此只需对部分数据集Dt进行扰动处理,并令需要扰动处理的数据集D的个数为C。作为本专利技术的优选方式之一,在所述步骤(2)的晚上时间段中应用以下扰动方法,其扰动方法包括以下步骤:(1)隐私预算分配:在对数据集D进行扰动处理之前,首先对隐私预算ε进行分配,使其在整个数据扰动处理阶段满足ε-差分隐私;令ε=ε1+ε2,ε1是用于判定过程中的隐私预算,且ε1=kε,ε2是用于对数据集D扰动过程中的隐私预算;(2)判定阶段:在此过程中,采取满足差分隐私的拉普拉斯机制来添加符合拉普拉斯分布的扰动噪声计算出噪声阈值以及当前时刻的数据集和前一个时刻发布出去的数据集之间的分布差值的噪声值(3)扰动阶段:对于的数据集,引入隐私预算为的噪声,采取满足差分隐私的拉普拉斯机制来添加符合拉普拉斯分布的扰动噪声Noisem-1=(x1,x2,…,xm-1),计算出噪声数据集作为本专利技术的优选方式之一,在所述步骤(2)的判定阶段中:当则对进行扰动处理,否则用代替当前时刻用户位置分布进行发布,即作为本专利技术的优选方式之一,在所述步骤(3)的扰动阶段中:当隐私预算还有剩余时,在最后一个时刻加入剩余所有的隐私预算的噪声;当隐私预算ε2用尽,将用最后分布的数据集代替后续数据集进行发布。本专利技术还公开了一种基于差分隐私的移动用户的轨迹隐私保护系统,该系统应用于服务器,并作用于m个通信基站L={l1,l2,…lm},n个用户U={u1,u2,…un}所构成的移动场景中,其中li其表示第i个通信基站的位置,1≤i≤m;uj表示第j个用户,1≤j≤n,该系统包括以下模块:初始化模块:当用户uj进入通信基站li的覆盖范围内,用于通过通信运营商的服务器记录下用户的相关信息:匿名化后的用户ID号,访问的通信基站位置信息,以及访问时间t;数据聚合模块:通过服务器将一段时间内收集到的用户的相关信息按照一定的时间间隔进行统计聚合,提取出每个时间段内每个用户访问最频繁的通信基站的位置信息,并计算出该时间段下每个通信基站内包含的用户总本文档来自技高网...

【技术保护点】
1.一种基于差分隐私的移动用户的轨迹隐私保护方法,其特征在于,该方法应用于服务器,并作用于m个通信基站L={l1,l2,...lm},n个用户U={u1,u2,...un}所构成的移动场景中,其中li其表示第i个通信基站的位置,1≤i≤m;uj表示第j个用户,1≤j≤n,该方法包括以下步骤:S1、初始化阶段:当用户uj进入通信基站li的覆盖范围内,通信运营商的服务器将会记录下用户的相关信息:匿名化后的用户ID号,访问的通信基站位置信息,以及访问时间t;S2、数据聚合阶段:服务器将一段时间内收集到的用户的相关信息按照一定的时间间隔进行统计聚合,提取出每个时间段内每个用户访问最频繁的通信基站的位置信息,并计算出该时间段下每个通信基站内包含的用户总人数

【技术特征摘要】
1.一种基于差分隐私的移动用户的轨迹隐私保护方法,其特征在于,该方法应用于服务器,并作用于m个通信基站L={l1,l2,...lm},n个用户U={u1,u2,...un}所构成的移动场景中,其中li其表示第i个通信基站的位置,1≤i≤m;uj表示第j个用户,1≤j≤n,该方法包括以下步骤:S1、初始化阶段:当用户uj进入通信基站li的覆盖范围内,通信运营商的服务器将会记录下用户的相关信息:匿名化后的用户ID号,访问的通信基站位置信息,以及访问时间t;S2、数据聚合阶段:服务器将一段时间内收集到的用户的相关信息按照一定的时间间隔进行统计聚合,提取出每个时间段内每个用户访问最频繁的通信基站的位置信息,并计算出该时间段下每个通信基站内包含的用户总人数表示时间t下,通信基站li覆盖的用户总人数,1≤i≤m;S3、数据扰动阶段:根据人类的移动特性,将时间划分为白天时间阶段、晚上时间阶段以及深夜时间阶段,通过计算出每个时间段下的各个基站人数的分布情况引用差分隐私机制对这三个时间段下的数据进行不同的扰动处理;S4、数据发布阶段:通信运营商将处理后的数据发布出去。2.根据权利要求1所述的基于差分隐私的移动用户的轨迹隐私保护方法,其特征在于,所述步骤S2的数据聚合阶段具体包括以下操作流程:(1)时间段划分:根据对用户移动轨迹的分辨率的要求,按照不同时间间隔进行划分,时间间隔越大,则用户移动轨迹的分辨率越小;时间间隔越小,用户移动轨迹越精确;(2)位置提取:划分好时间间隔后,用户在某一时间间隔内会出现1个或多个不同通信基站访问记录,此时我们将提取出这些通信基站中,用户访问最频繁的基站作为该时间段下用户所访问的位置;(3)数据统计:通过步骤(2),可以知道在每个时间戳下,用户只可能访问一个通信基站,因此计算出在时间戳t下,每个基站(l1,l2,...lm)覆盖区域内用户的访问数量从而可以获得实时情况下,某个地区每个通信基站的覆盖区域内用户数的分布情况,即数据集3.根据权利要求1所述的基于差分隐私的移动用户的轨迹隐私保护方法,其特征在于,所述步骤S3的数据扰动阶段具体包括:(1)在白天时间段下,设为早上7点到晚上6点间,用户的基站访问位置在处于不断更新变换的状态;此时相邻时刻数据集Dt-1和Dt的用户人数分布差异较大,我们对每个时间下的数据集Dt直接引入满足ε-差分隐私的拉普拉斯机制来添加符合拉普拉斯分布的扰动噪声(2)在晚上时间段,设为晚上6点到晚上11点之间,用户的基站访问位置更新速度降低;此时相邻时刻数据集Dt-1和Dt的用户人数分布仍具有差异,但差异处于时而大时而很小的情况;(3)在深夜时间段,设为晚上11点到第二天早晨7点间,用户的基站访问位置将不会发生变化,此时相邻时刻数据集Dt-1和Dt的用户分布差几乎不变;用户的轨迹隐私只用在移动过程中才会暴露出来,此时直接用原始数据进行发布。4.根据权利要求3所述的基于差分隐私的移动用户的轨迹隐私保护方法,其特征在于,为了满足基站总人数n不发生变化,所述步骤(1)中只对前m-1个基站进行扰动处理,前m-1个基站引入的噪声向量为Nois...

【专利技术属性】
技术研发人员:陈志立阚晓立张顺仲红崔杰
申请(专利权)人:安徽大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1