一种使用图差分隐私模型的敏感标签轨迹数据发布方法技术

技术编号:24708468 阅读:34 留言:0更新日期:2020-07-01 00:02
本发明专利技术属于信息安全技术领域,涉及一种基于图差分隐私模型的敏感标签轨迹数据发布方法,包括:轨迹的聚类和泛化,基于图的时空点差分隐私,和发布带隐私标签的轨迹数据。在第一阶段,首先将所有时空点划分为热点区域和异常值,然后使用热点区域的中心位置来泛化轨迹数据中的每个具体位置。在第二阶段中,建立一个噪声图,将热点、异常值以及隐私标签映射到有向加权图,为了控制所添加噪声的大小并尽可能地保护数据的可用性,为不同的顶点设置不同的隐私预算,然后添加拉普拉斯噪声以实现差分隐私。在发布阶段,首先还原泛化后的轨迹数据集中的各条记录,并选择头顶点,根据启发式生成轨迹数据,就得到了匿名后的数据,并且保证了数据的高可用性。

【技术实现步骤摘要】
一种使用图差分隐私模型的敏感标签轨迹数据发布方法
本专利技术涉及一种基于图差分隐私模型的敏感标签轨迹数据发布方法,属于信息安全

技术介绍
随着位置感知设备和无线通信的爆炸式增长,移动物体的时空轨迹可以被轻松收集和分析。日常生活中依赖这些轨迹数据来为用户提供丰富服务的应用越来越多,如位置社交网络,基于位置的服务和移动健康等等。在这种数据驱动的应用中,轨迹很多时候由一个标签和一系列时空点组成。轨迹数据来源非常丰富,比如各种GPS设备、手机等移动设备、基站甚至社交网络分享的位置等等。随着数据的获取设备越来越发达,轨迹数据有了很大积累,轨迹数据之中隐藏的大量信息越来越引起众多政府、企业以及科研机构的密切关注。轨迹数据可以用来为用户提供更好的服务,这些LBS应用根据用户的轨迹数据,能够为用户推荐与查询内容更加符合的商家或满足用户要求的服务,例如基于位置的餐饮、娱乐和旅游等服务。随着移动设备越来越成为人们生活的一部分,移动医疗因为其方便性也受到了更多的关注。在移动医疗中,医生与患者不用每次面对面了解病情,而是通过移动设备来远程定位和获取患本文档来自技高网...

【技术保护点】
1.一种基于图差分隐私模型的敏感标签轨迹数据发布方法,其特征在于,具体步骤如下:/n(1)轨迹的聚类和泛化/n(1.1)首先获取原始轨迹数据集D,然后采用DBSCAN算法查找包含热点位置和异常值的候选位置区域;热点位置是时空点相对密集的区域,异常值是与其他数据集中的时空点相差甚远或在某些衡量度量下不一致的时空点;/n(1.2)获得异常值集合O和当做热点位置的聚类集合C,将原始轨迹数据中时空点的位置替换为对应热点位置的中心,来泛化轨迹数据中的每个具体位置;/n(1.3)获得泛化后的轨迹数据集D′={C,O};/n(2)基于图的时空点差分隐私/n(2.1)建立一个噪声图,将热点、异常值以及隐私标签...

【技术特征摘要】
1.一种基于图差分隐私模型的敏感标签轨迹数据发布方法,其特征在于,具体步骤如下:
(1)轨迹的聚类和泛化
(1.1)首先获取原始轨迹数据集D,然后采用DBSCAN算法查找包含热点位置和异常值的候选位置区域;热点位置是时空点相对密集的区域,异常值是与其他数据集中的时空点相差甚远或在某些衡量度量下不一致的时空点;
(1.2)获得异常值集合O和当做热点位置的聚类集合C,将原始轨迹数据中时空点的位置替换为对应热点位置的中心,来泛化轨迹数据中的每个具体位置;
(1.3)获得泛化后的轨迹数据集D′={C,O};
(2)基于图的时空点差分隐私
(2.1)建立一个噪声图,将热点、异常值以及隐私标签SA映射到有向加权图;将D′中所有不同的SA值映射到G中的头顶点,G为由D′映射而来的图;头顶点被视为每条记录的开始,每个头顶点的顶点权重是原始数据中具有该SA值的轨迹的数量;
(2.2)将D′中所有轨迹中的每个位置映射到轨迹顶点;
(2.3)为不同的顶点设置不同的隐私预算ε值;根据SA值的隐私程度设定每个头顶点的ε,隐私程度根据数据拥有者自身的要求设定,针对不同的SA值设定不同的ε值;
对于每个轨迹顶点v,设置一种通过这些数据拥有者{v1,v2,v3,...vn}的投票来确定ε,具体方法如下:

【专利技术属性】
技术研发人员:姚琳陈振宇孙云栋吴国伟
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1