基于路网的轨迹数据隐私保护方法技术

技术编号:13350101 阅读:103 留言:0更新日期:2016-07-15 09:57
本发明专利技术涉及一种基于路网的轨迹数据隐私保护方法,在轨迹数据发布应用场景中,首先进行轨迹预处理操作,根据路网信息,按路段将原始的完整轨迹划分成多个子轨迹片段,并对同一路段上的子轨迹片段按照时间信息进行分组;然后结合用户的隐私需求和移动速度信息对同一组内轨迹片段集合进行聚类,每一个等价类内的轨迹片段形成匿名集合;最后在匿名集合内构造合适代表轨迹进行发布,实现发布轨迹数据集的隐私保护处理。本发明专利技术在确保发布轨迹数据集安全性的同时,提升数据的可用性。

【技术实现步骤摘要】

本专利技术涉及时空数据管理领域,特别是一种基于路网的轨迹数据隐私保护方法
技术介绍
近年来,随着RFID、GPS和智能手机等位置感知设备的广泛应用,越来越多的位置数据被收集,这些数据以轨迹的形式存储在数据库中。轨迹数据蕴含着丰富的知识,发布这些数据,供相关部门进行挖掘和研究可支持多种相关的应用,例如交通规划、基于位置的广告和野生动物跟踪等。然而,由于这些轨迹与个人的信息密切相关,未对这些轨迹数据进行处理就直接发布将会照成严重的隐私泄露。轨迹隐私定义为轨迹数据中所包含的个人敏感信息,比如从轨迹中推出用户的家庭住址、工作地点、生活习惯和健康状况等。现已提出了相当多的方法来保护发布轨迹数据的隐私信息,其中轨迹k-匿名是具有代表性的一类技术。轨迹k-匿名通过定义相似度度量,在欧式空间上需找相似的k条轨迹来构造匿名集合,选择代表轨迹进行发布,使得攻击者在没有其他背景知识的情况下识别轨迹所属用户身份的概率变为1/k。但是,当攻击者掌握地图背景知识的情况下,轨迹k匿名会存在以下问题:当聚合的轨迹处于同一路段上时,攻击者无法识别用户身份的情况下仍可知道用户访问的位置信息;当聚合不同路段上的轨迹时,可保护轨迹身份和位置信息,但影响发布信息的可用性。因此,结合路网等语义信息来对轨迹数据进行隐私保护处理将显得很有必要。
技术实现思路
有鉴于此,本专利技术的目的是提供一种基于路网的轨迹数据隐私保护方法,在确保发布轨迹数据集安全性的同时,提升数据的可用性。本专利技术采用以下方案实现:一种基于路网的轨迹数据隐私保护方法,包括以下步骤:步骤S1:对轨迹进行预处理操作:根据路网信息,按路段将原始完整轨迹划分成多个子轨迹片段,并对同一路段上的子轨迹片段按照时间信息进行分组;步骤S2:构造匿名子轨迹片段集合:结合用户的隐私需求和移动速度信息对同一分组内的子轨迹片段集合进行聚类,每一个等价类内的轨迹片段形成一个匿名集合;步骤S3:构造匿名集合内代表轨迹:根据匿名集合内子轨迹片段位置点的分布,根据轨迹中速度信息和范围查询结果的准确性,构造合适的代表轨迹进行发布。进一步地,所述步骤S1中对轨迹进行预处理操作具体为:首先对路网进行建模,将轨迹的位置点序列通过地址解析匹配到路网上;再将原始轨迹中处于同一个路段上的位置点序列划分为一个子轨迹片段;根据子轨迹片段在路段入口和出口的时间,将时间相近的子轨迹片段划分到同一组内,同一路段上的子轨迹片段集合形成多个分组。进一步地,所述步骤S2中构造路段上轨迹片段匿名集合具体为:首先根据用户的隐私需求决定分组内子轨迹片段聚类的个数,其中用户的隐私需求越高,聚合类的个数越少,反之,则聚合类的个数越多;再根据移动速度信息对分组内的子轨迹片段集合进行聚类操作,形成多个等价类,等价类内的轨迹片段形成一个匿名集合。进一步地,所述步骤S3中构造匿名集合内代表轨迹具体为:根据代表轨迹的平均速度信息和路段的长度决定代表轨迹中位置点的个数k,在路段上等距离设置k个参考点,采用k-means聚类方法聚合参考点附近的轨迹位置点,将k个聚类中位置点的中心作为代表轨迹的位置点序列,完成代表代表轨迹的构造。进一步地,所述步骤S1中,所述轨迹设为T,轨迹T表示为T=(trid,p1p2…pn),其中,trid为轨迹的标识信息,pi=<rid,xi,yi,ti>,rid表示位置点pi所在的路段标识,<xi,yi>为在ti时刻,用户所处的经纬度坐标;所述子轨迹片段设为tr,子轨迹片段tr为保留了次序的原始轨迹T的子集,tr中的位置点均处于同一个路段中,tr=(trid,pkpk+1…pk+m),pi.rid=pj.rid,划分后的原始轨迹集合可表示为T=(trid,tri|i∈rid),其中tri表示轨迹T在路段i上的轨迹片段部分;若任意一路段上存在轨迹片段tri和trj,(ti1,tin)和(tj1,tjn)分别为tri和trj在路段的入口和出口的时间,若ti1=tj1±δ,tin=tjn±δ,则轨迹tri和trj为同步轨迹,其中δ为时间阈值,取值范围为0-15mins。进一步地,所述步骤S2中,所述匿名集合设为C,则路段i上的轨迹片段的匿名集合表示为C(i)={(trid,srid)|rid=i本文档来自技高网...
基于路网的轨迹数据隐私保护方法

【技术保护点】
一种基于路网的轨迹数据隐私保护方法,其特征在于:包括以下步骤:步骤S1:对轨迹进行预处理操作:根据路网信息,按路段将原始完整轨迹划分成多个子轨迹片段,并对同一路段上的子轨迹片段按照时间信息进行分组;步骤S2:构造匿名子轨迹片段集合:结合用户的隐私需求和移动速度信息对同一分组内的子轨迹片段集合进行聚类,每一个等价类内的轨迹片段形成一个匿名集合;步骤S3:构造匿名集合内代表轨迹:根据匿名集合内子轨迹片段位置点的分布,根据轨迹中速度信息和范围查询结果的准确性,构造合适的代表轨迹进行发布。

【技术特征摘要】
1.一种基于路网的轨迹数据隐私保护方法,其特征在于:包括以下
步骤:
步骤S1:对轨迹进行预处理操作:根据路网信息,按路段将原
始完整轨迹划分成多个子轨迹片段,并对同一路段上的子轨迹片段按
照时间信息进行分组;
步骤S2:构造匿名子轨迹片段集合:结合用户的隐私需求和移
动速度信息对同一分组内的子轨迹片段集合进行聚类,每一个等价类
内的轨迹片段形成一个匿名集合;
步骤S3:构造匿名集合内代表轨迹:根据匿名集合内子轨迹片
段位置点的分布,根据轨迹中速度信息和范围查询结果的准确性,构
造合适的代表轨迹进行发布。
2.根据权利要求1所述的一种基于路网的轨迹数据隐私保护方法,
其特征在于:所述步骤S1中对轨迹进行预处理操作具体为:首先对
路网进行建模,将轨迹的位置点序列通过地址解析匹配到路网上;再
将原始轨迹中处于同一个路段上的位置点序列划分为一个子轨迹片
段;根据子轨迹片段在路段入口和出口的时间,将时间相近的子轨迹
片段划分到同一组内,同一路段上的子轨迹片段集合形成多个分组。
3.根据权利要求1所述的一种基于路网的轨迹数据隐私保护方法,
其特征在于:所述步骤S2中构造路段上轨迹片段匿名集合具体为:

\t首先根据用户的隐私需求决定分组内子轨迹片段聚类的个数,其中用
户的隐私需求越高,聚合类的个数越少,反之,则聚合类的个数越多;
再根据移动速度信息对分组内的子轨迹片段集合进行聚类操作,形成
多个等价类,等价类内的轨迹片段形成一个匿名集合。
4.根据权利要求1所述的一种基于路网的轨迹数据隐私保护方法,
其特征在于:...

【专利技术属性】
技术研发人员:叶阿勇郑永星
申请(专利权)人:福建师范大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1