基于语义的个性化轨迹数据隐私保护方法技术

技术编号:11545768 阅读:102 留言:0更新日期:2015-06-03 19:12
本发明专利技术提供了一种基于语义的个性化轨迹数据隐私保护方法,根据用户提供的每个敏感位置点,分别构造包含若干相似兴趣点的泛化区域,选择一个相似兴趣点替代敏感位置点,并在泛化区域内构造合理的替代轨迹路径和替代位置点序列。本发明专利技术在满足用户个性化轨迹数据隐私保护需求的同时,可保证替代轨迹路径数据具有较高的效用性。

【技术实现步骤摘要】
基于语义的个性化轨迹数据隐私保护方法
本专利技术涉及通信领域中的数据发布,特别涉及一种基于语义的个性化轨迹数据隐私保护方法。
技术介绍
近年来,随着RFID、GPS和智能手机等位置感知设备的广泛应用,越来越多的位置数据被收集,这些位置数据以轨迹的形式存储在数据库中。轨迹数据蕴含着丰富的知识,发布这些数据,供相关部门进行挖掘和研究可支持多种相关的应用,例如交通规划、基于位置的广告和野生动物跟踪等。然而,这些轨迹数据中往往包含了关系到个人敏感信息的隐私数据,若未对这些轨迹数据进行处理就直接发布,会造成严重的隐私泄露。轨迹数据发布过程中存在的隐私泄露情况大致可分为两类:一类是由于轨迹上敏感或频繁访问的位置的泄露而导致移动对象的隐私泄露,轨迹上的敏感或频繁访问的位置很可能暴露其个人兴趣爱好、健康状况和宗教信仰等个人隐私;另一类是在大数据环境背景下,攻击者通过将轨迹数据与外部知识相关联,从而造成的隐私泄露情况。要使发布的轨迹数据对个人的隐私进行保护,在数据进行发布时,一方面要使得发布的数据不泄露个体的隐私信息,即保证攻击者不能以高置信度推测出目标个体的敏感信息;另一方面需要保证发布的数据具有高可用性,即仍然能够根据发布的数据进行较准确的数据分析,如集合查询等,这就要求发布的数据效用要尽可能的高。轨迹数据一般包含用户在地图背景知识下的经度与纬度等位置点信息,还包含时间信息,时间信息一般包含用户的停留时间、时间概率等。公开号为CN20141008673的中国专利技术专利公开了一种基于频率的轨迹抑制数据发布隐私保护的系统及其方法,采用特定的轨迹局部抑制法进行匿名处理,先从原始轨迹数据集中找到不满足用户的隐私容忍度的有问题的投影集,然后将有问题的投影集按在原始轨迹数据集中出现的频率进行排序,并将结果保存到新的数据集中,接下来,找到新的数据集中最小的违反隐私需求的轨迹序列集,将该轨迹序列集中与用户隐私关联度和数据效用度达到一定设定值的数据去除,虽然考虑到了频率问题来划分位置点的敏感程度,抑制敏感程度高的位置点,提高了匿名后的数据效用,但是抑制法已经被证明并不足以保护移动用户的隐私,攻击者可通过关联外部知识重新确认轨迹所属用户的身份,进而通过轨迹获得用户的隐私信息。为了解决这种关联攻击,基于泛化思想的轨迹k-匿名被提了出来,将满足k-匿名的轨迹放在同一个匿名集中,然而当数据来源于交易记录,RFID数据及购买记录时,k-匿名的数据效用有待考验。除了抑制法和泛化方法外,假数据法也是常用的轨迹数据发布隐私保护方法,假数据方法通过人为的构造一定数量的假轨迹,降低真实轨迹的披露风险,但目前出现的假数据法主要以轨迹数据中敏感点周围的位置点来替代原先的敏感点,数据效用度不高。
技术实现思路
本专利技术所要解决的技术问题是提供一种数据效用度高,能有效保护用户隐私的基于语义的个性化轨迹数据隐私保护方法。为了解决上述技术问题,本专利技术采用的技术方案为提供了一种基于语义的个性化轨迹数据隐私保护方法,所述方法包括以下步骤:S1根据用户自设定的敏感位置点参数,获得原始轨迹路径数据中需要保护的敏感位置点序列;S2依照所述敏感位置点序列的次序,选择一个敏感位置点,并预设所选择敏感位置点的兴趣阀值;S3以所选择敏感位置点为中心,在地图中逐步扩大半径区域,并预设相似兴趣点数量和疑似兴趣点,若疑似兴趣点的兴趣相似性达到预设的兴趣阀值,将其确定为相似兴趣点;若半径区域内的相似兴趣点达到预设相似兴趣点数量,停止扩大半径区域;S4将步骤S3中包含达到预设相似兴趣点数量的相似兴趣点的最小边界矩形转化为泛化区域;S5在所述的泛化区域中随机选择一个相似兴趣点作为替代敏感点;S6确定原始轨迹路径在所述的泛化区域中的入口点和出口点,并通过路径规划算法在泛化区域内构造一条通过所述的入口点、替代敏感点和出口点的替代轨迹路径;S7根据用户在所述的泛化区域中的停留时间和平均速率,在泛化区域内将所述的替代轨迹路径转化为替代位置点序列;S8依照所述敏感位置点序列的次序,选择下一个敏感位置点,并预设所选择的下一个敏感位置点的兴趣阀值,重复步骤S3~S7,直至将原始轨迹路径中所述敏感位置点序列的敏感点替代完毕。本专利技术的有益效果在于提供的基于语义的个性化轨迹数据隐私保护方法,以地图为背景,用相似兴趣点来构造泛化区域,将相似兴趣点作为用户敏感位置点的替代敏感点,并在泛化区域内构造合理的替代轨迹路径和替代位置点序列,在满足用户个性化轨迹数据隐私保护需求的同时,可保证替代轨迹路径数据具有较高的效用性。附图说明图1为本专利技术实施例提供的基于语义的个性化轨迹数据隐私保护方法的泛化区域构造示意图;图2为本专利技术实施例提供的基于语义的个性化轨迹数据隐私保护方法流程图;图3为本专利技术实施例一的在泛化区域内的原始位置点序列示意图;图4为本专利技术实施例一的在泛化区域内的替代位置点序列示意图。标号说明:1、第一敏感点;2、第一相似敏感点;3、第二相似敏感点;4、第三相似敏感点;5、泛化区域。具体实施方式为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并配合附图予以说明。本专利技术最关键的构思在于在地图背景下,以用户的相似兴趣点来替代原始轨迹数据中的敏感位置点,起到保护用户隐私的作用的同时,提高了替代轨迹数据的效用度。本专利技术涉及的技术术语解释见表1:表1请参照图1至图4,本专利技术提供了一种基于语义的个性化轨迹数据隐私保护方法,所述方法包括以下步骤:S1根据用户自设定的敏感位置点参数,获得原始轨迹路径数据中需要保护的敏感位置点序列;S2依照所述敏感位置点序列的次序,选择一个敏感位置点,并预设所选择敏感位置点的兴趣阀值;S3以所选择敏感位置点为中心,在地图中逐步扩大半径区域,并预设相似兴趣点数量和疑似兴趣点,若疑似兴趣点的兴趣相似性达到预设的兴趣阀值,将其确定为相似兴趣点;若半径区域内的相似兴趣点达到预设相似兴趣点数量,停止扩大半径区域;S4将步骤S3中包含达到预设相似兴趣点数量的相似兴趣点的最小边界矩形转化为泛化区域;S5在所述的泛化区域中随机选择一个相似兴趣点作为替代敏感点;S6确定原始轨迹路径在所述的泛化区域中的入口点和出口点,并通过路径规划算法在泛化区域内构造一条通过所述的入口点、替代敏感点和出口点的替代轨迹路径;S7根据用户在所述的泛化区域中的停留时间和平均速率,在泛化区域内将所述的替代轨迹路径转化为替代位置点序列;S8依照所述敏感位置点序列的次序,选择下一个敏感位置点,并预设所选择的下一个敏感位置点的兴趣阀值,重复步骤S3~S7,直至将原始轨迹路径中所述敏感位置点序列的敏感点替代完毕。从上述描述可知,本专利技术的有益效果在于提供的基于语义的个性化轨迹数据隐私保护方法,以地图为背景,用相似兴趣点来构造泛化区域,将相似兴趣点作为用户敏感位置点的替代敏感点,并在泛化区域内构造合理的替代轨迹路径和替代位置点序列,在满足用户个性化轨迹数据隐私保护需求的同时,可保证替代轨迹路径数据具有较高的效用性。进一步的,步骤S3中所述相似兴趣点的选取方法:假定某次访问疑似兴趣点u的时间和停留时间分别为t和T,则所述疑似兴趣点u的兴趣集S(t,T)定义为:S(t,T)=Pv(u,t)*Ps(u,T)若S(t,T)的值大于所预设的兴趣阀值,则本文档来自技高网
...
基于语义的个性化轨迹数据隐私保护方法

【技术保护点】
一种基于语义的个性化轨迹数据隐私保护方法,其特征在于,所述方法包括以下步骤:S1根据用户自设定的敏感位置点参数,获得原始轨迹路径数据中需要保护的敏感位置点序列;S2依照所述敏感位置点序列的次序,选择一个敏感位置点,并预设所选择敏感位置点的兴趣阀值;S3以所选择敏感位置点为中心,在地图中逐步扩大半径区域,并预设相似兴趣点数量和疑似兴趣点,若疑似兴趣点的兴趣相似性达到预设的兴趣阀值,将其确定为相似兴趣点;若半径区域内的相似兴趣点达到预设相似兴趣点数量,停止扩大半径区域;S4将步骤S3中包含达到预设相似兴趣点数量的相似兴趣点的最小边界矩形转化为泛化区域;S5在所述的泛化区域中随机选择一个相似兴趣点作为替代敏感点;S6确定原始轨迹路径在所述的泛化区域中的入口点和出口点,并通过路径规划算法在泛化区域内构造一条通过所述的入口点、替代敏感点和出口点的替代轨迹路径;S7根据用户在所述的泛化区域中的停留时间和平均速率,在泛化区域内将所述的替代轨迹路径转化为替代位置点序列;S8依照所述敏感位置点序列的次序,选择下一个敏感位置点,并预设所选择的下一个敏感位置点的兴趣阀值,重复步骤S3~S7,直至将原始轨迹路径中所述敏感位置点序列的敏感点替代完毕。...

【技术特征摘要】
1.一种基于语义的个性化轨迹数据隐私保护方法,其特征在于,所述方法包括以下步骤:S1根据用户自设定的敏感位置点参数,获得原始轨迹路径数据中需要保护的敏感位置点序列;S2依照所述敏感位置点序列的次序,选择一个敏感位置点,并预设所选择敏感位置点的兴趣阀值;S3以所选择敏感位置点为中心,在地图中逐步扩大半径区域,并预设相似兴趣点数量和疑似兴趣点,若疑似兴趣点的兴趣相似性达到预设的兴趣阀值,将其确定为相似兴趣点;若半径区域内的相似兴趣点达到预设相似兴趣点数量,停止扩大半径区域;S4将步骤S3中包含达到预设相似兴趣点数量的相似兴趣点的最小边界矩形转化为泛化区域;S5在所述的泛化区域中随机选择一个相似兴趣点作为替代敏感点;S6确定原始轨迹路径在所述的泛化区域中的入口点和出口点,并通过路径规划算法在泛化区域内构造一条通过所述的入口点、替代敏感点和出口点的替代轨迹路径;S7根据用户在所述的泛化区域中的停留时间和平均速率,在泛化区域内将所述的替代轨迹路径转化为替代位置点序列;S8依照所述敏感位置点序列的次序,选择下一个敏感位置点,并预设所选择的下一个敏感位置点的兴趣阀值,重复步骤S3~S7,直至将原始轨迹路径中所述敏感位置点序列的敏感位置点替代完毕。2.根据权利要求1所述的基于语义的个性化轨迹数据隐私保护方法,其特征在于,步骤S3中所述相似兴趣点的选取方法:假定某次访问疑似兴趣点u的时间和停留时间分别为t和T,则所述疑似兴趣点u的兴趣集S(t,T)定义为:S(t,T)=Pv(u,t)*Ps(u,T)若S(t,T)的值大于所预设的兴趣阀值,则所述疑似兴趣点u为相似兴趣点;反之,则所述疑似兴趣点u不是相似兴趣点;其中,Pv(u,t)为疑似兴趣点u的访问概率,Num(t)为一天中在t时间点内访问疑似兴趣点u的平均...

【专利技术属性】
技术研发人员:叶阿勇郑永星李晴
申请(专利权)人:福建师范大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1