当前位置: 首页 > 专利查询>东华大学专利>正文

基于停车记录对车辆匿名的移动轨迹数据去匿名的方法技术

技术编号:19320974 阅读:36 留言:0更新日期:2018-11-03 11:10
本发明专利技术涉及一种基于停车记录对车辆匿名的移动轨迹数据去匿名的方法,包括以下步骤:提取轨迹中所有停车点,去除上下客造成的停车,将停车划分为载人停车与空载停车;去除载人停车的异常点,并对载人停车进行建模;用所得模型去除空载停车点中的等红绿灯和堵车停车,保留兴趣停车点;对兴趣停车点构造基于TF‑IDF的特征向量,将已知轨迹的特征向量与匿名轨迹的特征向量相比对,找出匿名轨迹集合中与已知轨迹匹配的匿名轨迹。本发明专利技术实现了依靠停车点记录能够从匿名的移动轨迹集中匹配出未匿名的原始轨迹,验证单个驾驶员兴趣停车点特征的稳定性与独特性,并揭示匿名轨迹数据安全风险。

Anonymity removal method based on parking records for vehicle anonymously moving trajectories

The invention relates to a method for removing anonymity of vehicle moving track data based on parking records, which includes the following steps: extracting all parking points in the track, removing parking caused by passengers, dividing parking into manned parking and empty parking, removing abnormal points of manned parking, and modeling manned parking; The model is used to remove the equal traffic lights and traffic jams in no-load parking points and retain the interest parking points. A feature vector based on TF IDF is constructed for the interest parking points. The feature vectors of known trajectories are compared with the feature vectors of anonymous trajectories, and anonymous trajectories matching with known trajectories in the set of anonymous trajectories are found. The invention realizes that the original unknown trajectory can be matched from the anonymous moving trajectory centralized by the parking point record, verifies the stability and uniqueness of the characteristics of a single driver's interest parking point, and reveals the security risk of the anonymous trajectory data.

【技术实现步骤摘要】
基于停车记录对车辆匿名的移动轨迹数据去匿名的方法
本专利技术涉及匿名移动轨迹的隐私安全
,特别是涉及一种基于停车记录对车辆匿名的移动轨迹数据去匿名的方法。
技术介绍
随着移动终端和定位技术的发展,能够容易地获取交通工具的移动轨迹数据,而这些移动轨迹通常包含丰富的时空信息,利用这些数据进行合理的挖掘并分析可以获得有价值的信息。同时由于移动轨迹中会包含个人的隐私信息,恶意攻击者能够通过这些移动轨迹推测出各类其感兴趣的隐私事件,从而造成隐私安全问题。为了保护轨迹数据的隐私,一般会在轨迹数据发布前采用相关隐私保护技术对轨迹数据预处理。目前比较常见的有两大类,一种是修改原始轨迹,降低轨迹在空时中的精度,比如降低记录轨迹的分辨率或在轨迹中插入噪声,来保护隐私。但是会导致数据失真严重,可用性低;另一种采用对轨迹匿名化处理的方法,它是通过用假名(具有唯一性的随机标示符)替代参与者的真实身份,使参与者的真实身份无法通过任何方式与假名相关联。这种方法容易实现,在保持低开销、不改变原数据的情况下保护隐私,保持数据最大的可用性,因此被广泛采用。攻击者通过旁路信息就可从匿名轨迹中识别出被攻击者的轨迹。假设攻击者可以访问某个匿名轨迹集合,其中包括其攻击目标的轨迹。该攻击方法需要获取匿名轨迹发生时间段内,攻击目标车辆的若干时空“快照”(即车辆在某时刻的位置信息),从而从匿名轨迹集中识别出与所获时空“快照”向符合的轨迹。该类攻击对“快照”的时空限制较强,从而限制了去匿名攻击的实施。然而,是否存在更一般的攻击方式,不需要获取与匿名轨迹数据存续时间相重叠的时空信息,即可成功实施去匿名攻击尚无结论。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于停车记录对车辆匿名的移动轨迹数据去匿名的方法,分析由驾驶员个人偏好导致的兴趣停车点特征,验证单个驾驶员兴趣停车点特征的稳定性与独特性,并揭示匿名轨迹数据安全风险。本专利技术解决其技术问题所采用的技术方案是:提供一种基于停车记录对车辆匿名的移动轨迹数据去匿名的方法,获得某一出租车任意时间段的若干移动轨迹片段,利用持有轨迹与匿名轨迹集中的轨迹相比较识别该出租车的轨迹,包括以下步骤:(1)提取轨迹中所有停车点,去除上下客造成的停车,将停车划分为载人停车与空载停车,其中,载人停车包括等交通灯造成的停车和堵车造成的停车;(2)去除载人停车的异常点,并对载人停车进行建模;(3)用所得模型去除空载停车点中的等交通灯和堵车停车,保留兴趣停车点;(4)对兴趣停车点构造基于TF-IDF的特征向量,将已知轨迹的特征向量与匿名轨迹的特征向量相比对,找出匿名轨迹集合中与已知轨迹匹配的匿名轨迹。所述步骤(1)具体为:从轨迹集中筛选出位置不随时间变化的点,视其为停车点,根据出租车轨迹集中的停车前后的载人状态判断是否为上下客停车。所述步骤(2)中用dura表示停车时间,dist表示停车点到路口的距离,inter表示两个停车点的间隔时间,构造特征向量Stp=(dura,dist,inter),使用马氏距离去除载人停车的异常点。所述使用马氏距离去除载人停车的异常点具体为:设定马氏距离的阈值为其中,p为自由度,将超过阈值的停车点视为异常点;马氏距离的计算公式为:其中Stpi表示第i个停车点的特征向量,μ表示一组停车点集合的特征向量均值;v则表示停车点集合特征向量的协方差矩阵。所述步骤(3)中用去除异常停车点后的载人停车点训练One-classSVM分类器,来区分停车点是否为堵车和等交通灯的停车点;用分类器识别并去除空载停车点中堵车和等交通灯的停车点,保留的即为兴趣停车点。所述步骤(4)具体为:将出租车行驶的轨迹看作一个文本,路段编号看作是每个词语,路段的停车点数目就是词语在文本中出现的次数;权重值tf-idfi,j的计算公式为:tf-idfi,j=tfi,j×idfi,j,其中,Ni为训练数据中车辆vi所经过的路段总数;mj为训练数据包含路段rj的轨迹数;Ci为训练数据中车辆vi的轨迹所属的一类;mi,j为Ci中包含路段rj的轨迹数;ti,j为rj在Ci中出现的次数;tfi,j为rj在vi的轨迹中出现的频率;训练数据中提取到的停车点构成轨迹特征,测试数据中的停车点构成测试轨迹特征,用求余弦相似度值来进行匹配,通过测量两个向量内积空间的夹角的余弦值来度量它们之间的相似性;从两个向量之间的角度的余弦值确定两个向量是否大致指向相同的方向。有益效果由于采用了上述的技术方案,本专利技术与现有技术相比,具有以下的优点和积极效果:本专利技术实现了依靠停车点记录能够从匿名的移动轨迹集中匹配出未匿名的原始轨迹,分析由驾驶员个人偏好导致的兴趣停车点特征,验证单个驾驶员兴趣停车点特征的稳定性与独特性,并揭示匿名轨迹数据安全风险。附图说明图1为基于停车点对出租车轨迹去匿名方法的流程图;图2为出租车停车点的详细分类图;图3为上海出租车的停车点特征向量分布图;图4为深圳出租车的停车点特征向量分布图;图5为上海出租车空车停车点经过SVM分类的结果图;图6为深圳出租车空车停车点经过SVM分类的结果图;图7为出租车轨迹匹配准确率的直方图;图8为测试轨迹长度变化对匹配准确率影响的折线图;图9为测试轨迹长度变化对匹配准确率影响的结果图。具体实施方式下面结合具体实施例,进一步阐述本专利技术。应理解,这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围。此外应理解,在阅读了本专利技术讲授的内容之后,本领域技术人员可以对本专利技术作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。本专利技术的实施方式涉及一种根据出租车停车记录对出租车的匿名移动轨迹进行去匿名的方法,如图1所示,包括去除上下客停车并划分载人停车与空载停车;去除载人停车的异常点,对载人停车建模;根据模型去除空载停车中等交通灯和堵车的停车点而保留兴趣停车点;构造兴趣停车点的特征向量并进行轨迹匹配,其中:除上下客停车并划分载人停车与空载停车,用于区分出停车点的类型,它是对出租车停车点进行分类的准备工作。去除载人停车的异常点,用于获取载人停车点中的等交通灯和堵车的停车点,用它来训练One-classSVM分类器,以区分停车点是否为堵车和等交通灯的停车点。根据训练好的SVM分类器,去除空载停车中等交通灯和堵车的停车点而保留兴趣停车点,从而获取反映出租车驾驶员意图的兴趣停车点。构造轨迹特征向量并进行轨迹匹配,用于识别出相应的车辆的移动轨迹,并验证匹配的准确性。本实施方式采用上海(906辆)和深圳(1945辆)的出租车GPS报告数据,将其作为原始移动轨迹数据集。每条轨迹数据包含的具体信息有:车辆的编号ID,当前位置,当前位置的经纬度,时间戳,驾驶速度,车辆的行驶角度和运动状态。运动状态能显示出租车是否载人。并且在上海和深圳的路网中每条路段和每个交叉路口在各自路网中有唯一的编号。在处理轨迹数据前,要先对轨迹进行预处理。由于GPS的定位存在误差,因此先要借助电子地图中的路网信息进行位置矫正,将轨迹都恢复到道路上,并确定车辆相对于地图的位置。通过使用ST-Matching地图匹配算法将轨迹的GPS点映射到相应的路段上。数据集中每个GPS日志文件中记录了一辆出租车一整天的运动轨迹。将车辆的完整轨迹以天为单位进行划分成若干子轨迹本文档来自技高网
...

【技术保护点】
1.一种基于停车记录对车辆匿名的移动轨迹数据去匿名的方法,其特征在于,获得某一出租车任意时间段的若干移动轨迹片段,利用持有轨迹与匿名轨迹集中的轨迹相比较识别该出租车的轨迹,包括以下步骤:(1)提取轨迹中所有停车点,去除上下客造成的停车,将停车划分为载人停车与空载停车,其中,载人停车包括等交通灯造成的停车和堵车造成的停车;(2)去除载人停车的异常点,并对载人停车进行建模;(3)用所得模型去除空载停车点中的等交通灯和堵车停车,保留兴趣停车点;(4)对兴趣停车点构造基于TF‑IDF的特征向量,将已知轨迹的特征向量与匿名轨迹的特征向量相比对,找出匿名轨迹集合中与已知轨迹匹配的匿名轨迹。

【技术特征摘要】
1.一种基于停车记录对车辆匿名的移动轨迹数据去匿名的方法,其特征在于,获得某一出租车任意时间段的若干移动轨迹片段,利用持有轨迹与匿名轨迹集中的轨迹相比较识别该出租车的轨迹,包括以下步骤:(1)提取轨迹中所有停车点,去除上下客造成的停车,将停车划分为载人停车与空载停车,其中,载人停车包括等交通灯造成的停车和堵车造成的停车;(2)去除载人停车的异常点,并对载人停车进行建模;(3)用所得模型去除空载停车点中的等交通灯和堵车停车,保留兴趣停车点;(4)对兴趣停车点构造基于TF-IDF的特征向量,将已知轨迹的特征向量与匿名轨迹的特征向量相比对,找出匿名轨迹集合中与已知轨迹匹配的匿名轨迹。2.根据权利要求1所述的基于停车记录对车辆匿名的移动轨迹数据去匿名的方法,其特征在于,所述步骤(1)具体为:从轨迹集中筛选出位置不随时间变化的点,视其为停车点,根据出租车轨迹集中的停车前后的载人状态判断是否为上下客停车。3.根据权利要求1所述的基于停车记录对车辆匿名的移动轨迹数据去匿名的方法,其特征在于,所述步骤(2)中用dura表示停车时间,dist表示停车点到路口的距离,inter表示两个停车点的间隔时间,构造特征向量Stp=(dura,dist,inter),使用马氏距离去除载人停车的异常点。4.根据权利要求3所述的基于停车记录对车辆匿名的移动轨迹数据去匿名的方法,其特征在于,所述使用马氏距离去除载人停车的异常点具体为:设定马氏距离的阈...

【专利技术属性】
技术研发人员:常姗张科陈航曹迪胡星刚
申请(专利权)人:东华大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1