一种移动轨迹数据补全方法技术

技术编号:28976080 阅读:9 留言:0更新日期:2021-06-23 09:20
本发明专利技术公开一种移动轨迹数据补全方法,数据完整度高。本发明专利技术的移动轨迹数据补全方法,包括以下步骤:(10)异常轨迹数据过滤:剔除原始数据中的越界数据、冗余数据、空值和稀疏轨迹点数据;(20)缺失轨迹数据识别:根据相邻轨迹点的距离和采集时间是否超过阈值,识别出缺失轨迹数据;(30)轨迹数据均值填充:根据移动轨迹采样频率和移动速度,得到缺失轨迹的搜索半径,采用均值法得到缺失数据端点的经纬度估计值,以该估计值对缺失轨迹数据进行填充。

【技术实现步骤摘要】
一种移动轨迹数据补全方法
本专利技术涉及移动通信和大数据挖掘
,特别涉及一种移动轨迹数据补全方法。
技术介绍
随着基于位置的服务的迅猛发展,大量的移动轨迹数据可以获得并应用于不同的领域。但由于数据缺失问题不能直接对人群的轨迹数据精准识别和管理。移动轨迹数据缺失原因:用户轨迹数据是由诸如GPS等的GNSS设备采集的,但是由于设备本身可能存在故障,导致采集的轨迹数据产生定位误差或者固有误差,而且在某些特殊的情况下,GNSS设备会受定位精度、采集频率以及系统误差的影响,容易出现没有采集或记录的现象,从而导致采集的轨迹数据出现部分缺失。通常来说,引起数据不准确或者缺失的原因主要包括以下几点:(1)信号被屏蔽或者不良一般来说,GNSS设备在隧道、地铁中经常出现信息中断或无法接收信号,这就属于信号被屏蔽或者信号不良。因此,当车辆在诸如地下通道或者隧道中行驶时,可能会出现GNSS信号接收中断的现象,这样会导致采集的轨迹数据大量丢失。(2)设备故障或其它误操作每个设备都会有出故障的时候,GNSS设备也不例外。比如当GNSS设备的电池耗尽或者仪器故障时,则不能正常采集数据,毕竟GNSS设备的电池容量是有限的。一旦出现这种情况或其他误操作,都会导致采集到的数据缺失。(3)通信异常由于通信装置以及GNSS设备会出现稳定性故障等异常现象,会导致采集的数据出现错误等情况。(4)冷启动GNSS设备有两种启动方式,一种是冷启动,另一种是热启动。所谓冷启动是指GNSS设备在长时间的关闭后,进行再次启动,由于再次启动需要重新下载星历信息,可能会导致信号发生延迟,因而导致数据丢失。目前对于缺失轨迹数据的解决方法主要有以下几种:1、最短路径填补算法,最短路径填补是一种利用起始点和结束点位置,在两点间线性插补方法。在直线移动轨迹中填补效果良好,但现实轨迹中存在大量方向转移,填补效果偏差较大。2、GNSS轨道轨迹数据补全最优路径,首先根据信号缺失的时间差、路径的节点新建GNSS记录,插入到GNSS记录信号缺失部分;再根据信号缺失点前后的交通方式更新OD(Origin-DestinationMatrix)矩阵:若信号缺失前后均为轨道交通,则直接插入一条交通方式为轨道交通的记录;若信号缺失前后均不是轨道交通,则分别将信号缺失起点到轨道交通起始节点的步行记录、一条轨道交通记录、轨道交通终止节点到信号缺失终点的步行记录,依此类推,最后完成OD矩阵的合并。2、基于历史车辆位置轨迹的路径推理系统(HRIS),HRIS系统是一个针对低采样率轨迹的系统解决方案,该系统从历史车辆位置轨迹中挖掘行车模式对低采样率位置轨迹进行路径推理。它可以降低这类轨迹的不确定性,给出一个可能的匹配。但是该统方案在采样间隔更大时却并不适用。3、模式挖掘填补法,对用户历史数据进行挖掘,找出历史数据中的频繁移动模式。根据空缺轨迹段所属移动模式,利用历史轨迹进行填补。当空缺轨迹在历史轨迹中无法得到频繁模式时,填补失败。4、神经网络填补法,设计基于长短时记忆神经网络的补全模型,使用待补全站时间序列中可用的数据训练模型,合并使用日期数据增强训练效果,使模型学习到蕴含在序列中的时空相关知识。当原有时间序列中有大量缺失时效果存在波动。5、概率密度插补法,计算某段时间或某两点间最频繁路径作为插补序列进行填补。当空缺轨迹在历史轨迹中无法得到频繁模式时,填补失败。以上方法在研究填补数据空缺时缺乏分步进行的操作,有的方法过于追求填补时的效率,在恢复数据完整度方面表现不佳。
技术实现思路
本专利技术的目的在于提供一种移动轨迹数据补全方法,能够使数据完整度高。为了解决上述技术问题,本专利技术的技术方案为:一种移动轨迹数据补全方法,包括以下步骤:(10)异常轨迹数据过滤:剔除原始数据中的越界数据、冗余数据、空值和稀疏轨迹点数据;(20)缺失轨迹数据识别:根据相邻轨迹点的距离和采集时间是否超过阈值,识别出缺失轨迹数据;(30)轨迹数据均值填充:根据移动轨迹采样频率和移动速度,得到缺失轨迹的搜索半径,采用均值法得到缺失数据端点的经纬度估计值,以该估计值对缺失轨迹数据进行填充。与现有技术相比,本专利技术的显著优点为:数据完整度高:本专利技术针对移动轨迹数据补全,首先对轨迹数据中异常的数据进行剔除,然后对于缺失的轨迹数据,利用距离和时间阈值将其识别,最后利用估计值的均值进行缺失数据的填充;本专利利用剔除异常数据,识别缺失轨迹,均值轨迹填充三步走策略,能够有效提高缺失轨迹数据补全的准确率,增强移动数据的可信度。附图说明图1为本专利技术移动轨迹数据补全方法的主流程图。图2为图1中异常轨迹数据过滤步骤的流程图。图3为图1中缺失轨迹数据识别步骤的流程图。图4为图1中轨迹数据均值填充步骤的流程图。具体实施方式如图1所示,本专利技术移动轨迹数据补全方法,包括以下步骤:(10)异常轨迹数据过滤:剔除原始数据中的越界数据、冗余数据、空值和稀疏轨迹点数据;如图2所示,所述(10)异常轨迹数据过滤步骤包括:(11)剔除越界数据:根据轨迹范围,剔除超出该范围的轨迹进行剔除;例如若轨迹范围在南京,则对不在南京范围内的轨迹数据,即经度不在118°22″至119°14″之间,纬度也不在31°14″至32°37″之间的轨迹进行剔除。(12)剔除冗余数据:保留同一时间点内采集到的相似轨迹数据中的中心轨迹点数据,剔除其余数据;轨迹数据在同一个时间点内采集到多个轨迹点,但轨迹点绝大多数都是很相似的,保留中心的轨迹点,其他的剔除。(13)剔除空值:剔除原始数据中记录值为空数据;对原始数据的检测分析,能够发现原始数据中存在着记录值为空的情况,如果是研究所需的数据为空,意味着该数据为无效值,因此也应该剔除。(14)剔除稀疏轨迹点数据:剔除轨迹点数少于下限个数的轨迹数据。当轨迹点少于下限个数n个时,导致轨迹过短,不利于对轨迹进行研究,应予以剔除。(20)缺失轨迹数据识别:根据相邻轨迹点的距离和采集时间是否超过阈值,识别出缺失轨迹数据;车辆在行驶的过程中,由于卫星信号异常、通讯失常以及设备异常或者经过被高楼遮挡时,则不能及时上传车辆的位置信息,因此导致车辆的轨迹数据出现缺失,然而缺失的轨迹数据会严重影响数据分析结果,极大的降低了结果的准确性。因此,缺失轨迹进行识别是一项非常重要的工作。如图3所示,所述(20)缺失轨迹数据识别步骤包括:(21)相邻轨迹点经纬度差计算:按下式计算两个相邻轨迹点的经纬度差值,(22)相邻轨迹点距离计算:按下式计算两个相邻轨迹点的距离,式中,LonA是第一个轨迹点的经度,LonB是第二个轨迹点的经度,LatA是第一个轨迹点的纬度,LatB是第二个轨迹点的纬度,Dlon为两个轨迹点的精度差,Dlat为纬度差,Dist本文档来自技高网
...

【技术保护点】
1.一种移动轨迹数据补全方法,其特征在于,包括以下步骤:/n(10)异常轨迹数据过滤:剔除原始数据中的越界数据、冗余数据、空值和稀疏轨迹点数据;/n(20)缺失轨迹数据识别:根据相邻轨迹点的距离和采集时间是否超过阈值,识别出缺失轨迹数据;/n(30)轨迹数据均值填充:根据移动轨迹采样频率和移动速度,得到缺失轨迹的搜索半径,采用均值法得到缺失数据端点的经纬度估计值,以该估计值对缺失轨迹数据进行填充。/n

【技术特征摘要】
1.一种移动轨迹数据补全方法,其特征在于,包括以下步骤:
(10)异常轨迹数据过滤:剔除原始数据中的越界数据、冗余数据、空值和稀疏轨迹点数据;
(20)缺失轨迹数据识别:根据相邻轨迹点的距离和采集时间是否超过阈值,识别出缺失轨迹数据;
(30)轨迹数据均值填充:根据移动轨迹采样频率和移动速度,得到缺失轨迹的搜索半径,采用均值法得到缺失数据端点的经纬度估计值,以该估计值对缺失轨迹数据进行填充。


2.根据权利要求1所述的移动轨迹数据补全方法,其特征在于,所述(10)异常轨迹数据过滤步骤包括:
(11)剔除越界数据:根据轨迹范围,剔除超出该范围的轨迹进行剔除;
(12)剔除冗余数据:保留同一时间点内采集到的相似轨迹数据中的中心轨迹点数据,剔除其余数据;
(13)剔除空值:剔除原始数据中记录值为空数据;
(14)剔除稀疏轨迹点数据:剔除轨迹点数少于下限个数的轨迹数据。


3.根据权利要求2所述的移动轨迹数据补全方法,其特征在于,所述(20)缺失轨迹数据识别步骤包括:
(21)相邻轨迹点经纬度差...

【专利技术属性】
技术研发人员:叶芝慧陈浩
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1