基于“自下而上”策略的GPS轨迹出行方式链识别方法技术

技术编号：34689223 阅读：17 留言：0更新日期：2022-08-27 16:23

本发明专利技术公开了一种基于“自下而上”策略的GPS轨迹出行方式链识别方法，包括如下步骤：基于个体GPS轨迹数据，根据运动特征去除GPS信号漂移点，以插值法填补轨迹缺失点，将出行轨迹转换为相同间隔的时间序列；设置时间滑窗，以一定的重叠率从出行起点滑动窗口至终点，将出行轨迹切分为固定时长的片段单元；提取片段单元的特征，根据训练的机器学习模型预测各片段的出行方式；对出行方式序列编码，以相邻同质合并算法，校正片段单元序列中不规律的出行方式，并将相邻同出行方式标签的片段合并为单方式出行段，通过权重解码输出出行方式链。本发明专利技术能高效率识别GPS轨迹数据中的出行方式链，为轨迹数据挖掘与出行特征标注提供技术支撑。为轨迹数据挖掘与出行特征标注提供技术支撑。为轨迹数据挖掘与出行特征标注提供技术支撑。

全部详细技术资料下载

【技术实现步骤摘要】
基于“自下而上”策略的GPS轨迹出行方式链识别方法

[0001]本专利技术属于交通数据挖掘领域，尤其涉及一种基于“自下而上”策略的GPS轨迹出行方式链识别方法。

技术介绍

[0002]基于交通时空轨迹数据挖掘居民出行方式等特征，是数据驱动下城市交通规划的关键技术。利用智能手机采集个体GPS轨迹数据，作为城市居民出行调查的新兴手段，可同步收集个体出行GPS轨迹与真实出行方式，有利于模型训练与结果验证。现有基于GPS轨迹数据的出行方式识别方法中，绝大多数采用“自上而下”的策略，主要步骤包括：先提取停驻，将轨迹切分为出行；再提取交通方式换乘点，将出行分割为单方式出行段；最后利用算法识别单方式段的出行方式。该方法的主要问题在于：对于没有明显停留特征的方式换乘点提取困难，且易因方式换乘点过度提取或遗漏而引起交通方式识别错误；不同交通方式出行段之间长度与运动特征相差较大，不利于特征提取与机器学习模型应用，数据处理效率较低。

技术实现思路

[0003]为解决上述技术问题，本专利技术的目的在于提供一种基于“自下而上”策略的GPS轨迹出行方式链识别方法，用于个体多种交通工具出行下的GPS轨迹处理与出行方式链识别。
[0004]实现本专利技术目的的技术方案为：一种基于“自下而上”策略的GPS轨迹出行方式链识别方法，包括如下步骤：
[0005]S1、从采集的个体GPS轨迹数据中提取时空信息，计算相邻轨迹点之间的运动特征，设定规则过滤GPS信号漂移点，并弥补轨迹点序列中缺失数据，将轨迹转换为设定频率的时间序列...

【技术保护点】

【技术特征摘要】
1.一种基于“自下而上”策略的GPS轨迹出行方式链识别方法，其特征在于，包括如下步骤：S1、从采集的个体GPS轨迹数据中提取时空信息，计算相邻轨迹点之间的运动特征，设定规则过滤GPS信号漂移点，并弥补轨迹点序列中缺失数据，将轨迹转换为设定频率的时间序列；S2、定义时间滑窗大小与滑窗重叠率，将所述时间序列切分为固定长度的片段单元；S3、计算轨迹点的速度、加速度、方向变化率，提取所述片段单元的特征向量；S4、按照步骤S1～S3提取带有出行方式标签的样本轨迹数据的片段单元特征向量，以标注的出行方式为因变量，建立随机森林模型并对其进行训练，利用训练好的随机森林模型预测步骤S3所述片段单元的出行方式；S5、对所述的片段单元出行方式序列，采用相邻同质合并算法，将无规律的出行方式序列转变为连续稳定的出行方式标签；S6、将连续相同出行方式标签的片段单元转换为单方式出行段，输出GPS轨迹中的出行方式链。2.根据权利要求1所述的基于“自下而上”策略的GPS轨迹出行方式链识别方法，其特征在于，相邻轨迹点之间的运动特征包括速度v
i
和加速度a
i
，分别表示为：，分别表示为：其中，n为出行结束轨迹点标号，t
i
为第i个轨迹点的时刻，x
i
，y
i
分别为经纬度转平面坐标系值。3.根据权利要求1所述的基于“自下而上”策略的GPS轨迹出行方式链识别方法，其特征在于，过滤GPS信号漂移点的规则为：将速度和加速度绝对值从大到小排列，去除GPS轨迹数据集中速度和加速度绝对值前1％的轨迹点。4.根据权利要求1所述的基于“自下而上”策略的GPS轨迹出行方式链识别方法，其特征在于，采用平均插值法弥补轨迹点序列中缺失数据，对于轨迹缺失片段{P
i
，P
i+m
}，m＞1，填补P
i
与P
i+m
之间缺失点{P
i+l
}，0＜l＜m，其中P
i+l
＝(t
i+l
，x
i+l
，y
i+l
)，其位置坐标x
i+l
，y
i+l
分别表示为：表示为：轨迹缺失片段{P
i
，P
i+m
}填补后成为片段{P
i
，P
i+1
，...，P
i+m
‑1，P
i+m
}，相邻轨迹点的时间间隔为1秒；对于每一个轨迹点P
i
，增加缺失变量g
i
，若P
i
为原始轨迹点则g
i
为0，若为插值补充点则g
i
为1，将原始GPS轨迹数据转变为D＝{P
i
}，i＝1，...，n，其中P
i
＝(t
i
，x
i
，y
i
，g
i
)。5.根据权利要求1所述的基于“自下而上”策略的GPS轨迹出行方式链识别方法，其特征在于，步骤2中时间滑窗的时间长度为s，s＜＜n，对于GPS轨迹数据D＝{P
i
}，从第一个轨迹点P1滑至最后一个轨迹点P
n
，前后滑窗之间的重叠率为r，0≤r＜1，滑窗之间重叠长度为rs，
若最后滑窗轨迹点时间长度小于s/2，则去除；所述片段单元序列U＝{u
j
}，j＝1，...，N，其中u<...

【专利技术属性】
技术研发人员：周洋，郭唐仪，何流，周竹萍，唐坤，徐永能，
申请(专利权)人：南京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人