【技术实现步骤摘要】
基于“自下而上”策略的GPS轨迹出行方式链识别方法
[0001]本专利技术属于交通数据挖掘领域,尤其涉及一种基于“自下而上”策略的GPS轨迹出行方式链识别方法。
技术介绍
[0002]基于交通时空轨迹数据挖掘居民出行方式等特征,是数据驱动下城市交通规划的关键技术。利用智能手机采集个体GPS轨迹数据,作为城市居民出行调查的新兴手段,可同步收集个体出行GPS轨迹与真实出行方式,有利于模型训练与结果验证。现有基于GPS轨迹数据的出行方式识别方法中,绝大多数采用“自上而下”的策略,主要步骤包括:先提取停驻,将轨迹切分为出行;再提取交通方式换乘点,将出行分割为单方式出行段;最后利用算法识别单方式段的出行方式。该方法的主要问题在于:对于没有明显停留特征的方式换乘点提取困难,且易因方式换乘点过度提取或遗漏而引起交通方式识别错误;不同交通方式出行段之间长度与运动特征相差较大,不利于特征提取与机器学习模型应用,数据处理效率较低。
技术实现思路
[0003]为解决上述技术问题,本专利技术的目的在于提供一种基于“自下而上”策略的GPS轨迹出行方式链识别方法,用于个体多种交通工具出行下的GPS轨迹处理与出行方式链识别。
[0004]实现本专利技术目的的技术方案为:一种基于“自下而上”策略的GPS轨迹出行方式链识别方法,包括如下步骤:
[0005]S1、从采集的个体GPS轨迹数据中提取时空信息,计算相邻轨迹点之间的运动特征,设定规则过滤GPS信号漂移点,并弥补轨迹点序列中缺失数据,将轨迹转换为设定频率的时间序列 ...
【技术保护点】
【技术特征摘要】
1.一种基于“自下而上”策略的GPS轨迹出行方式链识别方法,其特征在于,包括如下步骤:S1、从采集的个体GPS轨迹数据中提取时空信息,计算相邻轨迹点之间的运动特征,设定规则过滤GPS信号漂移点,并弥补轨迹点序列中缺失数据,将轨迹转换为设定频率的时间序列;S2、定义时间滑窗大小与滑窗重叠率,将所述时间序列切分为固定长度的片段单元;S3、计算轨迹点的速度、加速度、方向变化率,提取所述片段单元的特征向量;S4、按照步骤S1~S3提取带有出行方式标签的样本轨迹数据的片段单元特征向量,以标注的出行方式为因变量,建立随机森林模型并对其进行训练,利用训练好的随机森林模型预测步骤S3所述片段单元的出行方式;S5、对所述的片段单元出行方式序列,采用相邻同质合并算法,将无规律的出行方式序列转变为连续稳定的出行方式标签;S6、将连续相同出行方式标签的片段单元转换为单方式出行段,输出GPS轨迹中的出行方式链。2.根据权利要求1所述的基于“自下而上”策略的GPS轨迹出行方式链识别方法,其特征在于,相邻轨迹点之间的运动特征包括速度v
i
和加速度a
i
,分别表示为:,分别表示为:其中,n为出行结束轨迹点标号,t
i
为第i个轨迹点的时刻,x
i
,y
i
分别为经纬度转平面坐标系值。3.根据权利要求1所述的基于“自下而上”策略的GPS轨迹出行方式链识别方法,其特征在于,过滤GPS信号漂移点的规则为:将速度和加速度绝对值从大到小排列,去除GPS轨迹数据集中速度和加速度绝对值前1%的轨迹点。4.根据权利要求1所述的基于“自下而上”策略的GPS轨迹出行方式链识别方法,其特征在于,采用平均插值法弥补轨迹点序列中缺失数据,对于轨迹缺失片段{P
i
,P
i+m
},m>1,填补P
i
与P
i+m
之间缺失点{P
i+l
},0<l<m,其中P
i+l
=(t
i+l
,x
i+l
,y
i+l
),其位置坐标x
i+l
,y
i+l
分别表示为:表示为:轨迹缺失片段{P
i
,P
i+m
}填补后成为片段{P
i
,P
i+1
,...,P
i+m
‑1,P
i+m
},相邻轨迹点的时间间隔为1秒;对于每一个轨迹点P
i
,增加缺失变量g
i
,若P
i
为原始轨迹点则g
i
为0,若为插值补充点则g
i
为1,将原始GPS轨迹数据转变为D={P
i
},i=1,...,n,其中P
i
=(t
i
,x
i
,y
i
,g
i
)。5.根据权利要求1所述的基于“自下而上”策略的GPS轨迹出行方式链识别方法,其特征在于,步骤2中时间滑窗的时间长度为s,s<<n,对于GPS轨迹数据D={P
i
},从第一个轨迹点P1滑至最后一个轨迹点P
n
,前后滑窗之间的重叠率为r,0≤r<1,滑窗之间重叠长度为rs,
若最后滑窗轨迹点时间长度小于s/2,则去除;所述片段单元序列U={u
j
},j=1,...,N,其中u<...
【专利技术属性】
技术研发人员:周洋,郭唐仪,何流,周竹萍,唐坤,徐永能,
申请(专利权)人:南京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。