基于“自下而上”策略的GPS轨迹出行方式链识别方法技术

技术编号:34689223 阅读:17 留言:0更新日期:2022-08-27 16:23
本发明专利技术公开了一种基于“自下而上”策略的GPS轨迹出行方式链识别方法,包括如下步骤:基于个体GPS轨迹数据,根据运动特征去除GPS信号漂移点,以插值法填补轨迹缺失点,将出行轨迹转换为相同间隔的时间序列;设置时间滑窗,以一定的重叠率从出行起点滑动窗口至终点,将出行轨迹切分为固定时长的片段单元;提取片段单元的特征,根据训练的机器学习模型预测各片段的出行方式;对出行方式序列编码,以相邻同质合并算法,校正片段单元序列中不规律的出行方式,并将相邻同出行方式标签的片段合并为单方式出行段,通过权重解码输出出行方式链。本发明专利技术能高效率识别GPS轨迹数据中的出行方式链,为轨迹数据挖掘与出行特征标注提供技术支撑。为轨迹数据挖掘与出行特征标注提供技术支撑。为轨迹数据挖掘与出行特征标注提供技术支撑。

【技术实现步骤摘要】
基于“自下而上”策略的GPS轨迹出行方式链识别方法


[0001]本专利技术属于交通数据挖掘领域,尤其涉及一种基于“自下而上”策略的GPS轨迹出行方式链识别方法。

技术介绍

[0002]基于交通时空轨迹数据挖掘居民出行方式等特征,是数据驱动下城市交通规划的关键技术。利用智能手机采集个体GPS轨迹数据,作为城市居民出行调查的新兴手段,可同步收集个体出行GPS轨迹与真实出行方式,有利于模型训练与结果验证。现有基于GPS轨迹数据的出行方式识别方法中,绝大多数采用“自上而下”的策略,主要步骤包括:先提取停驻,将轨迹切分为出行;再提取交通方式换乘点,将出行分割为单方式出行段;最后利用算法识别单方式段的出行方式。该方法的主要问题在于:对于没有明显停留特征的方式换乘点提取困难,且易因方式换乘点过度提取或遗漏而引起交通方式识别错误;不同交通方式出行段之间长度与运动特征相差较大,不利于特征提取与机器学习模型应用,数据处理效率较低。

技术实现思路

[0003]为解决上述技术问题,本专利技术的目的在于提供一种基于“自下而上”策略的GPS轨迹出行方式链识别方法,用于个体多种交通工具出行下的GPS轨迹处理与出行方式链识别。
[0004]实现本专利技术目的的技术方案为:一种基于“自下而上”策略的GPS轨迹出行方式链识别方法,包括如下步骤:
[0005]S1、从采集的个体GPS轨迹数据中提取时空信息,计算相邻轨迹点之间的运动特征,设定规则过滤GPS信号漂移点,并弥补轨迹点序列中缺失数据,将轨迹转换为设定频率的时间序列
[0006]S2、定义时间滑窗大小与滑窗重叠率,将所述时间序列切分为固定长度的片段单元;
[0007]S3、计算轨迹点的速度、加速度、方向变化率,提取所述片段单元的特征向量;
[0008]S4、按照步骤S1~S3提取带有出行方式标签的样本轨迹数据的片段单元特征向量,以标注的出行方式为因变量,建立随机森林模型并对其进行训练,利用训练好的随机森林模型预测步骤S3所述片段单元的出行方式;
[0009]S5、对所述的片段单元出行方式序列,采用相邻同质合并算法,将无规律的出行方式序列转变为连续稳定的出行方式标签;
[0010]S6、将连续相同出行方式标签的片段单元转换为单方式出行段,输出GPS轨迹中的出行方式链。
[0011]优选地,相邻轨迹点之间的运动特征包括速度v
i
和加速度a
i
,分别表示为:
[0012][0013][0014]其中,n为出行结束轨迹点标号,t
i
为第i个轨迹点的时刻,x
i
,y
i
分别为经纬度转平面坐标系值。
[0015]优选地,过滤GPS信号漂移点的规则为:将速度和加速度绝对值从大到小排列,去除GPS轨迹数据集中速度和加速度绝对值前1%的轨迹点。
[0016]优选地,采用平均插值法弥补轨迹点序列中缺失数据,对于轨迹缺失片段{P
i
,P
i+m
},m>1,填补P
i
与P
i+m
之间缺失点{P
i+l
},0<l<m,其中P
i+l
=(t
i+l
,x
i+l
,y
i+l
),其位置坐标x
i+l
,y
i+l
分别表示为:
[0017][0018][0019]轨迹缺失片段{P
i
,P
i+m
}填补后成为片段{P
i
,P
i+1
,

,P
i+m
‑1,P
i+m
},相邻轨迹点的时间间隔为1秒;对于每一个轨迹点P
i
,增加缺失变量g
i
,若P
i
为原始轨迹点则g
i
为0,若为插值补充点则g
i
为1,将原始GPS轨迹数据转变为D={P
i
},i=1,

,n,其中P
i
=(t
i
,x
i
,y
i
,g
i
)。
[0020]优选地,步骤2中时间滑窗的时间长度为s,s<<n,对于GPS轨迹数据D={P
i
},从第一个轨迹点P1滑至最后一个轨迹点P
n
,前后滑窗之间的重叠率为r,0≤r<1,滑窗之间重叠长度为rs,若最后滑窗轨迹点时间长度小于s/2,则去除;所述片段单元序列U={u
j
},j=1,

,N,其中u
j
={P
b
,

,P
c
},c=b+s

1,b,c分别为片段单元u
j
内轨迹点的起止标号,表示为:
[0021]b=s
·
(1

r)
·
j
[0022][0023]片段单元数目N表示为:
[0024][0025]其中,[
·
]为取整函数。
[0026]优选地,步骤3中片段单元u
j
={P
i
},i={b,

,c},其轨迹点P
i
的速度v
i
、加速度a
i
、方向变化率w
i
,分别表示为:
[0027][0028][0029][0030]t
i
为第i个轨迹点的时刻,x
i
,y
i
分别为经纬度转平面坐标系值,b,c分别为片段单元u
j
内轨迹点的起止标号。
[0031]优选地,提取的片段单元的特征向量包括:平均速度第15个百分位速度第95个百分位速度平均加速度第15个百分位加速度第95个百分位加速度平均方向变化率第15个百分位方向变化率第95个百分位方向变化率轨迹点缺失率γ
i
,分别表示为:
[0032][0033][0034][0035][0036][0037][0038][0039][0040][0041][0042]c=b+s

1,b,c分别为片段单元u
j
内轨迹点的起止标号,对于第i个轨迹点,若缺失,则g
i
=1,否则g
i
=0;
[0043]其中Percentile(x,15)和Percentile(x,95)分别为第15个与第95个百分位数函数;
[0044]所述特征向量为
[0045]优选地,采用相邻同质合并算法,将无规律的出行方式序列转变为连续稳定的出行方式本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于“自下而上”策略的GPS轨迹出行方式链识别方法,其特征在于,包括如下步骤:S1、从采集的个体GPS轨迹数据中提取时空信息,计算相邻轨迹点之间的运动特征,设定规则过滤GPS信号漂移点,并弥补轨迹点序列中缺失数据,将轨迹转换为设定频率的时间序列;S2、定义时间滑窗大小与滑窗重叠率,将所述时间序列切分为固定长度的片段单元;S3、计算轨迹点的速度、加速度、方向变化率,提取所述片段单元的特征向量;S4、按照步骤S1~S3提取带有出行方式标签的样本轨迹数据的片段单元特征向量,以标注的出行方式为因变量,建立随机森林模型并对其进行训练,利用训练好的随机森林模型预测步骤S3所述片段单元的出行方式;S5、对所述的片段单元出行方式序列,采用相邻同质合并算法,将无规律的出行方式序列转变为连续稳定的出行方式标签;S6、将连续相同出行方式标签的片段单元转换为单方式出行段,输出GPS轨迹中的出行方式链。2.根据权利要求1所述的基于“自下而上”策略的GPS轨迹出行方式链识别方法,其特征在于,相邻轨迹点之间的运动特征包括速度v
i
和加速度a
i
,分别表示为:,分别表示为:其中,n为出行结束轨迹点标号,t
i
为第i个轨迹点的时刻,x
i
,y
i
分别为经纬度转平面坐标系值。3.根据权利要求1所述的基于“自下而上”策略的GPS轨迹出行方式链识别方法,其特征在于,过滤GPS信号漂移点的规则为:将速度和加速度绝对值从大到小排列,去除GPS轨迹数据集中速度和加速度绝对值前1%的轨迹点。4.根据权利要求1所述的基于“自下而上”策略的GPS轨迹出行方式链识别方法,其特征在于,采用平均插值法弥补轨迹点序列中缺失数据,对于轨迹缺失片段{P
i
,P
i+m
},m>1,填补P
i
与P
i+m
之间缺失点{P
i+l
},0<l<m,其中P
i+l
=(t
i+l
,x
i+l
,y
i+l
),其位置坐标x
i+l
,y
i+l
分别表示为:表示为:轨迹缺失片段{P
i
,P
i+m
}填补后成为片段{P
i
,P
i+1
,...,P
i+m
‑1,P
i+m
},相邻轨迹点的时间间隔为1秒;对于每一个轨迹点P
i
,增加缺失变量g
i
,若P
i
为原始轨迹点则g
i
为0,若为插值补充点则g
i
为1,将原始GPS轨迹数据转变为D={P
i
},i=1,...,n,其中P
i
=(t
i
,x
i
,y
i
,g
i
)。5.根据权利要求1所述的基于“自下而上”策略的GPS轨迹出行方式链识别方法,其特征在于,步骤2中时间滑窗的时间长度为s,s<<n,对于GPS轨迹数据D={P
i
},从第一个轨迹点P1滑至最后一个轨迹点P
n
,前后滑窗之间的重叠率为r,0≤r<1,滑窗之间重叠长度为rs,
若最后滑窗轨迹点时间长度小于s/2,则去除;所述片段单元序列U={u
j
},j=1,...,N,其中u<...

【专利技术属性】
技术研发人员:周洋郭唐仪何流周竹萍唐坤徐永能
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1