System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于GPS数据及时空关联性的公交到站时间预测方法及系统技术方案_技高网

基于GPS数据及时空关联性的公交到站时间预测方法及系统技术方案

技术编号:41069062 阅读:4 留言:0更新日期:2024-04-24 11:24
本发明专利技术公开了基于GPS数据及时空关联性的公交到站时间预测方法及系统,属于智能公交领域,方法包括:利用公交线路数据对原始GPS数据进行趟次划分、地图匹配和到站时间提取;利用公交到站时间,提取包括同一趟公交的站间行程时间序列、同一站基于时段均值的站间行程时间序列和同一点基于时段均值的车头时距序列在内的三类序列数据;利用LSTM模型、Seq2Seq结构、注意力机制搭建预测模型,分别对上述三类序列进行序列预测;分别利用三类预测结果构建包含时空信息的特征;结合新特征与原始GPS中的特征,利用XGBoost模型进行多站点的公交到站时间预测,模型采用网格搜索调优。本发明专利技术充分挖掘了GPS数据中包含的时空相关性信息,能有效提升公交到站时间预测准确率。

【技术实现步骤摘要】

本专利技术属于智能公交领域,更具体地,涉及一种基于gps数据及时空关联性的公交到站时间预测方法及系统。


技术介绍

1、随着城市化进程的不断推进,空气污染问题与交通拥堵问题日益严重,阻碍社会发展,开展公共交通建设能够有效改善该问题。但受限于市区内公交车到达时间和行程时间的不确定性,许多乘客仍反感乘坐公交车出行。因此,提供准确的公交到站时间信息能够提高乘客的公交出行意愿。在实际运营中,公交到站时间通过预测每辆公交车从当前位置到后续多个站点的剩余行程时间获得。

2、在公交到站时间预测算法方面,历史平均模型、时间序列分析模型、卡尔曼滤波模型以及机器学习模型等方法都得到了广泛的应用。在实际运营中,公交到站时间受多种随机因素的影响,并且这些因素之间往往相互关联。机器学习模型擅长从数据中捕捉非线性关系与复杂的潜在模式,并且不同的机器学习模型拥有各自的优缺点。因此,构建包含多个机器学习算法的组合模型用于公交到站时间预测正成为当下的趋势。但如何针对公交到站时间预测问题中数据的不同特点,针对性地选择并组合不同机器学习模型,仍缺少充分的研究。

3、在数据源与预测特征方面,由于多源数据的成本问题与可靠性问题,gps数据仍是用于公交到站时间预测的主流数据,但其中包含的信息仍有待于深度挖掘。具体来说,利用gps数据进行公交到站时间预测的主流方法主要分为两类。一类利用公交车gps数据中包含的经纬度、瞬时速度等实时信息与线路信息结合,构造特征直接用于剩余到站时间的预测。另一类则是先从gps数据中提取出公交运营的序列数据,再通过lstm等循环神经网络进行序列预测,以期捕获其中暗含的时空关系。其中,前者采用的实时特征过于强调公交车的当前状态,没有充分挖掘并利用gps数据中包含的信息。后者则是无法对公交运营过程中可能出现的临时堵车等突发事件做出迅速的反应,并且现有的研究往往只关注部分序列数据,没有对公交运营过程中的多种序列数据进行充分挖掘。

4、总体而言,上述利用公交车gps数据进行到站时间预测的方法要么没有充分地挖掘其中可提取的序列数据,忽略了部分时空相关性信息;要么没有将序列数据的预测结果与实时gps特征结合,限制了模型在短期预测和长期预测下的综合表现,导致剩余公交到站时间的预测精度较低。


技术实现思路

1、针对现有技术的以上缺陷和改进需求,本专利技术提供了一种基于gps数据及时空关联性的公交到站时间预测方法及系统,其目的在于通过提取公交运营过程中的3类序列数据并分别进行序列预测的方式,充分挖掘gps数据中包含的时空相关性信息;通过利用序列预测结果构建新的特征并与实时特征结合的方式,提升公交剩余到站时间预测模型的预测精度,兼顾其在短期与长期预测情景下的表现。

2、为实现上述目的,本专利技术提供如下技术方案:

3、一种基于gps数据及时空关联性的公交到站时间预测方法,包括:

4、s1,公交车gps数据的预处理:利用公交站点与线路的地理信息数据,对原始公交车gps数据进行包括趟次划分、地图匹配和到站时间提取等操作在内的数据预处理;

5、s2,基于公交到站时间的序列数据提取:利用预处理获取的公交到站时间数据,分别提取包括同一趟次公交车的站间行程时间序列、同一站点的站间行程时间序列以及同一站点的到站车头时距序列在内的三类序列数据;将公交运营时间按固定的间隔划分为时段,分别计算上述第二、三类序列数据被划分到每一个时段内的数据均值,并将均值作为新的序列数据,分别称为基于时段均值的站间行程时间序列和基于时段均值的到站车头时距序列;

6、s3,基于seq2seq结构和注意力机制的序列数据预测:分别对同一趟次公交车的站间行程时间序列、基于时段均值的站间行程时间序列和基于时段均值的到站车头时距序列进行序列预测。基于seq2seq网络结构,利用lstm模型,并引入注意力机制,构建序列预测模型,分别实现对上述三类序列的多时间步预测,挖掘其中包含的时空关联性信息;

7、s4,基于序列数据预测结果的特征构建:对于每一条待预测的公交车gps记录,根据上述三类序列数据的预测结果分别计算该辆公交车到达后续多个站点的剩余时间预测值;将这些预测值作为包含时空信息的新特征与gps记录中包含的实时特征结合,作为最终进行剩余到站时间预测的特征;

8、s5,基于xgboost的公交剩余到站时间预测:分站点构建xgboost模型进行剩余到站时间预测,并采用网格搜索的方式对xgboost模型中关键的超参数进行调优。

9、进一步地,所述s1具体为:

10、s11,获取公交车gps数据和对应公交线路的地理信息数据。

11、s12,对公交车gps数据进行趟次划分,标识每条gps记录对应的趟次信息;划分过程首先筛选出每趟次公交车运营过程中的首尾gps采样点,再利用首尾采样点的时间戳划定公交趟次的运营时间范围。其中首尾采样点依据gps点与公交线路始末站的距离及变化趋势进行筛选。

12、s13,对每一趟次公交运营中收集的gps数据依次进行地图匹配,并标注每条gps记录在当前趟次下的累计行驶距离。

13、s14,提取公交到站时间,对于每趟次公交,利用公交车gps记录的时间戳与累计行驶距离,根据该公交线路上各公交站点的沿线累计距离,通过线性插值计算该趟公交到达各站点的时间,并对应计算每条gps记录对应到达后续各站点的剩余到站时间。

14、进一步地,所述s2具体为:

15、s21,提取同一趟次公交车的站间行程时间序列。利用同一趟次公交在各相邻站点的到站时间依次相减获得该趟次公交的站间行程时间序列。

16、s22,提取同一站点的站间行程时间序列。利用同一辆公交车到达下一个相邻站点的时间减去该公交车到达当前站点的时间获得该公交车在当前站点的站间行程时间,根据当前站点的公交到达顺序对各公交在该站点的站间行程时间进行排列,获得该站点的站间行程时间序列。

17、s23,提取同一站点的到站车头时距序列。利用相邻到达同一个公交站点的公交车的到站时间依次相减获得该站点的到站车头时距序列。

18、s24,提取基于时段均值的站间行程时间序列和基于时段均值的到站车头时距序列。将公交运营时间按固定的间隔划分为时段,把同一站点的站间行程时间序列和到站车头时距序列,分别根据时段进行划分。每条序列中被划分到同一个时段内的数据取均值,将获得的均值序列作为该序列基于时段均值的新序列。更进一步地,若没有数据划分到某一时段内,则本专利技术沿用前一时段的时段均值作为该时段的时段均值。

19、进一步地,所述s3的具体预测内容为:

20、s31,对每一趟次公交车的站间行程时间序列进行序列预测。对于每一个公交站点,依次利用每趟公交车在该站点前的个公交站点的站间行程时间,预测其该站点及后续共个公交站点的站间行程时间。

21、s32,对每一个站点的基于时段均值的站间行程时间序列进行序列预测。对于每一条序本文档来自技高网...

【技术保护点】

1.基于GPS数据及时空关联性的公交到站时间预测方法,其特征在于,包括:

2.如权利要求1所述的基于GPS数据及时空关联性的公交到站时间预测方法,其特征在于,所述S1包括:

3.如权利要求2所述的基于GPS数据及时空关联性的公交到站时间预测方法,其特征在于,所述S2包括:

4.如权利要求3所述的基于GPS数据及时空关联性的公交到站时间预测方法,其特征在于,所述S3中基于Seq2Seq网络结构,利用LSTM模型,并引入注意力机制,构建序列数据的多时间步预测模型。

5.如权利要求4所述的基于GPS数据及时空关联性的公交到站时间预测方法,其特征在于,所述多时间步预测具体包括:

6.如权利要求5所述的基于GPS数据及时空关联性的公交到站时间预测方法,其特征在于,所述S4包括:

7.如权利要求1所述的基于GPS数据及时空关联性的公交到站时间预测方法,其特征在于,所述的S4中构建的剩余到站时间预测模型采用XGBoost模型,用于所述XGBoost模型输入的特征包括:经度、纬度、累积行驶距离、瞬时速度、时段、平均速度、目标站点、基于第一类序列数据预测结果构建的特征、基于第二类序列数据预测结果构建的特征、基于第三类序列数据预测结果构建的特征。

8.如权利要求7所述的基于GPS数据及时空关联性的公交到站时间预测方法,其特征在于,所述的S5以GPS记录的当前站点为依据,分别构建并训练XGBoost模型,预测GPS记录对应的公交到达后续个公交站点的剩余时间。

9.如权利要求7所述的基于GPS数据及时空关联性的公交到站时间预测方法,其特征在于,所述的S5在训练XGBoost模型的过程中采用网格搜索的方式对模型的部分关键超参数依次进行自动调优,具体包括参数:n_estimators、max_depth、min_child_weight、gamma、subsample、colsample_bytree、learning_rate。

10.基于GPS数据及时空关联性的公交到站时间预测系统,其特征在于,包括:计算机可读存储介质和处理器;

...

【技术特征摘要】

1.基于gps数据及时空关联性的公交到站时间预测方法,其特征在于,包括:

2.如权利要求1所述的基于gps数据及时空关联性的公交到站时间预测方法,其特征在于,所述s1包括:

3.如权利要求2所述的基于gps数据及时空关联性的公交到站时间预测方法,其特征在于,所述s2包括:

4.如权利要求3所述的基于gps数据及时空关联性的公交到站时间预测方法,其特征在于,所述s3中基于seq2seq网络结构,利用lstm模型,并引入注意力机制,构建序列数据的多时间步预测模型。

5.如权利要求4所述的基于gps数据及时空关联性的公交到站时间预测方法,其特征在于,所述多时间步预测具体包括:

6.如权利要求5所述的基于gps数据及时空关联性的公交到站时间预测方法,其特征在于,所述s4包括:

7.如权利要求1所述的基于gps数据及时空关联性的公交到站时间预测方法,其特征在于,所述的s4中构建的剩余到站时间预测模型采用xgboost模型,用于所述xgboost模型...

【专利技术属性】
技术研发人员:王剑蔺心屹
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1