一种基于迁移学习的列车区间运行时分预测方法技术

技术编号:21225460 阅读:29 留言:0更新日期:2019-05-29 06:12
本发明专利技术公开了一种基于迁移学习的列车区间运行时分预测方法,可以在不同场景/条件下,实现针对刚开通时间不长、累积的行车数据不够充足的调度区段的列车区间运行时分的准确预测,进而实现对受干扰后的列车运行图的有效调整,尽快恢复列车有序运行,减小延误,缩小受晚点影响的列车范围,保障铁路行车安全,提高铁路运输效率和旅客满意度。

A Method of Train Section Running Segment Prediction Based on Migration Learning

The invention discloses a moving learning-based method for predicting the running time of train sections, which can accurately predict the running time of train sections in dispatching sections with short start-up time and insufficient accumulated traffic data under different scenarios/conditions, thereby realizing the effective adjustment of the disturbed train diagram, restoring the orderly running of train as soon as possible and reducing the number of disturbed train sections. Delay, narrow the scope of trains affected by delays, Ensure Railway safety, improve railway transport efficiency and passenger satisfaction.

【技术实现步骤摘要】
一种基于迁移学习的列车区间运行时分预测方法
本专利技术涉及铁路交通
,尤其涉及一种基于迁移学习的列车区间运行时分预测方法。
技术介绍
在列车运行过程中,避免不了会受到一些环境因素、设备因素、人为因素的影响而造成列车晚点,此时就需要对列车运行图进行有效调整,使得后续列车尽快恢复有序运行,减小延误,缩小受晚点影响的列车范围,提高旅客满意度。运行图的有效调整,即重新确定列车在车站的到达时刻和发车时刻,这就需要对列车在区间的运行时分进行有效预测。目前主要有如下两种技术方案:1、利用理论公式推导。该方案依据区间的里程、线路的坡度、动车组动力属性等相关信息通过理论公式推导列车在区间的运行时分。然而,其缺陷在于:列车在区间运行的时分受多种因素影响,对于调度集中系统(CTC)来说,目前又无法获取得到实时可靠的动车组运行的相关动力学数据,因此CTC系统无法依据区间的里程、线路的坡度、动车组动力属性等相关信息通过理论公式准确推导列车在区间的运行时分。2、利用大量的历史和实时行车数据预测列车区间的运行时分。该方案利用调度集中系统(CTC)中海量的历史和实时行车调度数据,建立随机森林模型预测列车区间运行时分。即以天为单位构成训练数据样本集,提取特征属性,以决策树构建基学习器,采用特征属性随机选择方式训练决策树,降低及学习器间的相关度,提高该方法的泛化能力,进而提高预测区间运行时分的准确率。然而,其缺陷在于:对于那些已开通一段时间、已积累大量行车数据的调度区段来说,采用该方法预测区间运行时分的准确率较高,具备有效性和可靠性。由于该预测列车区间运行时分的方法是以调度区段某一特定区间为单位激发的预测。对于刚开通时间不长、累积的行车数据不够充足的调度区段来说,由于数据量不充足,采用该方法预测的区间运行时分准确率不高。
技术实现思路
本专利技术的目的是提供一种基于迁移学习的列车区间运行时分预测方法,可以实现在数据量不充足情况下的列车区间运行时分有效预测。本专利技术的目的是通过以下技术方案实现的:一种基于迁移学习的列车区间运行时分预测方法,包括:初始化源数据集和目标数据集;所述源数据集和目标数据集中每一数据均为标签信息集合,所述标签信息集合表示一个列车运行场景或者列车运行条件;所述源数据集中的每一源数据还对应一个运行时分信息,即标签信息集合所属类别;对于当前目标数据而言,确定精化步数n,并结合源数据与当前目标数据来确定每步精化时的混合数据,从而建立n-1个中间桥接模型;利用建立的中间桥接模型进行精化处理,每一次精化后的数据均进行类别概率的运算,如果满足停止条件,则相应的类别即为当前目标数据的运行时分预测结果;否则,继续精化处理,直至完成全部精化过程后,将最后精化后的数据所对应的最高概率的类别作为当前目标数据运行时分预测结果。由上述本专利技术提供的技术方案可以看出,在不同场景/条件下,实现针对刚开通时间不长、累积的行车数据不够充足的调度区段的列车区间运行时分的准确预测。进而实现对受干扰后的列车运行图的有效调整,尽快恢复列车有序运行,减小延误,缩小受晚点影响的列车范围,保障铁路行车安全,提高铁路运输效率和旅客满意度。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。图1为本专利技术实施例提供的基于运行图的列车运行相关时刻说明图;图2为本专利技术实施例提供的基于运行图的列车在车站到达晚点影响因素判定方法图;图3为本专利技术实施例提供的基于运行图的列车在车站出发晚点影响因素判定方法图;图4为本专利技术实施例提供的一种基于迁移学习的列车区间运行时分预测方法的示意图;图5为本专利技术实施例提供的一种基于迁移学习的列车区间运行时分预测方法的原理图。具体实施方式下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术的保护范围。本专利技术实施例提供一种基于迁移学习的列车区间运行时分预测方法,其采用非参数化的实例型迁移学习方法,即改进的多步桥接精化迁移学习算法来实现在数据量不充足情况下的列车区间运行时分有效预测。在介绍该方法之前,先针对列车运行相关时刻、列车在车站到达晚点影响因素、列车在车站出发晚点影响因素分别进行介绍。首先,进行参数的定义:i=1,2,…,m,j=1,2,…,n;列车i在车站j的到达时刻;列车i在车站j的出发时刻;列车i在车站j的图定到达时刻;列车i在车站j的图定出发时刻;列车i在车站j的到达晚点时分,列车i在车站j的出发晚点时分,列车i在区间j-1→j的区间运行时分,列车i在区间j-1→j最小的区间运行时分;列车i在区间j-1→j图定的区间运行时分,列车i在区间j-1→j区间运行时分的缓冲时间,列车i在车站j的图定停站时分;列车i在车站j的最小停站时分;列车i在车站j停站时分的缓冲时间,车站j的最小接车时间间隔;车站j的最小发车时间间隔;或车站j的最小接发车时间间隔。如图1所示,为基于运行图的列车运行相关时刻说明图。图2~图3分别为基于运行图的列车在车站到达晚点影响因素判定方法图、基于运行图的列车在车站出发晚点影响因素判定方法图。在执行本专利技术相关方案之前需要抽取标签信息,主要如下:(1)调度区段名称,铁路局名称+调度区段名称;(2)区间名称,区分方向;(3)区间线路里程;(4)区间线路坡度;(5)区间所属线路的运营时速;(6)列车在区间始端类型:通过或到开;(7)列车在区间终端类型:通过或到开;(8)列车车次类别:主要考察三种,高速动车组旅客列车(车次号G1-G9998)、城际动车组旅客列车(车次号C1-C9998)和动车组旅客列车(D1-D9998);(9)是否反向行车;(10)区间是否存在限速;(11)区间限速占比;(12)区间限速值;(13)相关车站是否存在限速;(14)车站限速类型,正线限速、侧线限速;(15)车站限速是否影响该区间的运行时分;(16)列车在区间始端是否存在晚点,即是否为零;(17)列车在区间始端的到达时刻是否晚点,即是否为零;(18)列车在区间始端的到达时刻的晚点是否可被区间始端车站的缓冲时间全部吸收,即是否成立;(19)列车在区间始端的出发时刻是否受到接发车时间间隔的制约;(20)列车在区间始端的出发时刻是否受到发车时间间隔的制约;(21)列车在区间始端的车站作业是否存在作业延误;(22)列车在区间始端的出发时刻晚点传播效应的类型,衰减传播、等效传播或增强传播;(23)列车在区间终端是否存在晚点,即是否为零;(24)列车在区间始端出发时刻的晚点是否可被区间运行的缓冲时间全部吸收,即是否成立;(25)列车在区间终端的接车时刻是否受到接发车时间间隔的制约;(26)列车在区间终端的接车时刻是否受到接车时间间隔的制约;(27)列车是否存在区间运行延误;(28)列车在区间终端的接车时刻晚点传播效应的类型,衰减传播、等效传播或增强传播;(29)列车在区间终端的接车时刻晚本文档来自技高网
...

【技术保护点】
1.一种基于迁移学习的列车区间运行时分预测方法,其特征在于,包括:初始化源数据集和目标数据集;所述源数据集和目标数据集中每一数据均为标签信息集合,所述标签信息集合表示一个列车运行场景或者列车运行条件;所述源数据集中的每一源数据还对应一个运行时分信息,即标签信息集合所属类别;对于当前目标数据而言,确定精化步数n,并结合源数据与当前目标数据来确定每步精化时的混合数据,从而建立n‑1个中间桥接模型;利用建立的中间桥接模型进行精化处理,每一次精化后的数据均进行类别概率的运算,如果满足停止条件,则相应的类别即为当前目标数据的运行时分预测结果;否则,继续精化处理,直至完成全部精化过程后,将最后精化后的数据所对应的最高概率的类别作为当前目标数据运行时分预测结果。

【技术特征摘要】
1.一种基于迁移学习的列车区间运行时分预测方法,其特征在于,包括:初始化源数据集和目标数据集;所述源数据集和目标数据集中每一数据均为标签信息集合,所述标签信息集合表示一个列车运行场景或者列车运行条件;所述源数据集中的每一源数据还对应一个运行时分信息,即标签信息集合所属类别;对于当前目标数据而言,确定精化步数n,并结合源数据与当前目标数据来确定每步精化时的混合数据,从而建立n-1个中间桥接模型;利用建立的中间桥接模型进行精化处理,每一次精化后的数据均进行类别概率的运算,如果满足停止条件,则相应的类别即为当前目标数据的运行时分预测结果;否则,继续精化处理,直至完成全部精化过程后,将最后精化后的数据所对应的最高概率的类别作为当前目标数据运行时分预测结果。2.根据权利要求1所述的一种基于迁移学习的列车区间运行时分预测方法,其特征在于,所述源数据集表示为:表示第l个调度区段的标签信息集合,l=1,...,a,a表示调度区段总数;其中,Sl,1,d为第l个调度区段中第1个方向为d的区间的标签信息集合,Nl为第l个调度区段的区间总数。3.根据权利要求2所述的一种基于迁移学习的列车区间运行时分预测方法,其特征在于,所述确定精化步数n,并结合源数据与目标数据来确定每步精化时的混合数据,从而建立n-1个中间桥接模型包括:首先,根据精化步数n,计算第k次精化时数据混合比例λk:然后,根据数据混合比例,来计算混合数据集;其中,第k次精化时输入至中间桥接模型的混合数据集xM(k)为:xM(k)={λkxR∪(1-λk)xT};其中,xT表示目标数据,第1次精化时,xR表示任一个源数据,在之后的精化...

【专利技术属性】
技术研发人员:周晓昭张琦王涛袁志明陈峰赵宏涛宋鹏飞许伟赵随海高峰林海桐桂乐琴宋毅王子维许春晖宋晓丽金海林王守韦王振一张奕萌
申请(专利权)人:中国铁道科学研究院集团有限公司通信信号研究所中国铁道科学研究院集团有限公司北京市华铁信息技术开发总公司北京锐驰国铁智能运输系统工程技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1