The invention discloses a moving learning-based method for predicting the running time of train sections, which can accurately predict the running time of train sections in dispatching sections with short start-up time and insufficient accumulated traffic data under different scenarios/conditions, thereby realizing the effective adjustment of the disturbed train diagram, restoring the orderly running of train as soon as possible and reducing the number of disturbed train sections. Delay, narrow the scope of trains affected by delays, Ensure Railway safety, improve railway transport efficiency and passenger satisfaction.
【技术实现步骤摘要】
一种基于迁移学习的列车区间运行时分预测方法
本专利技术涉及铁路交通
,尤其涉及一种基于迁移学习的列车区间运行时分预测方法。
技术介绍
在列车运行过程中,避免不了会受到一些环境因素、设备因素、人为因素的影响而造成列车晚点,此时就需要对列车运行图进行有效调整,使得后续列车尽快恢复有序运行,减小延误,缩小受晚点影响的列车范围,提高旅客满意度。运行图的有效调整,即重新确定列车在车站的到达时刻和发车时刻,这就需要对列车在区间的运行时分进行有效预测。目前主要有如下两种技术方案:1、利用理论公式推导。该方案依据区间的里程、线路的坡度、动车组动力属性等相关信息通过理论公式推导列车在区间的运行时分。然而,其缺陷在于:列车在区间运行的时分受多种因素影响,对于调度集中系统(CTC)来说,目前又无法获取得到实时可靠的动车组运行的相关动力学数据,因此CTC系统无法依据区间的里程、线路的坡度、动车组动力属性等相关信息通过理论公式准确推导列车在区间的运行时分。2、利用大量的历史和实时行车数据预测列车区间的运行时分。该方案利用调度集中系统(CTC)中海量的历史和实时行车调度数据,建立随机森林模型预测列车区间运行时分。即以天为单位构成训练数据样本集,提取特征属性,以决策树构建基学习器,采用特征属性随机选择方式训练决策树,降低及学习器间的相关度,提高该方法的泛化能力,进而提高预测区间运行时分的准确率。然而,其缺陷在于:对于那些已开通一段时间、已积累大量行车数据的调度区段来说,采用该方法预测区间运行时分的准确率较高,具备有效性和可靠性。由于该预测列车区间运行时分的方法是以调度区段某一特定 ...
【技术保护点】
1.一种基于迁移学习的列车区间运行时分预测方法,其特征在于,包括:初始化源数据集和目标数据集;所述源数据集和目标数据集中每一数据均为标签信息集合,所述标签信息集合表示一个列车运行场景或者列车运行条件;所述源数据集中的每一源数据还对应一个运行时分信息,即标签信息集合所属类别;对于当前目标数据而言,确定精化步数n,并结合源数据与当前目标数据来确定每步精化时的混合数据,从而建立n‑1个中间桥接模型;利用建立的中间桥接模型进行精化处理,每一次精化后的数据均进行类别概率的运算,如果满足停止条件,则相应的类别即为当前目标数据的运行时分预测结果;否则,继续精化处理,直至完成全部精化过程后,将最后精化后的数据所对应的最高概率的类别作为当前目标数据运行时分预测结果。
【技术特征摘要】
1.一种基于迁移学习的列车区间运行时分预测方法,其特征在于,包括:初始化源数据集和目标数据集;所述源数据集和目标数据集中每一数据均为标签信息集合,所述标签信息集合表示一个列车运行场景或者列车运行条件;所述源数据集中的每一源数据还对应一个运行时分信息,即标签信息集合所属类别;对于当前目标数据而言,确定精化步数n,并结合源数据与当前目标数据来确定每步精化时的混合数据,从而建立n-1个中间桥接模型;利用建立的中间桥接模型进行精化处理,每一次精化后的数据均进行类别概率的运算,如果满足停止条件,则相应的类别即为当前目标数据的运行时分预测结果;否则,继续精化处理,直至完成全部精化过程后,将最后精化后的数据所对应的最高概率的类别作为当前目标数据运行时分预测结果。2.根据权利要求1所述的一种基于迁移学习的列车区间运行时分预测方法,其特征在于,所述源数据集表示为:表示第l个调度区段的标签信息集合,l=1,...,a,a表示调度区段总数;其中,Sl,1,d为第l个调度区段中第1个方向为d的区间的标签信息集合,Nl为第l个调度区段的区间总数。3.根据权利要求2所述的一种基于迁移学习的列车区间运行时分预测方法,其特征在于,所述确定精化步数n,并结合源数据与目标数据来确定每步精化时的混合数据,从而建立n-1个中间桥接模型包括:首先,根据精化步数n,计算第k次精化时数据混合比例λk:然后,根据数据混合比例,来计算混合数据集;其中,第k次精化时输入至中间桥接模型的混合数据集xM(k)为:xM(k)={λkxR∪(1-λk)xT};其中,xT表示目标数据,第1次精化时,xR表示任一个源数据,在之后的精化...
【专利技术属性】
技术研发人员:周晓昭,张琦,王涛,袁志明,陈峰,赵宏涛,宋鹏飞,许伟,赵随海,高峰,林海桐,桂乐琴,宋毅,王子维,许春晖,宋晓丽,金海林,王守韦,王振一,张奕萌,
申请(专利权)人:中国铁道科学研究院集团有限公司通信信号研究所,中国铁道科学研究院集团有限公司,北京市华铁信息技术开发总公司,北京锐驰国铁智能运输系统工程技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。