一种突发事件下的列车动态调整方法及系统技术方案

技术编号：21091363 阅读：22 留言：0更新日期：2019-05-11 10:37

本发明专利技术提供了一种突发事件下的列车动态调整方法及系统，包括：记录所有突发事件下的历史调图数据，采集当前突发事件的同时段同方向列车的数据信息，确定列车的运营场景条件，根据数据信息和运营场景条件搭建场景库；根据历史调图数据和马尔科夫决策过程建立基于历史数据集的环境模型；根据场景库和基于历史数据集的环境模型，通过智能体进行深度强化学习，得到列车动态调整模型；通过列车动态调整模型对当前突发事件的同时段同方向的列车的实绩运行图进行在线动态调整。该方法提高了动态调整近似最优可行解的求解速度和质量，解决了突发事件下列车实绩运行图的动态调整问题。

A Method and System of Train Dynamic Adjustment in Emergency

全部详细技术资料下载

【技术实现步骤摘要】
一种突发事件下的列车动态调整方法及系统
本专利技术涉及铁路运营调度领域，尤其涉及一种突发事件下的列车动态调整方法及系统。
技术介绍
随着“交通强国，铁路先行”战略的提出和庞大运营里程的建设，“八横八纵”的现代化高速铁路网将在2035年实现互联互通。网络化运营条件下的列车运行状态具有非线性、快速演变性和不稳定性等特点，线路上出现的故障若处置不当，线路上的一列列车的延迟将快速传播给本线其他列车以及与该线路相邻接的跨线列车，会直接影响到铁路线路运营能力和列车的运行效率。目前，铁路突发事件下的应急处置仍是以调度员人工处置的方式为主要处置方式，由于其自动化程度较低、人工经验依赖度较高，且调整策略全局最优性难以保证，现有技术中还没有其他自动化程度高的列车调度方法，因此，亟需一种突发事件下高效快速应急处置列车的动态调整方法。
技术实现思路
本专利技术提供了一种突发事件下的列车动态调整方法及系统，以解决突发事件下列车实绩运行图的动态调整问题。为了实现上述目的，本专利技术采取了如下技术方案。本专利技术的一方面提供了一种突发事件下的列车动态调整方法，包括：记录所有突发事件下的历史调图数据，采集当前突发事件的同时段同方向列车的数据信息，确定所述列车的运营场景条件，根据所述数据信息和运营场景条件搭建场景库；调取当前突发事件下对应的的同时段同方向的历史调图数据，根据历史调图数据和马尔科夫决策过程建立基于历史数据集的环境模型；根据所述场景库和所述的基于历史数据集的环境模型建立环境模型，通过智能体对所述环境模型进行学习，得到列车动态调整模型；通过列车动态调整模型对当前突发事件的同时段同方向...

【技术保护点】
1.一种突发事件下的列车动态调整方法，其特征在于，包括：记录所有突发事件下的历史调图数据，采集当前突发事件的同时段同方向列车的数据信息，确定所述列车的运营场景条件，根据所述数据信息和运营场景条件搭建场景库；调取当前突发事件下对应的的同时段同方向的历史调图数据，根据历史调图数据和马尔科夫决策过程建立基于历史数据集的环境模型；根据所述场景库和所述的基于历史数据集的环境模型建立环境模型，通过智能体对所述环境模型进行学习，得到列车动态调整模型；通过列车动态调整模型对当前突发事件的同时段同方向的列车的实绩运行图进行在线动态调整。

【技术特征摘要】
1.一种突发事件下的列车动态调整方法，其特征在于，包括：记录所有突发事件下的历史调图数据，采集当前突发事件的同时段同方向列车的数据信息，确定所述列车的运营场景条件，根据所述数据信息和运营场景条件搭建场景库；调取当前突发事件下对应的的同时段同方向的历史调图数据，根据历史调图数据和马尔科夫决策过程建立基于历史数据集的环境模型；根据所述场景库和所述的基于历史数据集的环境模型建立环境模型，通过智能体对所述环境模型进行学习，得到列车动态调整模型；通过列车动态调整模型对当前突发事件的同时段同方向的列车的实绩运行图进行在线动态调整。2.根据权利要求1所述的方法，其特征在于，所述的采集当前突发事件的同时段同方向列车的数据信息，确定所述列车的运营场景条件，包括：所述的列车数据信息包括列车车次、列车时刻表数据和列车状态；所述的列车运营场景条件包括：铁路运营场景线路的基础设施、布局、车站结构和列车作业时间。3.根据权利要求1所述的方法，其特征在于，所述的根据历史调图数据和马尔科夫决策过程建立基于历史数据集的环境模型，包括：所述的马尔科夫决策过程的参数表达式为：S,A,P,R，其中S,A,P,R分别表示状态空间、动作空间、状态转移概率和奖励函数空间。4.根据权利要求1所述的方法，其特征在于，所述的基于历史数据集的环境模型包括通过历史调图数据和马尔科夫决策过程预测的状态转移概率和回报值。5.根据权利要求4所述的方法，其特征在于，所述的状态转移概率如下式(1)所示：P(s′|s,a)＝N(s,a,s′)/N(s,a)(1)所述的回报值如下式(2)所示：其中：P(s′|s,a)为当前状态-动作(s,a)转移到下一状态s′的转移概率，N(s,a)表示当前状态s执行动作a的总次数，N(s,a,s′)表示从状态-动作(s,a)转移到下一状态s′的次数；为状态-动作接收的平均回报值为，reward为每一次状态动作转移的奖励函数。6.根据权利要求1所述的方法，其特征在于，所述的通过智能体对所述环境模型进行学习，包括：所述智能体通过深度Q学习的方法对所述环境模型进行学习。7.一种突发事件下的列车动态调整系统，其特征在于，包括：信息采集模块、数据存储模块、...

【专利技术属性】
技术研发人员：董海荣，王荣笙，高士根，乐逸祥，张琦，
申请(专利权)人：北京交通大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人