一种基于深度学习的列车控制方法技术

技术编号:20128256 阅读:58 留言:0更新日期:2019-01-16 14:21
本发明专利技术实施例公开了一种基于深度学习的列车控制方法,包括:从历史数据中筛选得到驾驶经验丰富的司机驾驶列车时的司机驾驶数据;根据司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型;将不同时刻的列车状态输入训练好的深度网络模型,计算得到不同时刻的列车控制量。通过采用深度学习技术对ATO控制算法建模,不需要考虑内在控制过程,极大地简化了问题的复杂性;通过采用驾驶经验丰富的司机的驾驶数据训练深度网络模型,输出不同时刻的列车控制量,当获得新的司机驾驶数据时,对深度网络模型重新进行训练便可得到具有新数据特征的列车控制量,能够在保证列车的准时性和停车精度的前提下,改善列车舒适度,提高乘客乘坐体验。

A Train Control Method Based on Deep Learning

The embodiment of the present invention discloses a train control method based on deep learning, which includes: selecting driver driving data from historical data, training initial depth network model according to driver driving data, obtaining well-trained depth network model, and inputting train state at different times into well-trained depth network. The model calculates the train control quantity at different time. By using deep learning technology to model ATO control algorithm, the intrinsic control process is not considered, which greatly simplifies the complexity of the problem. By using the driver's driving data with rich driving experience to train the deep network model, the train control quantity at different times is output. When new driver driving data are obtained, the deep network model can be retrained. The train control quantity of the new data feature can improve the comfort of the train and passenger's ride experience on the premise of ensuring the punctuality and parking accuracy of the train.

【技术实现步骤摘要】
一种基于深度学习的列车控制方法
本专利技术实施例涉及轨道交通
,具体涉及一种基于深度学习的列车控制方法。
技术介绍
随着轨道交通的迅捷发展,轨道交通客运量也迅速增加。人们在追求快捷出行的同时,也对列车舒适度提出了更高的需求。在实际应用的ATO(AutomaticTrainOperation,列车自动控制)控制算法中,多是利用PID控制算法来计算列车控制量以追踪目标速度,根据当前线路条件的不同,列车控制量的值可能出现较大幅度变化。这会导致列车运行过程不平稳,列车舒适度难以有效保证。在具备ATO功能的轨道交通线路中,列车可以由ATO控制,也可以由司机控制。通过对两种操作模式下的驾驶数据进行对比可以得出,列车舒适度在由具有丰富驾驶经验司机驾驶列车时较ATO控制条件下具有更好的效果。因此,如何利用司机驾驶列车的经验数据设计更符合人类驾驶习惯的ATO控制算法,以此改善ATO控制条件下的列车舒适度是亟需解决的问题。
技术实现思路
由于现有方法存在上述问题,本专利技术实施例提出一种基于深度学习的列车控制方法。本专利技术实施例提出一种基于深度学习的列车控制方法,包括:从历史数据中筛选得到驾驶经验丰富的司机驾驶列车时的司机驾驶数据;根据所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型;将不同时刻的列车状态输入所述训练好的深度网络模型,计算得到不同时刻的列车控制量。可选地,所述根据所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型,具体包括:根据自编码器或受限玻尔兹曼机的预训练方法,采用所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型。可选地,所述根据所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型,具体包括:将所述司机驾驶数据输入初始的深度网络模型,得到目标列车控制量,根据所述目标列车控制量计算得到各时刻的列车状态,并将各时刻的列车状态输入所述初始的深度网络模型进行训练,得到训练好的深度网络模型。可选地,所述根据所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型,具体包括:将所述司机驾驶数据输入初始的深度网络模型,得到当前时刻列车的驾驶策略,并根据当前时刻列车的驾驶策略计算代价函数中各评价部分的值;其中,所述代价函数的评价部分包括:当前时刻模型输出与司机驾驶数据差异部分、当前时刻下的驾驶策略准时性部分、当前时刻下的驾驶策略停车精度部分以及当前时刻下的驾驶策略舒适度部分;所述代价函数中各评价部分的值为各评价部分对应的权重。可选地,所述方法还包括:若判断获知所述初始的深度网络模型的训练次数小于第一阈值,则增加所述当前时刻模型输出与司机驾驶数据差异部分的权重;若判断获知所述初始的深度网络模型的训练次数大于第二阈值,则减小所述当前时刻下的驾驶策略停车精度部分的权重。可选地,所述根据所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型之后,还包括:根据随机梯度下降算法、动量梯度下降算法、Rmsprop梯度下降算法、Adam梯度下降算法或正则化方法对所述训练好的深度网络模型进行微调。可选地,所述初始的深度网络模型的输入为归一化处理后的列车位置、速度、目标速度、移动授权MA终点、线路坡度、曲率、是否精度停车和区间剩余运行时间,输出为列车控制量。由上述技术方案可知,本专利技术实施例通过采用深度学习技术对ATO控制算法建模,不需要考虑内在控制过程,极大地简化了问题的复杂性;通过采用驾驶经验丰富的司机的驾驶数据训练深度网络模型,输出不同时刻的列车控制量,能够改善列车ATO控制过程中的舒适度;另外,深度网络模型具有较强的学习能力,当获得新的司机驾驶数据时,对深度网络模型重新进行训练便可得到具有新数据特征的列车控制量,能够在保证列车的准时性和停车精度的前提下,改善列车舒适度,提高乘客乘坐体验。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。图1为本专利技术一实施例提供的一种基于深度学习的列车控制方法的流程示意图;图2为本专利技术一实施例提供的深度网络模型的结构示意图;图3为本专利技术一实施例提供的深度网络模型生成驾驶策略的示意图;图4为本专利技术另一实施例提供的一种基于深度学习的列车控制方法的流程示意图。具体实施方式下面结合附图,对本专利技术的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。图1示出了本实施例提供的一种基于深度学习的列车控制方法的流程示意图,包括:S101、从历史数据中筛选得到驾驶经验丰富的司机驾驶列车时的司机驾驶数据。所述的司机驾驶数据包括但不限于列车在不同时刻的状态和该状态下输出的控制量。进一步地,所述的不同时刻的状态包括但不限于列车位置、速度、目标速度、MA终点、线路坡度、曲率、是否精度停车和区间剩余运行时间等。S102、根据所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型。其中,所述初始的深度网络模型的输入为归一化处理后的列车在不同时刻的状态,包括列车位置、速度、目标速度、移动授权MA终点、线路坡度、曲率、是否精度停车和区间剩余运行时间,输出为列车控制量。本实施例中的深度网络模型由输入层、隐藏层和输出层组成,其输入为归一化处理后的列车在不同时刻的状态,输出为列车控制量。根据模型当时时刻所输出的控制量,能够计算得到下一时刻列车的状态,将列车下一时刻状态输入深度网络模型,可以得到下一时刻列车的控制量,依次类推,当列车位置大于等于MA终点时,类推结束,此时可以得到一系列列车控制量,这一系列列车控制量称为当前时刻下的列车驾驶策略,如图3所示。在该策略下,可以对列车运行是否准时、停车精度是否达标、舒适度是否较好进行评价。根据自编码器(Autoencoder)或受限玻尔兹曼机(RBM,RestrictedBoltzmannMachine)的预训练方法,采用所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型。S103、将不同时刻的列车状态输入所述训练好的深度网络模型,计算得到不同时刻的列车控制量。所述的不同时刻的状态包括但不限于列车位置、速度、目标速度、MA终点、线路坡度、曲率、是否精度停车和区间剩余运行时间等。当训练过程结束时,所得到的深度网络模型便可根据列车当前时刻的状态计算得到当前时刻列车的控制量,所述的训练过程结束条件为代价函数的值满足各评价条件要求。本实施例通过采用深度学习技术对ATO控制算法建模,不需要考虑内在控制过程,极大地简化了问题的复杂性;通过采用驾驶经验丰富的司机的驾驶数据训练深度网络模型,输出不同时刻的列车控制量,能够改善列车ATO控制过程中的舒适度;另外,深度网络模型具有较强的学习能力,当获得新的司机驾驶数据时,对深度网络模型重新进行训练便可得到具有新数据特征的列车控制量,能够在保证列车的准时性和停车精度的前提下,改善列车舒适度,提高乘客乘坐体验。进一步地,在上述方法实施例的基础上,所述S102具本文档来自技高网...

【技术保护点】
1.一种基于深度学习的列车控制方法,其特征在于,包括:从历史数据中筛选得到驾驶经验丰富的司机驾驶列车时的司机驾驶数据;根据所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型;将不同时刻的列车状态输入所述训练好的深度网络模型,计算得到不同时刻的列车控制量。

【技术特征摘要】
1.一种基于深度学习的列车控制方法,其特征在于,包括:从历史数据中筛选得到驾驶经验丰富的司机驾驶列车时的司机驾驶数据;根据所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型;将不同时刻的列车状态输入所述训练好的深度网络模型,计算得到不同时刻的列车控制量。2.根据权利要求1所述的方法,其特征在于,所述根据所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型,具体包括:根据自编码器或受限玻尔兹曼机的预训练方法,采用所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型。3.根据权利要求1所述的方法,其特征在于,所述根据所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型,具体包括:将所述司机驾驶数据输入初始的深度网络模型,得到目标列车控制量,根据所述目标列车控制量计算得到各时刻的列车状态,并将各时刻的列车状态输入所述初始的深度网络模型进行训练,得到训练好的深度网络模型。4.根据权利要求1所述的方法,其特征在于,所述根据所述司机驾驶数据对初始的深度网络模型进行训练,得到训练好的深度网络模型,具体包括:将所述司机驾驶数据输入初始的深度网络模型,得到当前时刻列车...

【专利技术属性】
技术研发人员:刘波杜恒
申请(专利权)人:交控科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1