货运列车运行控制方法、装置、电子设备及存储介质制造方法及图纸

技术编号：37352968 阅读：23 留言：0更新日期：2023-04-27 07:04

本发明专利技术提供一种货运列车运行控制方法、装置、电子设备及存储介质，涉及轨道交通技术领域，所述方法包括：对货运列车运行的初始状态进行编码处理，获取与初始状态相对应的特征编码；将特征编码输入强化学习模型，获取强化学习模型输出的目标控制级位；基于目标控制级位控制货运列车运行；其中，强化学习模型是以最小化货运列车的运行能耗和车钩力为目标构建的。本发明专利技术通过基于强化学习模型获取目标控制级位来控制货运列车运行，由于强化学习模型是以最小化货运列车的运行能耗和车钩力为目标构建的，则由强化学习模型得到的目标控制级位可以保证货运列车在运行安全的前提下降低货运列车的运行能耗，并提高货运列车的运输效率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
货运列车运行控制方法、装置、电子设备及存储介质

[0001]本专利技术涉及轨道交通
，尤其涉及一种货运列车运行控制方法、装置、电子设备及存储介质。

技术介绍

[0002]货运列车作为货运铁路的承运工具，其安全和高效地运行是关乎货运铁路运输效能的重要因素。
[0003]目前货运列车运行依靠人工驾驶，但由于货运列车编组多、长度大，并且牵引制动响应时间长，故驾驶操作难度大，对货运列车驾驶员的驾驶操作技术要求较高，而且货运列车驾驶员频繁操作导致能耗和设备损耗严重。同时，复杂的线路条件也对货运列车的运输效率产生了一定的影响。
[0004]因此，如何在保证货运列车运行安全的前提下提高货运列车的运输效率，降低运行能耗，成为业界亟需解决的问题。

技术实现思路

[0005]针对现有技术存在的问题，本专利技术提供一种货运列车运行控制方法、装置、电子设备及存储介质。
[0006]第一方面，本专利技术提供一种货运列车运行控制方法，包括：
[0007]对货运列车运行的初始状态进行编码处理，获取与所述初始状态相对应的特征编码；
[0008]将所述特征编码输入强化学习模型，获取所述强化学习模型输出的目标控制级位；
[0009]基于所述目标控制级位控制所述货运列车运行；
[0010]其中，所述强化学习模型是以最小化所述货运列车的运行能耗和车钩力为目标构建的。
[0011]可选地，根据本专利技术提供的一种货运列车运行控制方法，在所述对货运列车运行的初始状态进行编码处...

【技术保护点】

【技术特征摘要】
1.一种货运列车运行控制方法，其特征在于，包括：对货运列车运行的初始状态进行编码处理，获取与所述初始状态相对应的特征编码；将所述特征编码输入强化学习模型，获取所述强化学习模型输出的目标控制级位；基于所述目标控制级位控制所述货运列车运行；其中，所述强化学习模型是以最小化所述货运列车的运行能耗和车钩力为目标构建的。2.根据权利要求1所述的货运列车运行控制方法，其特征在于，在所述对货运列车运行的初始状态进行编码处理，获取与所述初始状态相对应的特征编码之前，所述方法还包括：确定所述货运列车运行的初始状态，所述初始状态包括所述货运列车的初始运行速度和初始位置。3.根据权利要求2所述的货运列车运行控制方法，其特征在于，所述对货运列车运行的初始状态进行编码处理，获取与所述初始状态相对应的特征编码，包括：对所述货运列车的初始运行速度和初始位置进行网格离散化，获取多个瓦片；基于瓦片编码方法分别对各瓦片进行编码，获取与各瓦片分别对应的编码数据；基于多个所述编码数据，生成与所述初始运行速度和初始位置相对应的特征编码。4.根据权利要求1所述的货运列车运行控制方法，其特征在于，所述强化学习模型是由携带有经验回放的卷积神经网络构建的。5.根据权利要求4所述的货运列车运行控制方法，其特征在于，所述强化学习模型包括训练网络、目标网络和经验回放池；所述训练网络和所述目标网络均是基于相同结构的所述卷积神经网络构建的；所述强化学习模型的求解过程包括：基于所述货运列车的运行状态，通过所述训练网络、所述目标网络和所述经验回放池至少执行一次智能体与环境的交互过程；在所述智能体与环境交互的回合数达到预设的最大回合数的情况下，获取所述强化学习模型输出的目标控制级位。6.根据权利要求5所述的货运列车运行控制方法，其特征在于，一次所述智能体与环境的交互过程包括：基于所述货运列车的运行状态，初始化所述强化学习模型的初始状态，利用ε
‑
greedy算法获取与所述强化学习模型的初始状态...

【专利技术属性】
技术研发人员：陈斌，李申，宋亚京，张蕾，
申请(专利权)人：交控科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人