一种基于批量约束深度Q学习的列车节能驾驶曲线计算方法技术

技术编号:41128336 阅读:26 留言:0更新日期:2024-04-30 17:56
本发明专利技术公开一种基于批量约束深度Q学习的列车节能驾驶曲线计算方法,涉及轨道交通技术领域。本发明专利技术基于列车控制模型和优化目标构建深度强化学习模型,先采用这一强化学习模型从历史经验数据或离线数据集中提取状态‑动作序列。接着,引入动作选择网络,并采用动作选择网络基于状态‑动作序列生成候选动作。然后,将生成的候选动作输入值函数得到策略动作,生成列车节能驾驶曲线,进而能够充分利用历史数据和专家先验知识,得到较好的行车策略,并能够及时响应环境变化,增强适用性,提高列车驾驶控制的智能化程度。

【技术实现步骤摘要】

本专利技术涉及轨道交通,特别是涉及一种基于批量约束深度q学习的列车节能驾驶曲线计算方法。


技术介绍

1、随着经济的快速发展和人们出行需求的不断增长,公共交通的平稳、高效运行成为社会正常运转的重要保障。其中,轨道交通以运量大、速度快、运输成本低、准时、安全等优势占据公共交通核心位置。降低列车能耗是交通领域低碳发展的重要一环,也是未来绿色交通发展的方向。列车牵引能耗占据总能耗的50%左右,因此降低列车牵引能耗有更大的发展潜力,是轨道交通系统节能减排的工作重点。优化列车驾驶策略既可以显著降低牵引能耗,又可以将算法推广到硬件条件不同的线路和车辆上,具有良好的节能效果和较强的适用性。目前列车自动驾驶主要通过数值解法或搜索算法求解最优驾驶控制模型,得到最优驾驶策略。但在实际运营场景中这类模型很难建立,且使用带有先验知识的模型对列车运行进行描述只能做到尽可能相似,全面还原较为困难。通过这类模型计算得到的行车策略在环境出现变化时适用性减弱。与之形成对比的是,列车每天实际运行都会产生大量数据,这类数据利用率较低,一些环境信息和较好的驾驶经验没有得到充分挖掘。基于此,如何研究本文档来自技高网...

【技术保护点】

1.一种基于批量约束深度Q学习的列车节能驾驶曲线计算方法,其特征在于,包括:

2.根据权利要求1所述的基于批量约束深度Q学习的列车节能驾驶曲线计算方法,其特征在于,根据实际线路信息和车辆信息建立列车控制模型和优化目标,具体包括:

3.根据权利要求1所述的基于批量约束深度Q学习的列车节能驾驶曲线计算方法,其特征在于,将所述候选动作输入值函数得到策略动作,生成列车节能驾驶曲线,具体包括:

4.根据权利要求1所述的基于批量约束深度Q学习的列车节能驾驶曲线计算方法,其特征在于,批量约束深度Q学习更新公式为:

5.根据权利要求3所述的基于批量约束深度...

【技术特征摘要】

1.一种基于批量约束深度q学习的列车节能驾驶曲线计算方法,其特征在于,包括:

2.根据权利要求1所述的基于批量约束深度q学习的列车节能驾驶曲线计算方法,其特征在于,根据实际线路信息和车辆信息建立列车控制模型和优化目标,具体包括:

3.根据权利要求1所述的基于批量约束深度q学习的列车节能驾驶曲线计算方法,其特征在于,将所述候选动作输入值函数得到策略动作,生成列车节能驾驶曲线,具体包括:

4.根据权利要求1所述的基于批量约束深度q学习的列车节能驾驶曲线计算方法...

【专利技术属性】
技术研发人员:宿帅余祖俊唐涛刘宏杰张淼李昂易海旺惠子南范楷柴铭吕继东
申请(专利权)人:北京交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1