当前位置: 首页 > 专利查询>贵州大学专利>正文

一种基于自动机和强化学习的铁路交通系统调度优化方法技术方案

技术编号:37386931 阅读:40 留言:0更新日期:2023-04-27 07:26
本发明专利技术公开了一种基于自动机和强化学习的铁路交通系统调度优化方法,包括以下步骤:S1、建立车辆的数学模型G

【技术实现步骤摘要】
一种基于自动机和强化学习的铁路交通系统调度优化方法


[0001]本专利技术涉及铁路交通调度
,尤其是涉及一种基于自动机和强化学习的铁路交通系统调度优化方法。

技术介绍

[0002]随着经济的发展、生活节奏的加快,人们的日常出行变得愈加频繁。长距离、跨区域的物质流动需求不断的提升,使得铁路运输的发展进入了一个新的时期。为了避免行车秩序混乱、突发事故的潜在隐患,保障旅客和货物运输安全,做好铁路交通系统的调度工作至关重要。
[0003]车辆优化调度是一类典型的组合优化问题,并已证明是NP难问题,常用的方法有传统数学优化方法、启发式方法、机器学习方法。传统数学优化方法通过建立铁路交通调度问题的数学模型和约束条件进行求解,建模过程十分复杂和困难;启发式方法需要设计人员拥有较为完备的专业知识并且专用性比较强。此外,启发式方法往往不能得到最优解。目前,普遍认为基于机器学习方法的调度决策方案比传统数学优化方法和启发式方法更具有实用性。机器学习不需要先验知识,直接从数据中发现规律构造模型来逼近铁路运输生产实际情况。机器学习可分为监督学习、无监督学习本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于自动机和强化学习的铁路交通系统调度优化方法,其特征在于,包括以下步骤:S1、根据铁路交通系统调度问题,使用自动机建立车辆的数学模型G
i
,安全性和活性控制规范模型E
j
,i=1,...,N表示车辆数量,j=1,...,M表示控制规范的自动机模型个数;S2、基于S1的车辆数学模型G
i
,建立铁路交通系统调度问题的自动机模型G;结合S1的控制规范模型E
j
,求解出铁路交通系统调度问题的目标模型T;S3、根据S2的目标模型T,结合事件发生所需的成本和事件的控制成本,为目标模型T中的事件赋予相应的执行成本;S4、基于S2的自动机模型G和S3的目标模型T,利用TCT软件求解出铁路交通系统调度问题的监控器模型V=SupC(G,T);S5、将S4中的监控器模型V转换为确定性马尔可夫决策过程MDP,利用Q学习算法求解铁路交通系统调度问题,实验并进行结果分析。2.根据权利要求1所述的一种基于自动机和强化学习的铁路交通系统调度优化方法,其特征在于:所述S1中,使用自动机建立车辆的数学模型G
i
,安全性和活性控制规范模型E
j
分别为:G
i
=(H
i
,∑
i

i
,h
i0
,H
im
),E
j
=(H
j
,∑
j

j

【专利技术属性】
技术研发人员:王德光胡瑜洪杨明
申请(专利权)人:贵州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1