System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种公交实时滞站控制方法和装置制造方法及图纸_技高网

一种公交实时滞站控制方法和装置制造方法及图纸

技术编号:41200299 阅读:2 留言:0更新日期:2024-05-07 22:27
本发明专利技术提出了一种基于多智能体强化学习的公交实时滞站控制方法和装置。首先收集分析公交运营随机数据,得到公交运营随机数据的概率分布,利用公交运营随机数据的概率分布搭建公交仿真运营环境,然后建立公交实时滞站控制的多智能体强化学习模型,利用仿真环境对模型进行训练,最后根据公交的实时运营情况,利用训练后的模型给出公交在站点的实时滞站时间。通过本发明专利技术提出的方案,能够实时快速的控制公交的滞站时间,减少串车现象,降低乘客的等待时间。

【技术实现步骤摘要】

本专利技术属于公交动态调度领域,尤其涉及一种基于多智能体深度强化学习的公交滞站控制方法与装置。


技术介绍

1、公交是城市公共交通系统的重要组成部分,在方便居民出行,缓解交通拥堵,降低城市碳排放方面有着重要的作用。然而由于乘客需求不确定,加之城市交通拥堵,路况复杂,导致公交难以准点运营,经常在运营过程中出现串车现象,即同一条线路两辆或者多辆公交车同时到达同一个公交站点的情况,这给部分乘客带来了不好的出行体验,也给公交车系统的运行效率带来极大的负面影响。

2、公交实时滞站控制是解决串车现象的最常见的策略,即当公交车在到达控制站点并完成乘客上下车过程后不会立即离开控制站点,而是在控制站点多停留一段时间,这个停留的过程被称为滞站,多停留的时间是滞站时间。滞站策略会增加单程的出行时间,但同时可以显著减少串车现象,降低乘客出行的平均等待时间。

3、传统的滞站控制方法主要考虑在时域内优化不同的目标,其中包括乘客在站等待时间等,通常采用解析方法和规则式方法。这些方法往往只能考虑到当前决策的短期影响,随着时间的推进控制效果会越来越差,不能良好地适应复杂多变的实际交通环境。

4、随着城市的快速发展和智能技术的变革,多智能体深度强化学习在处理多种组合优化问题时都表现优异,尤其是在解决复杂的序贯决策问题时,能够有效考虑当前决策的长期影响。因此本专利技术提出了一种基于多智能体深度强化学习的公交滞站控制方法和装置,能够充分考虑考前滞站决策对后续运营的长期影响,同时该方法还考虑了公交容量约束,将乘客的拥挤成本也作为优化目标,能够有效减少公交运营过程中的串车现象,提升乘客的出行体验。


技术实现思路

1、本专利技术针对现有公交滞站控制方法无法考虑滞站决策对后续运营的长期影响,同时也没有考虑到乘客的拥挤成本的问题,本专利技术提供一种公交实时滞站控制方法与装置,来实时确定公交车辆在控制站点的滞站时间,能够有效减少公交运营过程中的串车现象,提升乘客的出行体验。

2、本专利技术解决上述技术问题的技术方案如下:

3、本专利技术实施例提供一种基于多智能体深度强化学习的公交滞站控制方法与装置,包括以下步骤:

4、步骤1:收集分析公交运营随机数据,得到公交运营随机数据的概率分布;

5、步骤2:利用公交运营随机数据的概率分布搭建公交仿真运营环境;

6、步骤3:建立公交实时滞站控制的多智能体强化学习模型,利用仿真环境对模型进行训练;

7、步骤4:利用训练后的模型给出公交在控制站点的实时滞站时间。

8、本专利技术实施例提供一种基于多智能体深度强化学习的公交滞站控制方法与装置,通过中心评价网络来不断预测当前决策的长期回报即预测奖励;通过目标网络来对中心评价网络进行训练;通过中心评价网络的预测奖励来对策略网络进行训练;最终将策略网络部署到实时环境中,通过实时状态决定车辆的滞站时间;帮助公交企业更好的进行滞站控制,能够有效减少公交运营过程中的串车现象,提升乘客的出行体验。

本文档来自技高网...

【技术保护点】

1.一种基于多智能体强化学习的公交实时滞站控制方法,其特征在于,能够根据公交运营现状,实时给出车辆在控制站点的滞站时间,减少串车现象,降低乘客的等待时间,具体步骤如下:

2.如权利要求1所述的一种基于多智能体强化学习的公交实时滞站控制方法,其特征在于,所述的收集分析公交运营随机数据,得到公交运营随机数据的概率分布,具体步骤如下;

3.如权利要求1所述的一种基于多智能体强化学习的公交实时滞站控制方法,其特征在于,所述公交实时滞站控制的多智能体强化学习模型中的动作为车辆在控制站点的滞站时间。

4.如权利要求1所述的一种基于多智能体强化学习的公交实时滞站控制方法,其特征在于,所述公交实时滞站控制的多智能体强化学习模型中的状态为局部状态:当前时间、车辆到达站点、车辆的前向间隔、目标间隔、车内乘客数、站点乘客数,和全局状态:所有车辆的前向间隔偏差。

5.如权利要求1所述的一种基于多智能体强化学习的公交实时滞站控制方法,其特征在于,所述公交实时滞站控制的多智能体强化学习模型,具体模块包括:

6.一种基于多智能体强化学习的公交实时滞站控制装置,包括存储器和处理器,所述存储器上存储有计算机可执行指令,其特征在于,所述计算机可执行指令在被所述处理器执行时,实现根据权利要求1 至5中任一项所述的公交实时滞站控制方法。

...

【技术特征摘要】

1.一种基于多智能体强化学习的公交实时滞站控制方法,其特征在于,能够根据公交运营现状,实时给出车辆在控制站点的滞站时间,减少串车现象,降低乘客的等待时间,具体步骤如下:

2.如权利要求1所述的一种基于多智能体强化学习的公交实时滞站控制方法,其特征在于,所述的收集分析公交运营随机数据,得到公交运营随机数据的概率分布,具体步骤如下;

3.如权利要求1所述的一种基于多智能体强化学习的公交实时滞站控制方法,其特征在于,所述公交实时滞站控制的多智能体强化学习模型中的动作为车辆在控制站点的滞站时间。

4.如权利要求1所述的一种基于多智能体强化学习的公交实时滞...

【专利技术属性】
技术研发人员:沈吟东沈若愚
申请(专利权)人:武汉禾青优化科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1