一种需求响应公交前瞻调度方法技术

技术编号:37120905 阅读:40 留言:0更新日期:2023-04-01 05:16
本发明专利技术公开了一种需求响应公交前瞻调度方法。所述方法包括以下步骤:基于滚动时域框架,建立马尔可夫决策过程模型;基于分位数回归、LSTM模型和Copula函数预测未来需求;将未来需求纳入普通调度模型,建立基于预测的前瞻调度模型,并为前瞻调度和取消订单分别设计了误差修正机制;设计决策的剪枝策略,压缩解空间来减少计算时间;利用近似动态规划算法求解调度方案。本发明专利技术不仅可以降低运营商成本,还能显著提升服务质量,达到需求响应公交调度的精细组织和管理。同时,算法具有良好的求解特性,具有较强的实际应用前景。具有较强的实际应用前景。具有较强的实际应用前景。

【技术实现步骤摘要】
一种需求响应公交前瞻调度方法


[0001]本专利技术涉及需求响应公交动态调度技术的研究领域,特别涉及一种需求响应公交前瞻调度方法。

技术介绍

[0002]需求响应公交可动态地改变路线和时间表,为乘客提供更灵活和精准的出行服务,在未来的公共交通系统中具有巨大的发展潜力。由于固定公交系统具有稳定时间表和行驶线路,其往往更具成本效益。然而,需求响应公交面临着巨大的发展障碍,不仅运营成本高昂,而且服务水平受限于车队规模、乘客个性化需求等现实因素。一方面,运营成本依赖于订单应答数量和车辆调度方案,但控制运营成本会引发车辆早到或迟到现象,同时会使应答率降低,从而恶化服务水平;另一方面,乘客的未来需求对规划来说是不确定性的,当前调度方案不一定适用于未来需求,即未来需求具有潜在的负面影响。随着个性化出行的发展,运营商越来越需要对需求响应公交的调度进行精细的组织和管理,实现服务的降本增效
[0003]在需求响应公交的调度问题中,运营商需求将运营时间划分为若干周期,在每个周期为所有导入系统的乘客出行订单做出调度计划,包括车辆路线、离开时间、等待时间和乘客<本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种需求响应公交前瞻调度方法,其特征在于,包括以下步骤:S1、基于滚动时域框架,建立马尔可夫决策过程模型;S2、基于分位数回归、LSTM模型和Copula函数预测未来需求;S3、将未来需求纳入普通调度模型,建立基于预测的前瞻调度模型,并为前瞻调度和取消订单分别设计了误差修正机制;S4、设计决策的剪枝策略,压缩解空间来减少计算时间;S5、利用近似动态规划算法求解调度方案。2.根据权利要求1所述的一种需求响应公交前瞻调度方法,其特征在于,步骤S1中,在滚动时域框架下,采用延迟批量匹配的方法将一周期的订单分配给车队,其原理是将运营时间范围划分为一组时长为T的周期集合P={p|p=1,2,

,|P|},随后令任一周期的乘车订单延迟后导入系统,直到该周期结束时将导入的订单匹配给车辆;匹配的结果有接受或拒绝两种,该结果在周期结束后经过预先设定的缓冲时间t
B
后便会通知乘客;每个周期中匹配的订单会在下一个周期执行,根据执行状态可以划分成已服务的订单和匹配但未服务的订单;由于已经被系统匹配并通知乘客,匹配但未服务的订单不允许被拒绝,其会在下一周期再次分配给车辆,再次分配的车辆既可以是同一辆车,也可以是另一辆车;滚动时域框架包括订单阶段、规划阶段、运营阶段和预测阶段,其阶段顺序是先进行订单阶段和预测阶段向系统导入订单,随后规划阶段对导入订单进行路线规划,最后在运营阶段执行规划出的路线;当前周期的调度计划与前一周期的执行状态相互关联;动态订单在周期|P|开始时刻不再导入,因此除了运营阶段外的所有阶段在周期|P|

1结束时终止,仅有运营阶段的车辆v还会在周期|P|执行周期|P|

1规划出的规划路线周期p+1导入的动态订单会导致周期p车辆v的规划路线的不完全执行;在随后的每个周期,运营商不仅要考虑周期p新导入动态订单从上车站i到下车站j的乘客还要考虑直至周期p从上车站i到下车站j的匹配但未服务的乘客由于规划阶段总是滞后于订单阶段一个周期,所以在每个周期的末尾处设置一个长度可以忽略的缓冲时间t
B
来规划动态订单;规划路线将在缓冲时间之后立即在运营阶段执行。3.根据权利要求2所述的一种需求响应公交前瞻调度方法,其特征在于,需求响应公交(DRT)调度问题是带时间窗的取送货车辆路径问题的一个变种,其在此基础上还考虑了多个车场、离开时间优化、等待时间优化、动态订单、乘客

车辆匹配和订单拒绝机制;在本发明中,将DRT调度问题建模为马尔可夫决策过程(MDP),具体如下:定义状态变量:在公式(1)中,表示周期p阶段k的状态变量;表示订单r的上车站在周期p阶段k的状态,如果乘客已上车,则否则,否则,表示订单r的下车站在周期p阶段k的状态,如果乘客已到达,则否则,否则,表示车辆v在周期p阶段k的位置;表示车辆v在周期p阶段k的剩余行驶里程;表示车辆v在周期p阶段k的剩余载客量;
表示车辆v在周期p阶段k的累积行驶时间;表示车辆v在周期p的超周期时间,如果车辆的行驶时间超过一个周期时间T,则否则,否则,表示车辆v在周期p的行驶路线;接下来推导周期p的总阶段|K
p
|的数值,为了简化符号表达,用符号k代表k
p
,即k=k
p
;用符号表示每周期最终阶段数|K
p
|,即对于阶段k,系统将把订单r分配给车辆v,并产生外部信息通过阶段转移方程获得下一阶段的状态变量;每个周期中,路线的规划是对所有导入的订单进行的,如果订单r在周期p被导入,则否则,例如,在第1周期,由于导入的订单还没被车辆服务,所以最终阶段数|K
p
|等于静态订单的站的数量;在第2周期到第|P|周期,|K
p
|是一个诱导变量,其每周期的具体值等于所有已导入订单的未服务的站点数量,具体如下:由于规划路线的执行时间可能超过一个周期时间T;执行时间可能只覆盖规划路线中的部分站点,即车辆不能在下一个周期p+1内执行完周期p的规划路线,使得状态变量信息混乱;为了解决这个问题,引入一个车辆v在周期p阶段k的超周期时间如果车辆的行驶时间超过一个周期时间T,则否则,定义决策变量:在公式(3)中,如果位于车场m的车辆v在周期p阶段k被使用,则否则,如果订单r在周期p阶段k分配给车辆v,则否则,如果车辆v在周期p阶段k从站i前往站j,则否则,否则,表示车辆v在周期p阶段k于站j的等待时间;构建情景如下:情景1:此情景表明,车场内的车辆v等待的时间为由于车辆在车场内等待,则车辆在当前阶段所前往的站点j仍然是车辆v的所属车场m
v
;如果车辆在订单r声明的最早上车时间ET
r
前到达其上车站,车辆需要在上车站i
r
等待;则一种合理的做法是让车辆在车场等待,等待时间的计算方法如下:在公式(4)中,d
ij
表示站i到站j的最短距离;表示车辆行驶速度,表示车辆v在周期p阶段k的累积行驶时间;
情景2:该情景表明出场车辆v从站i行驶至站j,其可以在站j等待;前往站j的在途车辆v可能有以下状态:1)车辆在前往上车站前是空车;2)车辆在前往上车站前车上有乘客;3)车辆前往下车站;由于没有规定下车站的时间窗口,所以将不讨论第三种状态;假设在前往上客站之前,车上仍然有乘客,如果此时车辆在最早上车时间ET
r
之前到达上车站,车辆必须等待一段时间;然而,在上车站等待对车上的乘客来说是不愿意的;更重要的是,在DRT调度的滚动时域规划框架下,当车辆v在周期p阶段k于站j的等待时间足够长时,周期时间T可能会被超出,导致该周期的决策是无效的;因此,当有车上的乘客时,应该避免需要等待的上车站;为此,引入如下限制:在做出调度决策之前,状态变量中的已经记录了车辆v在周期p的行驶路线;如果中包括与所服务的上车站相对应的下车站,即车上没有乘客,那么车辆可以去任何一个上车站,且车辆v在周期p阶段k于站j的等待时间由公式(4)计算;否则,车上存在乘客,则车辆只允许去能在时间窗内到达的上车点;如果车辆在车内有乘客的前提下提前到达上车站,则表示其规划路线是错误的;情景3:该情景表示出场车辆v返回到所属车场m
v
。4.根据权利要求3所述的一种需求响应公交前瞻调度方法,其特征在于,定义约束条件:件:件:件:件:件:件:件:
其中,约束条件(5)要求每个车场有最大的可用车数量;约束条件(6)要求每辆车在每个周期最多只能被使用一次;约束条件(7)确保所有提交的订单都要被导入系统;约束条件(8)确保所有的订单都在周期|P|的开始时刻得到处理;约束条件(9)确保所有导入的订单应该在最终阶段从上车站被送到对应的下车站;约束条件(10)指出从周期1到周期|P|

1,订单r最多可以被决策两次;由于每个阶段的路线决策只包含订单r的一个上车站或下车站,并且每个订单只能由一辆车提供服务,因此在每个周期都有两个与订单r相关的的决策;由于和构成一个元组,所以最多有两个决策;约束条件(11)指出,在周期|P|内无决策;约束条件(12)和约束条件(13)分别确保分配的订单不超过车辆的剩余行驶距离和剩余容量;约束条件(14)要求车辆的迟到不超过阈值约束条件(15)定义了超周期时间的时长约束;约束条件(16)

(19)说明了决策变量的属性,如果位于车场m的车辆v在周期p阶段k被使用,则否则,如果车辆v在周期p阶段k从站i前往站j,则否则,定义状态转移方程:(1)阶段状态转移方程阶段状态转换方程描述了不同决策变量下状态变量的各属性变化,其目的是为了规划各周期的路线;周期p阶段k的状态变量中每个属性的转移函数取决于决策变量的情景,具体如下:中每个属性的转移函数取决于决策变量的情景,具体如下:中每个属性的转移函数取决于决策变量的情景,具体如下:中每个属性的转移函数取决于决策变量的情景,具体如下:
在公式(21)和(22)中,一旦车辆被派往上车站或下车站,和分别被更新;公式(23)指定了车辆v的位置;在公式(24)中,对于情景1,车辆v的剩余行驶距离不变;对于情景2,车辆v的剩余行驶距离减少了站i和站j之间的最短距离;对于情景3,剩余行驶距离在车辆返回车场时被更新为最大行驶距离;在公式(25)中,对于情景1,车辆v的剩余容量不变;对于情景2,车辆v的剩余容量减少了订单r的乘客数量;对于情景3,当车辆返回车场时,容量被更新为最大载客量;在公式(26)中,对于情景1,车辆v的累积行驶时间增加了在车场的等待时间;对于情景2,车辆v的累积行驶时间增加了在站i和站j之间的行驶时间;对于情景3,累积行驶时间增加了行驶时间、等待时间和服务时间;(2)周期状态转移方程尽管阶段状态转移方程使用周期p阶段k的状态变量规划每个周期的路线,但由于车辆v在周期p的规划路线尚未执行,所以状态变量的值不会改变,车辆v在周期p+1的行驶路线只有在周期p+1的时间T内执行周期p的规划路线后才能确定;因此,需要周期状态转换方程周期p变化至周期p+1的外部信息G
p
可以根据规划路线和周期时间T得到;下一周期的初始状态变量可以通过周期状态转移方程来迭代计算;基于这一原则,各周期之间的外部信息G
p
可按如下方式获得;车辆v在周期p的实际可用行驶时间是外部信息G
p
来自于可用行驶时间内的路线执行长度;具体来说,首先确定可用行驶时间是耗尽时车辆行驶到哪一站,将途经的各站与该站构成行驶路线下一周期的状态变量可以通过计算行驶路线对产生的变化来得到。5.根据权利要求4所述的一种需求响应公交前瞻调度方法,其特征在于,定义目标函数:DRT调度的成本包括固定运输成本、变动运输成本和时间罚款成本;固定运输成本与使用的车辆数量有关,计算公式如下:
在上述表达式中,β
f
表示每辆车固定运输成本;变动运输成本取决于行驶距离;由于在每个阶段k都会产生新的路径,则变动运输成本可以计算如下:时间窗违背惩罚成本包括早到和迟到;一般来说,迟到比早到危害更大,所以迟到惩罚系统β
l
和早到惩罚系数β
e
满足β
l
&gt;β
e
;如果车辆的到达时间在指定的时间窗内,则惩罚成本为0;否则,惩罚成本取决于违背时段的长短;而订单r的早到和晚到时间分别可计算为和每阶段的时间窗违背惩罚成本计算如下:DRT模型的价值函数与每个阶段k的新产生的成本有关;周期p的阶段k的成本等于前一阶段的成本加上该阶段产生的变动运输成本和惩罚成本如下所示:由于固定运输成本是在最终周期的阶段计算,则最后阶段的成本应加上固定运输成本CF,具体如下:为了将DRT问题表述为SADP模型,基于贝尔曼方程提出了以下最佳状态价值函数:其中,是周期p的阶段k执行路径策略的最佳状态价值函数;在前瞻调度下,预测的随机订单矩阵的出现概率值需要纳入目标函数;然而,只能预测周期p+1的未来需求,而不是在后续所有周期的(从周期p+1到|P|...

【专利技术属性】
技术研发人员:巫威眺邹弘辉卢凯
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1