System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于深度学习的新能源公交车跨线路运营方法技术_技高网

一种基于深度学习的新能源公交车跨线路运营方法技术

技术编号:40315746 阅读:7 留言:0更新日期:2024-02-07 20:57
本发明专利技术提供了一种基于深度学习的新能源公交车跨线路运营方法,通过建立基于SAC算法的神经网络并利用包括跨线调度的公交线路网络历史数据进行训练,能够有效提高整个公交线路网络的运营效率并减少不必要的空驶成本。利用线路存在重叠的不同线路运行数据对神经网络进行二次训练,可以使神经网络对公交网络规划或乘客主观因素所导致的客流变化具有更强的适应性,从而显著提高跨线路调度及整改公交网络的运营效率。

【技术实现步骤摘要】

本专利技术属于公交车辆运营与调度,具体涉及一种基于深度学习的新能源公交车跨线路运营方法


技术介绍

1、在公共交通网络运行中,客流与相应运力需求的潮汐现象长期存在,使得一些公交线路常会发生高峰时段运力资源不足、非高峰时段运力过盛的情况,而对于这种情况现有的公交线路排班方式还无法有效解决,虽然根据时段设置不同的发车间隔能够部分缓解高峰期的运力紧张,但对于客流量变化缺乏较好的动态适应性,更无法应对事故、交通管制等偶发事件所导致的极高运力需求,因而限制了公交线路网络的整体运行效率。


技术实现思路

1、有鉴于此,针对本领域中存在的技术问题,本专利技术提供了一种基于深度学习的新能源公交车跨线路运营方法,通过在公交线路网络中设置多辆公交车,使其在需要时变更行驶线路以提升整体运力运营效率。所述方法具体包括以下步骤:

2、步骤一、针对一定时期内整个公交线路网络中各站点在每日不同时段的历史乘客人数进行统计,并获取包括各线路站点编号lk、时段p、公交网络中的乘客总人数np的历史数据;对各条公交线路的始发与终点站点分配相应的站点编号;对可跨线路调度公交车分配相应编号x,并记录其在不同线路上运行时的历史线路编号,每次运行之在不同始发站间的空驶距离dx,跨线路调度的历史事件可以由人工调度或基于现有调度模型或方法实现;

3、步骤二、建立基于sac(soft actor-critic,柔性动作-评价)算法的神经网络,用于对可跨线路调度的各公交车指派每次运行的公交线路,所述神经网络由critic网络、actor网络、二叉树和经验池组成,其中经验池用于为critic网络和actor网络提供训练所需的样本;

4、步骤三、以时段p、各可跨线调度公交车的当前线路编号l与当前站点编号lk以及至终点站剩余的站点数m作为状态变量构造状态空间,以选择后续线路编号l’作为动作变量并构造动作空间,考虑公交网络的乘客总人数np、车辆变更线路时的总空驶距离∑dx建立相应的奖励函数;

5、利用步骤一得到的数据建立训练集输入步骤二所建立的神经网络,使sac算法智能体根据实时的状态选择相应动作与生成奖励,并进入下一时刻状态;对神经网络训练直至算法稳定收敛;

6、步骤四、对于任意公交线路lr中与其他线路存在道路和行驶方向重叠的区段,将其他线路的相同区段历史数据中的各站点编号修改为线路lr上的对应站点编号,由此建立一个二次训练集;利用该二次训练集对步骤三得到的神经网络再次执行相同的训练过程直至算法稳定收敛;

7、步骤五、将步骤四得到的训练好的神经网络在线应用于对可跨线调度公交车的实时指派调度,通过获取当前时段各线路站点的乘客人数、各可跨线调度公交车所在的线路信息,分别确定各车下一次的运行线路。

8、进一步地,步骤一中获取历史数据时具体选择每日不同时段的客流变化存在一定相似性的一定时期,例如针对连续几年的相同月份、季节获取历史数据,或基于中小学学期或假期进行获取历史数据;对于具有上下行两方向的公交线路,将其作为两条不同的公交线路来获取历史数据,而对于环线则仅作为一条线路;针对所述乘客总人数np具体以电子购票事件的发生次数进行统计。

9、进一步地,步骤二中所建立的建立基于sac算法的神经网络具体包括:一个actor网络、四个critic网络、一个经验池、一个二叉树结构;其中,四个critic网络具体为两个当前critic网络q1、q2和两个目标critic网络q′1、q′2。

10、进一步地,针对所述神经网络具体定义以下奖励函数:

11、r=[ω1·np-ω2·∑dx]

12、其中,ω1为运力因子,ω2为空驶距离因子。

13、进一步地,步骤三和步骤四中对神经网络的训练过程均通过以下步骤实现:

14、(1)初始化神经网络中的各网络参数:包括πφ的网络参数φ、当前critic网络和目标critic网络的网络参数θ1、θ2、θ′1、θ′2;设置经验池为空,以及二叉树所有子节点的样本优先级p;

15、(2)将训练集输入sac算法,使其根据当前时刻状态st,选择动作at,包括在所述m>1时,保持所述后续线路编号l’=当前线路编号l,而m=1时则选择新的后续线路编号l’,同时获得奖励rt并进入下一时刻状态st+1,将序列[st,at,rt,st+1]作为样本存入经验池;

16、(3)通过以下步骤从经验池中采集出n个样本:

17、首先计算采样概率:j表示样本在经验池中的序号,p表示样本的优先级,ρ表示优先级因子;

18、再根据采样概率p的大小从经验池中采集样本;

19、最后计算每个样本的重要性采样权重:b表示经验池中的样本总数,β表示重要性采样因子;

20、(4)利用步骤(3)采集的样本训练critic网络,包括:

21、首先选择目标动作:at+1=fφ(εt;st+1),fφ表示动作分布,εt表示动作噪声,表示动作噪声分布;

22、然后计算目标q值:i表示critic网络的编号,γ表示折扣因子,α表示策略探索因子,表示目标critic网络计算出的q值;

23、计算critic网络损失函数:表示当前q值,e[·]表示数学期望;

24、之后利用随机梯度下降方法更新当前critic网络的参数:其中,λθ表示critic网络的学习率,是梯度运算符号;

25、完成目标critic网络参数:θ′i←τθi+(1-τ)θ′i,τ为更新因子;

26、(5)利用步骤(3)采集的样本训练actor网络,包括:

27、首先计算actor网络损失函数:

28、然后同样利用随机梯度下降方法更新actor网络参数:λφ表示actor网络的学习率,表示函数l(φ)对φ的梯度;

29、计算actor网络考虑熵的损失并更新系数其中,为目标熵,λα为l(α)的学习率,为函数l(α)对α的梯度;

30、对actor网络和critic网络每完成一个训练回合,计算时序差分误差ξ并更新二叉树各子节点的样本优先级p。

31、进一步地,在训练中针对跨线路调度时各车的空驶距离设置阈值约束,用于提高训练速度以及训练好的神经网络的调度效率。

32、上述本专利技术所提供的基于深度学习的新能源公交车跨线路运营方法,通过建立基于sac算法的神经网络并利用包括跨线调度的公交线路网络历史数据进行训练,能够有效提高整个公交线路网络的运营效率并减少不必要的空驶成本。利用线路存在重叠的不同线路运行数据对神经网络进行二次训练,可以使神经网络对公交网络规划或乘客主观因素所导致的客流变化具有更强的适应性,从而显著提高跨线路调度及整改公交网络的运营效率。

本文档来自技高网...

【技术保护点】

1.一种基于深度学习的新能源公交车跨线路运营方法,其特征在于:具体包括以下步骤:

2.如权利要求1所述的方法,其特征在于:步骤一中获取历史数据时具体选择每日不同时段的客流变化存在一定相似性的一定时期;对于具有上下行两方向的公交线路,将其作为两条不同的公交线路来获取历史数据,而对于环线则仅作为一条线路;针对所述乘客总人数Np具体以电子购票事件的发生次数进行统计。

3.如权利要求1所述的方法,其特征在于:步骤二中所建立的建立基于SAC算法的神经网络具体包括:一个Actor网络、四个Critic网络、一个经验池、一个二叉树结构;其中,四个Critic网络具体为两个当前Critic网络Q1、Q2和两个目标Critic网络Q′1、Q′2。

4.如权利要求3所述的方法,其特征在于:针对所述神经网络具体定义以下奖励函数:

5.如权利要求4所述的方法,其特征在于:步骤三和步骤四中对神经网络的训练过程均通过以下步骤实现:

6.如权利要求1所述的方法,其特征在于:在训练中针对跨线路调度时各车的空驶距离设置阈值约束,用于提高训练速度以及训练好的神经网络的调度效率。

...

【技术特征摘要】

1.一种基于深度学习的新能源公交车跨线路运营方法,其特征在于:具体包括以下步骤:

2.如权利要求1所述的方法,其特征在于:步骤一中获取历史数据时具体选择每日不同时段的客流变化存在一定相似性的一定时期;对于具有上下行两方向的公交线路,将其作为两条不同的公交线路来获取历史数据,而对于环线则仅作为一条线路;针对所述乘客总人数np具体以电子购票事件的发生次数进行统计。

3.如权利要求1所述的方法,其特征在于:步骤二中所建立的建立基于sac算法的神经网络具体包括:一个actor网络、四个c...

【专利技术属性】
技术研发人员:辛涛安振佳刘强唐晓猛杨芳张宇黄建民张欣莹
申请(专利权)人:隆瑞三优新能源汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1