基于交通流速度预测和信号灯状态的车辆路径规划方法技术

技术编号:37989117 阅读:33 留言:0更新日期:2023-06-30 10:03
本发明专利技术提供了一种基于交通流速度预测和信号灯状态的车辆路径规划方法,包括:基于每条路径多个历史时间区间的平均行驶速度,利用mWDN

【技术实现步骤摘要】
基于交通流速度预测和信号灯状态的车辆路径规划方法


[0001]本专利技术属于智能交通
,具体涉及一种基于交通流速度预测和信号灯状态的车辆路径规划方法。

技术介绍

[0002]随着自动驾驶、车载传感、车辆定位等新技术、新理论的不断研究与应用,为解决交通拥堵问题提供了新的思路和方案。在车联网、全球定位系统以及人工智能等新技术的不断融合下,智能交通系统能依据城市道路中各路段的交通流信息,通过路径规划方法为用户提供交通行驶建议,减少了车辆通行时间,缓解了交通拥堵。
[0003]然而,在城市路况下,现有的路径规划方案,仅仅考虑车流密度、道路长度和道路工况等因素,忽略了交通信号灯状态对车辆通行时间的影响,因此规划出的路径耗时仍然较长,未能做到最大化减少车辆通行时间,影响车辆通行效率的大幅度提高。

技术实现思路

[0004]考虑到上述情况,本专利技术的目的是提供一种基于交通流速度预测和信号灯状态的车辆路径规划方法,能规划车辆耗时较短的路径,可最大化减少车辆通行时间,大幅度提高车辆通行效率。
[0005]为了实现上述目的,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于交通流速度预测和信号灯状态的车辆路径规划方法,包括:步骤S100:获取路网中所有路径在当前时间区间之前的多个历史时间区间中每个历史时间区间的平均行驶速度;步骤S200:基于每条路径在当前时间区间之前每个历史时间区间的平均行驶速度,利用mWDN

LSTM

ARIMA 模型预测每条路径在当前时间区间的平均行驶速度;步骤S300: 根据每条路径在当前时间区间的平均行驶速度预测值,预测路网中对应路径在当前时间区间的通行时间;步骤 S400:利用训练样本车辆在路网中从初始训练位置行驶至终点训练位置过程中实时的位置信息、路网中所有路口的交通信号灯实时的相位状态信息、以及路网中所有路径实时的通行时间预测值,基于PPO算法训练深度强化学习模型,得到训练好的深度强化学习模型,所述训练好的深度强化学习模型的输出为从当前训练位置所在路径预行驶至下一路径所即将执行的动作;步骤S500,当接收到车主发送的目标车辆路径规划请求后,基于训练好的深度强化学习模型,确定出目标车辆从当前位置所在路径预行驶至下一路径所即将执行的动作,并将包含即将执行的动作的信息发送至目标车辆以使车主行驶至目的地,其中目标车辆路径规划请求包含目标车辆发送请求时的当前时间、初始位置和目的地位置信息。2.如权利要求1所述的基于交通流速度预测和信号灯状态的车辆路径规划方法,其特征在于,所述步骤S400具体包括:步骤S410,采样者on

policy获取训练样本车辆的观测值所包含的数据,其中训练样本车辆的观测值包括训练样本车辆在当前训练时刻的训练位置和终点训练位置、路网中每条路径在当前训练时刻的通行时间预测值、路网中所有路口的交通信号灯在当前训练时刻的相位状态;步骤S420: 利用actor 神经网络,根据训练样本车辆的观测值输出训练样本车辆的所有动作的概率分布;利用critic神经网络,根据训练样本车辆的观测值输出训练样本车辆所处路网环境的状态价值,其中训练样本车辆所处路网环境的状态价值表征训练样本车辆在当前位置所在路径行驶到达下一个路径的通行时间评估值;步骤 S430: actor 神经网络根据训练样本车辆的所有动作的概率分布,将概率最大的动作设置为训练样本车辆从当前训练位置所在路径预行驶至下一路径所即将执行的动作;步骤 S440: actor 神经网络将包含即将执行的动作的信息发送至训练样本车辆,以使训练样本车辆执行所述信息指示的动作;步骤S450,检测到训练样本车辆行驶到下一个路径时,采样者on

policy确定训练样本车辆对应当前路径之上一路径的奖励,其中训练样本车辆对应当前路径之上一路径的奖励为训练样本车辆在当前路径之上一路径上行驶到达当前路径的时间的相反数;步骤 S460:actor 神经网络判断训练样本车辆是否到达终点训练位置,如果否,转步骤S410,如果是,继续下一步;步骤 S470: actor 神经网络根据采样者on

policy确定出的训练样本车辆所有路径的奖励计算训练样本车辆的累计折扣奖励;步骤 S480: actor 神经网络根据训练样本车辆的累计折扣奖励和critic神经网络最
后一次输出的训练样本车辆所处路网环境的状态价值计算损失函数;步骤S490,actor 神经网络判断损失函数的值是否收敛,如果否,则继续下一步;如果是,则结束;步骤S491: actor 神经网络根据计算出的损失函数更新actor 神经网络和critic神经网络的神经网络参数;步骤S492,将训练样本车辆的位置更新为初始训练位置,转步骤S410。3.如权利要求2所述的基于交通流速度预测和信号灯状态的车辆路径规划方法,其特征在于,所述步骤S492之前,还包括:判断actor 神经网络和/或critic神经网络的神经网络参数的更新次数是否大于预定次数,如果是,则将actor 神经网络和/或critic神经网络的神经网络参数赋值给采样者on

policy的神经网络参数,然后进行步骤S492;如果否,直接进行步骤S492。4.如权利要求3所述的基于交通流速度预测和信号灯状态的车辆路径规划方法,其特征在于,步骤S430中actor神经网络和critic神经网络均由依次连接的一层卷积层和两层全连接层组成,actor神经网络的输出维度为3,critic神经网...

【专利技术属性】
技术研发人员:刘冰艺陈葳旸宋斌韩玮祯熊盛武
申请(专利权)人:武汉理工大学三亚科教创新园
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1