一种基于强化学习的车辆路径规划方法及系统技术方案

技术编号:40664458 阅读:21 留言:0更新日期:2024-03-18 18:58
本发明专利技术涉及路径规划领域,特别涉及一种基于强化学习的车辆路径规划方法及系统,方法包括通过交通路网构建有向图,有向图中一个节点为交通路网中的一个路口,若两个节点之间存在道路连接则两个节点之间存在一条边;获取实时的交通流信息,根据交通流的拥堵情况为有向图中的边赋予权重,拥堵情况越严重边权重越低;将有向图输入到图卷积网络中,从有向图中提取得到路况流量特征矩阵;将车辆视为一个智能体,每到达一个节点智能体根据当前状态选择执行的动作,并根据选择的动作更新智能体的状态;智能体选择的动作为在该节点处的前进方向,将路况流量特征矩阵、当前智能体所在的位置矩阵和目的地所在的位置矩阵拼接在一起作为智能体的状态。

【技术实现步骤摘要】

本专利技术涉及路径规划领域,特别涉及一种基于强化学习的车辆路径规划方法及系统


技术介绍

1、随着现代社会的快速发展,道路中的车辆数量快速增长带来了交通拥堵、环境污染等诸多问题。当前,交通拥堵问题已经成为人们所关注的主要出行问题,建立一个出行路线规划的系统是缓解交通拥堵、提高出行质量的有效措施。在过去的十年中,人们设计出了很多优化道路容量利用的算法来解决交通拥堵问题。提出了三类方法来解决交通拥堵问题:(1)利用历史和实时传感器数据来检测和预测交通拥堵;(2)通过优化控制交通信号来解决交通拥堵问题;(3)通过对车辆进行路径规划来解决交通拥堵问题。其中,路径规划是一种比较好的解决方案,并得到了广泛的研究。

2、路径规划在现代社会的各个领域中都具有重要意义。从自动驾驶汽车和机器人导航到无人机飞行和物流管理,路径规划技术的应用范围广泛,对提高效率、降低成本和改善生活质量产生了积极的影响。路径规划的目标是找到从一个地点到另一个地点的最佳路径,同时满足各种约束条件,如避免障碍物、最小化能源消耗或遵守交通规则。在解决这些问题时,需要考虑环境的复杂性和不确定性本文档来自技高网...

【技术保护点】

1.一种基于强化学习的车辆路径规划方法,其特征在于,具体包括以下步骤:

2.根据权利要求1所述的一种基于强化学习的车辆路径规划方法,其特征在于,智能体最近每次作出的决定包括直行、左转、右转以及掉头,每个智能体执行动作之后,根据执行该动作达到的下一状态计算奖励值。

3.根据权利要求2所述的一种基于强化学习的车辆路径规划方法,其特征在于,计算智能体执行动作后获取的奖励值包括:

4.根据权利要求3所述的一种基于强化学习的车辆路径规划方法,其特征在于,当天气为晴天时,当前天气对车辆行驶速度的影响因子的值设置为1.2;当天气为下雪时,当前天气对车辆行驶速度的影响...

【技术特征摘要】

1.一种基于强化学习的车辆路径规划方法,其特征在于,具体包括以下步骤:

2.根据权利要求1所述的一种基于强化学习的车辆路径规划方法,其特征在于,智能体最近每次作出的决定包括直行、左转、右转以及掉头,每个智能体执行动作之后,根据执行该动作达到的下一状态计算奖励值。

3.根据权利要求2所述的一种基于强化学习的车辆路径规划方法,其特征在于,计算智能体执行动作后获取的奖励值包括:

4.根据权利要求3所述的一种基于强化学习的车辆路径规划方法,其特征在于,当天气为晴天时,当前天气对车辆行驶速度的影响因子的值设置为1.2;当天气为下雪时,当前天气对车辆行驶速度的影响因子的值设置为0.6;当天气为下雨时时,当前天气对车辆行驶速度的影响因子的值设置为0.8;当天气为其他非恶劣天气时,当前天气对车辆行驶速度的影响因子的值设置为1.0;当天气为恶劣天气时,当前天气对车辆行驶速度的影响因子的值设置为0.5。

5.根据权利要求3所述的一种基于强化学习的车辆路径规划方法,其特征在于,在道路畅通时,当前时刻交通路口流量对车辆行驶速度的影响的值为1;在缓行情况时,当前时刻交通路口流量对车辆行驶速度的影响的值为1/2;在拥堵情况下,当前时刻交通路口流量对车辆行驶速度的影响的值为1/3;在严重拥堵情况下,当前时刻交通路口流量对车辆行驶速度的影响的值为1/4。

6.根据权利要求3所...

【专利技术属性】
技术研发人员:胡思楠卢星宇刘宴兵孟凯涂琪琳
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1