【技术实现步骤摘要】
本专利技术涉及路径规划领域,特别涉及一种基于强化学习的车辆路径规划方法及系统。
技术介绍
1、随着现代社会的快速发展,道路中的车辆数量快速增长带来了交通拥堵、环境污染等诸多问题。当前,交通拥堵问题已经成为人们所关注的主要出行问题,建立一个出行路线规划的系统是缓解交通拥堵、提高出行质量的有效措施。在过去的十年中,人们设计出了很多优化道路容量利用的算法来解决交通拥堵问题。提出了三类方法来解决交通拥堵问题:(1)利用历史和实时传感器数据来检测和预测交通拥堵;(2)通过优化控制交通信号来解决交通拥堵问题;(3)通过对车辆进行路径规划来解决交通拥堵问题。其中,路径规划是一种比较好的解决方案,并得到了广泛的研究。
2、路径规划在现代社会的各个领域中都具有重要意义。从自动驾驶汽车和机器人导航到无人机飞行和物流管理,路径规划技术的应用范围广泛,对提高效率、降低成本和改善生活质量产生了积极的影响。路径规划的目标是找到从一个地点到另一个地点的最佳路径,同时满足各种约束条件,如避免障碍物、最小化能源消耗或遵守交通规则。在解决这些问题时,需要考虑环
...【技术保护点】
1.一种基于强化学习的车辆路径规划方法,其特征在于,具体包括以下步骤:
2.根据权利要求1所述的一种基于强化学习的车辆路径规划方法,其特征在于,智能体最近每次作出的决定包括直行、左转、右转以及掉头,每个智能体执行动作之后,根据执行该动作达到的下一状态计算奖励值。
3.根据权利要求2所述的一种基于强化学习的车辆路径规划方法,其特征在于,计算智能体执行动作后获取的奖励值包括:
4.根据权利要求3所述的一种基于强化学习的车辆路径规划方法,其特征在于,当天气为晴天时,当前天气对车辆行驶速度的影响因子的值设置为1.2;当天气为下雪时,当前天气
...【技术特征摘要】
1.一种基于强化学习的车辆路径规划方法,其特征在于,具体包括以下步骤:
2.根据权利要求1所述的一种基于强化学习的车辆路径规划方法,其特征在于,智能体最近每次作出的决定包括直行、左转、右转以及掉头,每个智能体执行动作之后,根据执行该动作达到的下一状态计算奖励值。
3.根据权利要求2所述的一种基于强化学习的车辆路径规划方法,其特征在于,计算智能体执行动作后获取的奖励值包括:
4.根据权利要求3所述的一种基于强化学习的车辆路径规划方法,其特征在于,当天气为晴天时,当前天气对车辆行驶速度的影响因子的值设置为1.2;当天气为下雪时,当前天气对车辆行驶速度的影响因子的值设置为0.6;当天气为下雨时时,当前天气对车辆行驶速度的影响因子的值设置为0.8;当天气为其他非恶劣天气时,当前天气对车辆行驶速度的影响因子的值设置为1.0;当天气为恶劣天气时,当前天气对车辆行驶速度的影响因子的值设置为0.5。
5.根据权利要求3所述的一种基于强化学习的车辆路径规划方法,其特征在于,在道路畅通时,当前时刻交通路口流量对车辆行驶速度的影响的值为1;在缓行情况时,当前时刻交通路口流量对车辆行驶速度的影响的值为1/2;在拥堵情况下,当前时刻交通路口流量对车辆行驶速度的影响的值为1/3;在严重拥堵情况下,当前时刻交通路口流量对车辆行驶速度的影响的值为1/4。
6.根据权利要求3所...
【专利技术属性】
技术研发人员:胡思楠,卢星宇,刘宴兵,孟凯,涂琪琳,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。