当前位置: 首页 > 专利查询>吉林大学专利>正文

基于深度强化学习的车辆节能运动规划模型及方法技术

技术编号:37232544 阅读:30 留言:0更新日期:2023-04-20 23:15
本发明专利技术适用于车辆节能运动规划领域,提供了基于深度强化学习的车辆节能运动规划模型,包括:感知模块,获取车辆自身的运动状态信息同时感知模块获取其他交通道路信息;决策模块,利用深度Q网络作为决策算法,将车辆行驶时的纵向性能、车辆行驶时的瞬时能耗和行驶安全性的因素作为奖励函数的设置依据;控制模块,将决策层的控制结果传入Carla中的车辆动力学模型中。基于深度强化学习的车辆节能运动规划方法,包括以下步骤:步骤(1):初始化一个Action

【技术实现步骤摘要】
基于深度强化学习的车辆节能运动规划模型及方法


[0001]本专利技术属于车辆节能运动规划领域,尤其涉及一种基于深度强化学习的车辆节能运动规划模型及方法。

技术介绍

[0002]目前车辆节能行驶系统的决策算法的研究在大多数集中在将不同的传统算法进行融合,例如将模型预测控制算法引入修正项或利用模糊PID控制算法等。但是以上仅考虑车辆运动关系模型的算法虽然在工程上有较多应用,不过难以应对复杂的行驶工况。
[0003]能够对无人驾驶车辆在行驶过程中遭遇到的扰动和车辆周边的环境变化做出适当反应的深度强化学习在无人驾驶领域表现出不俗的性能。随着深度强化学习算法的不断创新以及硬件的计算能力逐渐提高,通过使用深度强化学习提高无人驾驶车辆的经济性驾驶能力会越来越成为研究的热点。
[0004]本专利技术将实现深度强化学习算法和车辆经济性驾驶相融合,应对复杂的车辆行驶工况和周车的影响,实现车辆燃油经济性的优化。

技术实现思路

[0005]本专利技术的目的在于提供一种基于深度强化学习的车辆节能运动规划模型及方法,旨在实现深度强化学习算法本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于深度强化学习的车辆节能运动规划模型,其特征在于,包括:感知模块,利用开源车辆仿真器Carla和Python的API接口获取车辆自身的运动状态信息,同时感知模块利用Carla中的传感器资源获取其他交通道路信息;决策模块,使用深度Q网络算法,根据不同的行驶工况设置算法的奖励函数,利用深度Q网络作为决策算法,将车辆行驶时的纵向性能、车辆行驶时的瞬时能耗和行驶安全性的因素作为奖励函数的设置依据,最终将深度Q网络的决策结果传到下层;控制模块,将决策层的控制结果传入Carla中的车辆动力学模型中,利用加速踏板开度和制动踏板开度控制车辆的纵向特征。2.根据权利要求1所述的基于深度强化学习的车辆节能运动规划模型,其特征在于,所述感知模块中,获取车辆自身的运动状态信息包括车辆瞬时速度、瞬时加速度以及车辆所处位置。3.根据权利要求1所述的基于深度强化学习的车辆节能运动规划模型,其特征在于,所述感知模块中,利用Carla中丰富的传感器资源获取的交通道路信息包括利用RGB摄像机获取图像信息以及利用碰撞传感器获取车辆碰撞信息。4.基于深度强化学习的车辆节能运动规划方法,其特征在于,包括以下步骤:步骤(1):初始化一个Action
‑...

【专利技术属性】
技术研发人员:刘奇芳孙大朕靳英豪王金鹏王家林
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1