一种融合全局寻优与安全防护的智能驾驶优化控制方法技术

技术编号:42713579 阅读:34 留言:0更新日期:2024-09-13 12:03
一种融合全局寻优与安全防护的智能驾驶优化控制方法,为解决当前智能驾驶控制策略存在易陷入局部最优以及泛化能力较差等问题。本发明专利技术涉及智能驾驶领域。本发明专利技术包括上下两层,上层通过强化学习全局寻优确定航向角和速度参考序列并输入给下层,下层通过优化求解确定控制动作,控制车辆实现智能驾驶。其中,上层包括驾驶环境、强化学习模块、环境预测模块,下层包括MPC控制模块和动作转换模块。上层的强化学习模块通过与驾驶环境交互展开训练;训练完成后的强化学习模块通过与环境预测模块的交互获取航向角和速度参考序列;下层的MPC控制模块与动作转换模块利用上层提供的航向角和速度参考序列优化出最优控制动作,控制车辆实现智能驾驶。

【技术实现步骤摘要】

:本专利技术属于智能驾驶领域,具体地说是一种融合全局寻优与安全防护的智能驾驶优化控制方法


技术介绍

0、技术背景:

1、城市道路与高速路交通流是当今智能驾驶车辆所要面对的重要交通场景。这些场景中交通参与者数量多、种类多,提高了交通场景的复杂程度,导致智能驾驶面临巨大的挑战。智能驾驶主要包含巡航功能与避撞功能,尤其避撞功能是保证车辆行驶安全的最后一道防线。为了提升通行效率,车辆需以尽可能高的速度穿越交通流,但此过程需保证无碰撞事件发生。

2、智能驾驶功能的实现需要使用多种传感器和摄像头获取车辆前方的路况信息。根据感知到的信息智能驾驶车辆完成巡航与避撞任务,常见的实现方式为路径规划及跟踪控制,但这样的方法面对道路上的突发情况效果较为低下。近年来,深度强化学习在智能驾驶中的应用逐渐广泛,拥有全局寻优特点的强化学习方法往往能学习到丰富的事件样本,当在线应用时便可应对复杂的突发事件。

3、模型预测控制是常见的智能驾驶控制方法,通过控制智能车辆跟踪路径轨迹等方式实现智能驾驶功能。虽然模型预测控制方法能够处理带约束优化问题起到安全防本文档来自技高网...

【技术保护点】

1.一种融合全局寻优与安全防护的智能驾驶优化控制方法,其特征在于:该方法包括上下两层,上层通过强化学习全局寻优确定航向角和速度参考序列并输入给下层,下层通过优化求解确定控制动作,控制车辆实现智能驾驶;其中,上层包括驾驶环境、强化学习模块、环境预测模块,下层包括MPC控制模块和动作转换模块;首先,强化学习模块通过与驾驶环境的交互展开训练;其次,训练完成的强化学习模块通过与环境预测模块的交互,获取航向角和速度参考序列;再次,MPC控制模块利用上层提供的航向角和速度参考序列优化出最优控制指令;最后,动作转换模块将MPC控制模块优化求解的控制指令转换为驾驶环境中智能驾驶车辆的控制动作,控制车辆实...

【技术特征摘要】

1.一种融合全局寻优与安全防护的智能驾驶优化控制方法,其特征在于:该方法包括上下两层,上层通过强化学习全局寻优确定航向角和速度参考序列并输入给下层,下层通过优化求解确定控制动作,控制车辆实现智能驾驶;其中,上层包括驾驶环境、强化学习模块、环境预测模块,下层包括mpc控制模块和动作转换模块;首先,强化学习模块通过与驾驶环境的交互展开训练;其次,训练完成的强化学习模块通过与环境预测模块的交互,获取航向角和速度参考序列;再次,mpc控制模块利用上层提供的航向角和速度参考序列优化出最优控制指令;最后,动作转换模块将mpc控制模块优化求解的控制指令转换为驾驶环境中智能驾驶车辆的控制动作,控制车辆实现智能驾驶。

2.根据权利要求1所述的一种融合全局寻优与安全防护的智能驾驶优化控制方法,其特征在于:所述驾驶环境分为四个场景类型,它们分别为定速巡航场景、跟车巡航场景、紧急避撞场景与换道避撞场景。

3.根据权利要求1所述的一种融合全局寻优与安全防护的智能驾驶优化控制方法,其特征在于:所述强化学习模块的状态空间定义为st={v1,d1,v2,d2,…,vi,di,θ,x,y,vego};vi为周车车速,di为自车与周车之间的距离,i为周车的数量,i=1,…,n,θ为自车的航向角,x与y分别为自车的横纵向位置坐标,vego为自车的车速;所述强化学习模块的动作空间定义为at=[throttle,brake,steer],throttle为车辆加速动作,brake为车辆制动动作,steer为车辆转向动作...

【专利技术属性】
技术研发人员:卢晓晖张鹏飞班明霞李绍松熊瑞霞李德涛许奇珮崔高健宋美怡史钰志
申请(专利权)人:长春工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1