基于深度强化学习的自动驾驶车辆决策的方法和装置制造方法及图纸

技术编号:45870856 阅读:17 留言:0更新日期:2025-07-19 11:27
本发明专利技术涉及一种基于深度强化学习的自动驾驶车辆决策的方法和装置,属于智能驾驶技术领域,其中,该方法包括:获取目标车辆的环境信息;基于环境信息以车辆的速度最大化为目标构建换道效益函数;基于换道效益函数构建的横向决策控制模型,基于第一预设深度强化学习算法对所述横向决策控制模型进行训练,得到选择换道动作的价值;构建目标车辆的纵向决策控制模型,基于第二预设深度强化学习算法对纵向决策控制模型进行训练,处理跟驰决策并输出连续车速控制;对横向决策控制模型和纵向决策控制模型根据记忆池存储的经验进行耦合模型训练,得到目标车辆的驾驶决策。本发明专利技术通过换道效益函数对换道效益进行量化,从而提高了自动驾驶车辆行驶的效率。

【技术实现步骤摘要】

本专利技术涉及智能驾驶,尤其涉及基于深度强化学习的自动驾驶车辆决策的方法和装置


技术介绍

1、自动驾驶技术作为车辆智能化的重要技术,提高了车辆行驶的舒适性和安全性。通过自动驾驶技术使车辆做出更加智能的行驶决策,已经成为缓解交通压力的重要手段。

2、现有技术中已经存在通过深度强化学习的方法来自动生成通用决策功能,例如,方法一通过在模拟环境中训练深度q网络(dqn)代理,成功处理了卡车拖车组合的速度和变道决策。方法二从变道和车跟随决策的优先级和逻辑出发,考虑驾驶效率、安全性和舒适性,构建了一个双层决策模型。上层模型采用d3qn算法,在构建系统框架时以变道效益函数为切入点,利用d3qn算法区分环境的潜在价值,并在进行变道决策时选择变道动作的价值。下层模型采用ddpg算法进行车辆的跟驰行为。方法三提出了一种考虑激励模型的基于mpc的变道策略,其中激励函数考虑自动驾驶车辆变道前后对原车道与目标车道上的混合动力车的影响,以此提高变道操作的安全性、稳定性和效率。

3、现有技术中方法只限制观察自动驾驶车辆本身的情况,没有考虑自动驾驶车辆本身的行为本文档来自技高网...

【技术保护点】

1.一种基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,包括:

2.根据权利要求1所述的基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,所述环境信息包括:目标自动驾驶车辆与前车的距离、目标自动驾驶车辆的车速以及目标自动驾驶车辆的加速度。

3.根据权利要求1所述的基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,所述基于所述环境信息以目标自动驾驶车辆的速度最大化为目标构建换道效益函数,包括:

4.根据权利要求3所述的基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,所述目标加速度的表达式为:

5.根据权利要求1所述的基于深...

【技术特征摘要】

1.一种基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,包括:

2.根据权利要求1所述的基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,所述环境信息包括:目标自动驾驶车辆与前车的距离、目标自动驾驶车辆的车速以及目标自动驾驶车辆的加速度。

3.根据权利要求1所述的基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,所述基于所述环境信息以目标自动驾驶车辆的速度最大化为目标构建换道效益函数,包括:

4.根据权利要求3所述的基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,所述目标加速度的表达式为:

5.根据权利要求1所述的基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,所述...

【专利技术属性】
技术研发人员:赵欣刘得鑫范天赞李欣蓬武晓玥李栋梁
申请(专利权)人:武汉理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1