【技术实现步骤摘要】
本专利技术涉及智能驾驶,尤其涉及基于深度强化学习的自动驾驶车辆决策的方法和装置。
技术介绍
1、自动驾驶技术作为车辆智能化的重要技术,提高了车辆行驶的舒适性和安全性。通过自动驾驶技术使车辆做出更加智能的行驶决策,已经成为缓解交通压力的重要手段。
2、现有技术中已经存在通过深度强化学习的方法来自动生成通用决策功能,例如,方法一通过在模拟环境中训练深度q网络(dqn)代理,成功处理了卡车拖车组合的速度和变道决策。方法二从变道和车跟随决策的优先级和逻辑出发,考虑驾驶效率、安全性和舒适性,构建了一个双层决策模型。上层模型采用d3qn算法,在构建系统框架时以变道效益函数为切入点,利用d3qn算法区分环境的潜在价值,并在进行变道决策时选择变道动作的价值。下层模型采用ddpg算法进行车辆的跟驰行为。方法三提出了一种考虑激励模型的基于mpc的变道策略,其中激励函数考虑自动驾驶车辆变道前后对原车道与目标车道上的混合动力车的影响,以此提高变道操作的安全性、稳定性和效率。
3、现有技术中方法只限制观察自动驾驶车辆本身的情况,没有考虑自
...【技术保护点】
1.一种基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,包括:
2.根据权利要求1所述的基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,所述环境信息包括:目标自动驾驶车辆与前车的距离、目标自动驾驶车辆的车速以及目标自动驾驶车辆的加速度。
3.根据权利要求1所述的基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,所述基于所述环境信息以目标自动驾驶车辆的速度最大化为目标构建换道效益函数,包括:
4.根据权利要求3所述的基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,所述目标加速度的表达式为:
5.根据权
...【技术特征摘要】
1.一种基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,包括:
2.根据权利要求1所述的基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,所述环境信息包括:目标自动驾驶车辆与前车的距离、目标自动驾驶车辆的车速以及目标自动驾驶车辆的加速度。
3.根据权利要求1所述的基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,所述基于所述环境信息以目标自动驾驶车辆的速度最大化为目标构建换道效益函数,包括:
4.根据权利要求3所述的基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,所述目标加速度的表达式为:
5.根据权利要求1所述的基于深度强化学习的自动驾驶车辆决策的方法,其特征在于,所述...
【专利技术属性】
技术研发人员:赵欣,刘得鑫,范天赞,李欣蓬,武晓玥,李栋梁,
申请(专利权)人:武汉理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。