【技术实现步骤摘要】
本专利技术属于汽车,具体的说是一种基于行为风险强化学习的智能汽车环岛驾驶决策方法。
技术介绍
1、环岛场景作为复杂城市交通的重要组成部分,在汽车分流、减少汽车行驶冲突、提高汽车行驶效率等方面发挥着重要作用。相较于纵向巡航跟驰、侧向高速换道等简单驾驶工况,智能汽车在环岛场景中执行汇入、绕岛行驶和驶出等动态多样驾驶任务时面临高复杂性和强交互性问题,这对智能汽车驾驶决策安全性能提出了重大挑战。
2、深度强化学习融合深度神经网络特征提取能力和强化学习环境交互优势,被认为是智能汽车驾驶决策策略设计的有效解决方案,已在车道保持、变道和自适应巡航等简单城市交通工况中得到了广泛地应用。但是将深度强化学习应用于汽车驾驶决策前,需要对环境进行合理建模以提升策略训练品质。然而,上述简单城市交通工况研究缺乏综合考虑汽车横纵向耦合动作空间、动态多样驾驶任务、复杂行驶工况约束、车辆强交互等问题,导致它们直接应用于环岛等复杂城市交通场景下智能汽车驾驶决策时存在一定安全风险。
3、此外,奖励函数对基于深度强化学习的汽车驾驶决策策略训练寻优、收敛
...【技术保护点】
1.一种基于行为风险强化学习的智能汽车环岛驾驶决策方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于行为风险强化学习的智能汽车环岛驾驶决策方法,其特征在于,所述步骤一的具体方法如下:
3.根据权利2所述的一种基于行为风险强化学习的智能汽车环岛驾驶决策方法,其特征在于,所述步骤11)的具体方法如下:
4.根据权利2所述的一种基于行为风险强化学习的智能汽车环岛驾驶决策方法,其特征在于,所述步骤12)的具体方法如下:
5.根据权利2所述的一种基于行为风险强化学习的智能汽车环岛驾驶决策方法,其特征在于,所述步骤1
...【技术特征摘要】
1.一种基于行为风险强化学习的智能汽车环岛驾驶决策方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于行为风险强化学习的智能汽车环岛驾驶决策方法,其特征在于,所述步骤一的具体方法如下:
3.根据权利2所述的一种基于行为风险强化学习的智能汽车环岛驾驶决策方法,其特征在于,所述步骤11)的具体方法如下:
4.根据权利2所述的一种基于行为风险强化学习的智能汽车环岛驾驶决策方法,其特征在于,所述步骤12)的具体方法如下:
5.根据权利...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。