一种基于行为风险强化学习的智能汽车环岛驾驶决策方法技术

技术编号：43462635 阅读：16 留言：0更新日期：2024-11-27 13:00

本发明专利技术属于汽车技术领域，具体的说是一种基于行为风险强化学习的智能汽车环岛驾驶决策方法。首先，分析并建立汽车横纵向耦合动作空间、包含驾驶任务‑周围环境‑自车信息的多尺度状态空间、考虑安全‑任务‑驾驶行为的多目标奖励函数。其次，通过应用多层感知机的自学习行为风险分类器，对智能体行为风险进行分类评定，并基于行为风险分类结果设计基于行为风险的策略优化目标，来优化强化学习驾驶决策算法，以解决奖励函数设计不足对于驾驶策略优化的影响，并引导驾驶决策朝向更安全方向收敛。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于汽车，具体的说是一种基于行为风险强化学习的智能汽车环岛驾驶决策方法。

技术介绍

1、环岛场景作为复杂城市交通的重要组成部分，在汽车分流、减少汽车行驶冲突、提高汽车行驶效率等方面发挥着重要作用。相较于纵向巡航跟驰、侧向高速换道等简单驾驶工况，智能汽车在环岛场景中执行汇入、绕岛行驶和驶出等动态多样驾驶任务时面临高复杂性和强交互性问题，这对智能汽车驾驶决策安全性能提出了重大挑战。

2、深度强化学习融合深度神经网络特征提取能力和强化学习环境交互优势，被认为是智能汽车驾驶决策策略设计的有效解决方案，已在车道保持、变道和自适应巡航等简单城市交通工况中得到了广泛地应用。但是将深度强化学习应用于汽车驾驶决策前，需要对环境进行合理建模以提升策略训练品质。然而，上述简单城市交通工况研究缺乏综合考虑汽车横纵向耦合动作空间、动态多样驾驶任务、复杂行驶工况约束、车辆强交互等问题，导致它们直接应用于环岛等复杂城市交通场景下智能汽车驾驶决策时存在一定安全风险。

3、此外，奖励函数对基于深度强化学习的汽车驾驶决策策略训练寻优、收敛...

【技术保护点】

1.一种基于行为风险强化学习的智能汽车环岛驾驶决策方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于行为风险强化学习的智能汽车环岛驾驶决策方法，其特征在于，所述步骤一的具体方法如下：

3.根据权利2所述的一种基于行为风险强化学习的智能汽车环岛驾驶决策方法，其特征在于，所述步骤11)的具体方法如下：

4.根据权利2所述的一种基于行为风险强化学习的智能汽车环岛驾驶决策方法，其特征在于，所述步骤12)的具体方法如下：

5.根据权利2所述的一种基于行为风险强化学习的智能汽车环岛驾驶决策方法，其特征在于，所述步骤13)的具体方法如下：...

【技术特征摘要】

1.一种基于行为风险强化学习的智能汽车环岛驾驶决策方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于行为风险强化学习的智能汽车环岛驾驶决策方法，其特征在于，所述步骤一的具体方法如下：

3.根据权利2所述的一种基于行为风险强化学习的智能汽车环岛驾驶决策方法，其特征在于，所述步骤11)的具体方法如下：

4.根据权利2所述的一种基于行为风险强化学习的智能汽车环岛驾驶决策方法，其特征在于，所述步骤12)的具体方法如下：

5.根据权利...

【专利技术属性】
技术研发人员：吴坚，石裕康，
申请(专利权)人：吉林大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人