当前位置: 首页 > 专利查询>同济大学专利>正文

一种自动驾驶车辆速度控制多目标优化的跟驰算法制造技术

技术编号:21032914 阅读:37 留言:0更新日期:2019-05-04 04:57
本发明专利技术开发了一种自动驾驶车辆速度控制多目标优化的跟驰算法。该算法基于深度强化学习提出了一种用于汽车跟驰速度控制的模型,该模型不仅模仿人类驾驶,而是直接优化驾驶安全性、效率和舒适性。结合碰撞时间、车头时距经验分布、加加速度,构建了反映驾驶安全性,效率和舒适性的奖励函数,使用下一代仿真(Next Generation Simulation,NGSIM)项目中实际驾驶数据训练模型,并将模型模拟的跟驰行为与NGSIM经验数据中观察到的行为进行比较,强化学习智能体通过仿真环境中的试验和试错,以最大化累积奖励的方式学习安全、舒适、高效地控制车辆速度。结果表明,与现实世界中的人类驾驶员相比,提出的跟驰速度控制算法显示出更好的安全、高效和舒适驾驶能力。

A Multi-objective Optimal Car Following Algorithm for Vehicle Speed Control

The invention develops a multi-objective optimization car-following algorithm for speed control of an automatic driving vehicle. Based on deep reinforcement learning, this algorithm proposes a model for car following speed control, which not only imitates human driving, but also directly optimizes driving safety, efficiency and comfort. A reward function reflecting driving safety, efficiency and comfort is constructed based on collision time, experience distribution of headway and acceleration. The actual driving data training model in Next Generation Simulation (NGSIM) project is used, and the following behavior simulated by the model is compared with the behavior observed in NGSIM empirical data. The learning agent is strengthened by using the reward function. Experiments and trial-and-error in simulation environment can learn to control vehicle speed safely, comfortably and efficiently by maximizing cumulative incentives. The results show that, compared with human drivers in the real world, the proposed car-following speed control algorithm shows better safety, efficiency and comfortable driving ability.

【技术实现步骤摘要】
一种自动驾驶车辆速度控制多目标优化的跟驰算法
本专利技术涉及自动驾驶跟驰控制领域,特别涉及一种自动驾驶车辆速度控制多目标优化的跟驰算法。
技术介绍
跟驰控制是自动驾驶智能决策的重要组成部分,包括自由驾驶下的速度选择、车辆跟随时车距的保持以及紧急状况下的制动。在自动驾驶与人类驾驶共存的情况下,自动驾驶车辆作出类似于人类驾驶员(简称拟人化)的跟驰控制决策将提高乘客的舒适度与信任度,同时也方便其他交通参与者更好地理解和预测自动驾驶车辆的行为,以实现自动驾驶与人类驾驶之间的安全交互。然而传统跟驰模型在应用于自动跟驰控制时存在诸多局限性,如限制模型的灵活性和准确性,难以推广到标定数据以外的驾驶场景和驾驶员,应用于自动驾驶时不能反应车辆实际驾驶员的驾驶风格及驾驶场景等。深度强化学习(DeepReinforcementLearning,DRL)以被广泛应用于工业制造、仿真模拟、机器人控制、优化与调度和游戏博弈等领域,其基本思想是通过最大化智能体从环境中获得的累计奖赏值,以学习到完成目标的最优策略。DRL方法更加侧重于学习解决问题的策略,而非对数据进行拟合,因此其泛化能力更强,为自动驾驶车辆跟驰控制本文档来自技高网...

【技术保护点】
1.一种自动驾驶车辆速度控制多目标优化的跟驰算法,其特征在于,步骤如下:步骤1:获取数据;使用NGSIM项目中的数据,基于前车和后车停留在同一车道上及车辆跟随事件的长度>15秒等准则提取跟驰事件,基于提取的跟驰事件,将一部分作为训练数据,另一部分作为测试数据;步骤2:构建奖励函数;提出反映汽车跟随控制相关目标(安全、舒适、效率)的特征量;步骤2.1:采用碰撞时间(TTC)反映安全性;TTC表示两辆车相撞之前剩余的时间量,其公式为

【技术特征摘要】
1.一种自动驾驶车辆速度控制多目标优化的跟驰算法,其特征在于,步骤如下:步骤1:获取数据;使用NGSIM项目中的数据,基于前车和后车停留在同一车道上及车辆跟随事件的长度>15秒等准则提取跟驰事件,基于提取的跟驰事件,将一部分作为训练数据,另一部分作为测试数据;步骤2:构建奖励函数;提出反映汽车跟随控制相关目标(安全、舒适、效率)的特征量;步骤2.1:采用碰撞时间(TTC)反映安全性;TTC表示两辆车相撞之前剩余的时间量,其公式为其中是Sn-1,n(t)车间距离,△Vn-1,n(t)是相对速度;根据NGSIM经验数据确定安全阈值为7秒,并进行TTC特征构建:若TTC小于7秒,则TTC特征指标为负值,随着TTC逼近零,TTC特征将接近负无穷,对于接近碰撞的情况表现最严厉的惩罚;步骤2.2:采用车头时距(headway)衡量驾驶效率;由分析,对数正态分布适应于获取的训练数据的分布,其概率密度函数为x>0;根据所提取的数据可估计,分布变量x的平均值μ和对数标准差σ分别为0....

【专利技术属性】
技术研发人员:王雪松朱美新孙平
申请(专利权)人:同济大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1