当前位置: 首页 > 专利查询>中南大学专利>正文

一种自动驾驶跟驰速度控制方法、计算机设备及存储介质技术

技术编号:39182673 阅读:10 留言:0更新日期:2023-10-27 08:30
本发明专利技术实施例公开一种自动驾驶跟驰速度控制方法、计算机设备及存储介质,获取目标车辆当前的驾驶信息数据,其中,驾驶信息数据包括位置信息及速度信息,目标车辆为自动驾驶车辆;基于位置信息确定目标车辆的前车及后车的驾驶信息数据,从而构建自动驾驶跟驰环境;基于强化学习框架确定状态空间为自动驾驶车辆与前车和后车之间的相对距离和相对速度,动作为自动驾驶车辆的加速度,通过设计强化学习算法中的奖励函数来引导自动驾驶车辆避免与前后车发生碰撞;将目标车辆当前的驾驶信息数据、前车驾驶信息数据及后车驾驶信息数据输入训练好的深度强化学习模型,输出目标车辆的加速度,从而控制自动驾驶车辆的跟驰速度。从而控制自动驾驶车辆的跟驰速度。从而控制自动驾驶车辆的跟驰速度。

【技术实现步骤摘要】
一种自动驾驶跟驰速度控制方法、计算机设备及存储介质


[0001]本专利技术涉及自动驾驶领域,尤其涉及一种自动驾驶跟驰速度控制方法、计算机设备及存储介质。

技术介绍

[0002]作为主要的驾驶行为,跟车行为显著影响驾驶安全和交通流稳定性。车辆跟驰理论是交通流理论的基础之一,许多交通领域的研究都是建立在车辆跟驰理论基础之上的。许多交通仿真工具(如VISSIM、AIMSUM、SUMO等)和自动驾驶控制算法也开发了车辆跟驰模块。因此,车辆跟驰模型对于提高安全性和效率,实现自动驾驶具有重要意义。
[0003]考虑前车的双车模式下车辆跟驰模型是经典车辆跟驰模型的主要研究内容。自动驾驶车辆只与前车互动,并根据前车的状态做出反应。由于驾驶员的视觉限制,驾驶员跟驰的过程中更加重视前车。在真实的驾驶环境中,特别是在自动驾驶车辆正在制动的情况下,后车也需要被注意。然而,在车联网的交通系统下,车辆间可以相互传输驾驶信息,后车就可以向前车传输更多的信息,以便自动驾驶车辆能够准确地感知后面车辆的状态。同时,在全面实现自主驾驶之前还将有一个过渡期,自动驾驶车辆和自然人驾驶车辆的混合交通流将会出现。自动驾驶车辆需要能够保持与前车和后车的安全互动,在做出相应决策时同时考虑前车与后车的状态。并且,考虑到后车的状态,也有利于自动驾驶车辆控制速度,既可以避免与后车的追尾碰撞,同时也确保前车的安全。因此,考虑后车的跟驰模式,有助提高道路交通流的安全及效率。
[0004]传统的跟驰模型包括基于运动学的数值跟驰模型和基于机器学习的跟驰模型。然而,基于运动学的数值跟驰模型很难考虑驾驶员的驾驶风格差异性和驾驶场景的复杂性。并且机器学习是模仿人类驾驶行为,方法本身对于场景的判断性有限。

技术实现思路

[0005]有鉴于此,本专利技术提供了一种自动驾驶跟驰速度控制方法、计算机设备及存储介质,以使得自动驾驶车辆能够更加适应跟驰环境的复杂性,并保持在前后两车之间安全驾驶,以提高道路驾驶安全性。
[0006]为达到上述目的,本专利技术的技术方案是这样实现的:
[0007]第一方面,本专利技术提供了一种自动驾驶跟驰速度控制方法,所述方法包括:
[0008]获取目标车辆当前的驾驶信息数据,其中,所述驾驶信息数据包括位置信息及速度信息,目标车辆为自动驾驶车辆;
[0009]基于所述位置信息确定所述目标车辆的前车及后车的驾驶信息数据;
[0010]基于所述目标车辆当前的驾驶信息数据、所述前车驾驶信息数据及所述后车的驾驶信息数据输入训练好的深度强化学习模型,输出所述目标车辆的加速度。
[0011]其中,所述获取目标车辆当前的驾驶信息数据,包括:
[0012]通过目标区域的路段上的摄像头及路段检测器采集车辆驾驶信息数据,包括位置
及速度信息,将所述驾驶信息数据通过路侧通信单元传输给所述目标车辆。
[0013]其中,所述基于所述位置信息确定所述目标车辆的前车及后车的驾驶信息数据,包括:
[0014]基于所述目标车辆的位置信息确定所述目标车辆的车道位置数据;
[0015]基于所述车道位置数据确定跟驰的自动驾驶车辆,并确定跟驰过程的起点;
[0016]获取起点时刻下当前车道的前车及后车驾驶信息数据,构建自动驾驶车辆的跟驰仿真环境。
[0017]其中,所述构建自动驾驶车辆的跟驰仿真环境,包括:
[0018]确定深度强化学习模型中的智能体为自动驾驶车辆,状态空间为自动驾驶车辆与前车和后车之间的相对距离和相对速度[Δv
ls
,Δv
fs
,Δy
ls
,Δy
fs
],动作空间为自动驾驶车辆的加速度,所述状态根据运动学原理进行更新,公式为: v
s
(t+1)=v
s
(t)+a(t)*ΔT
[0019][0020]Δv
ls
(t+1)=v
l
(t+1)

v
s
(t+1);Δv
fs
(t+1)=v
s
(t+1)

v
f
(t+1)
[0021]Δy
ls
(t+1)=y
l
(t+1)

y
s
(t+1);Δy
fs
(t+1)=y
s
(t+1)

y
f
(t+1)
[0022]其中,v代表速度,y代表纵向位置,s代表自动驾驶车辆,l代表前车,f 代表后车,ΔT为测量时间步长。
[0023]其中,所述深度强化学习模型的网络结构包括值函数网络、目标值函数网络、Q1网络、Q2网络以及策略网络。
[0024]其中,还包括:
[0025]设计奖励函数引导自动驾驶车辆在前车和后车之间安全跟驰,其中,所述奖励函数通过对递减的安全程度等级及选取的所述目标动作进行递减设置,所述安全程度等级根据三车模式下所述自动驾驶车辆与前车及后车的速度关系,相对距离以及最小制动距离确定,再依据所述安全程度等级和期望选取的加减速度对所述目标车辆进行奖励设置。
[0026]其中,将所述基于所述目标车辆当前的驾驶信息数据、所述前车驾驶信息数据及所述后车的驾驶信息数据输入训练好的深度强化学习模型之前,还包括:
[0027]将所述目标车辆以及前车与后车的驾驶信息数据输入初始深度强化学习模型,输出加速度,更新目标状态;
[0028]基于所述目标状态对所述深度强化学习模型进行单独交替迭代,直至设置的损失函数满足收敛条件,获得训练好的深度强化学习模型。
[0029]其中,所述基于所述目标车辆当前的驾驶信息数据、所述前车驾驶信息数据及所述后车的驾驶信息数据输入训练好的深度强化学习模型,输出所述目标车辆的加速度,包括:
[0030]基于所述目标车辆以及前车与后车的驾驶信息数据确定当前目标状态;
[0031]基于所述目标状态输入所述训练好的深度强化学习模型,输出所述目标车辆的加速度。
[0032]第二方面,本专利技术提供了一种计算机设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器;
[0033]其中,所述处理器用于运行所述计算机程序时,实现执行实现上述任意所述的自
动驾驶跟驰速度控制方法。
[0034]第三方面,本专利技术提供了一种计算存储介质,所述计算机存储介质中存储有计算机程序,所述计算机程序被处理器执行实现上述任意所述的自动驾驶跟驰速度控制方法。
[0035]本专利技术实施例提供的自动驾驶跟驰速度控制方法、计算机设备及存储介质,包括:获取目标车辆当前的驾驶信息数据,其中,所述驾驶信息数据包括位置信息及速度信息,目标车辆为自动驾驶车辆;基于所述位置信息确定所述目标车辆的前车及后车的驾驶信息数据;基于所述目标车辆当前的驾驶信息数据、所述前车驾本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动驾驶跟驰速度控制方法,其特征在于,所述方法包括:获取目标车辆当前的驾驶信息数据,其中,所述驾驶信息数据包括位置信息及速度信息,目标车辆为自动驾驶车辆;基于所述位置信息确定所述目标车辆的前车及后车的驾驶信息数据;基于所述目标车辆当前的驾驶信息数据、所述前车驾驶信息数据及所述后车的驾驶信息数据输入训练好的深度强化学习模型,输出所述目标车辆的加速度。2.根据权利要求1所述的自动驾驶跟驰速度控制方法,其特征在于,所述获取目标车辆当前的驾驶信息数据,包括:通过目标区域的路段上的摄像头及路段检测器采集车辆驾驶信息数据,包括位置及速度信息,将所述驾驶信息数据通过路侧通信单元传输给所述目标车辆。3.根据权利要求1所述的自动驾驶跟驰速度控制方法,其特征在于,所述基于所述位置信息确定所述目标车辆的前车及后车的驾驶信息数据,包括:基于所述目标车辆的位置信息确定所述目标车辆的车道位置数据;基于所述车道位置数据确定跟驰的自动驾驶车辆,并确定跟驰过程的起点;获取起点时刻下当前车道的前车及后车驾驶信息数据,构建自动驾驶车辆的跟驰仿真环境。4.根据权利要求3所述的自动驾驶跟驰速度控制方法,其特征在于,所述构建自动驾驶车辆的跟驰仿真环境,包括:确定深度强化学习模型中的智能体为自动驾驶车辆,状态空间为自动驾驶车辆与前车和后车之间的相对距离和相对速度[Δv
ls
,Δv
fs
,Δy
ls
,Δy
fs
],动作空间为自动驾驶车辆的加速度,所述状态根据运动学原理进行更新,公式为:v
s
(t+1)=v
s
(t)+a(t)*ΔTΔv
ls
(t+1)=v
l
(t+1)

v
s
(t+1);Δv
fs
(t+1)=v
s
(t+1)

v
f
(t+1)Δy
ls
(t+1)=y
l
(t+1)

y
s
...

【专利技术属性】
技术研发人员:唐进君王喆黄合来
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1