一种自动驾驶汽车变道控制方法技术

技术编号:39647135 阅读:36 留言:0更新日期:2023-12-09 11:15
一种自动驾驶汽车变道控制方法,包括如下步骤:基于车辆变道过程中的横摆运动和侧向运动建立非线性二自由度车辆模型;根据非线性而自由度车辆模型确定状态变量和动作变量,并且确定车辆的状态空间和动作空间;根据车辆的状态空间和动作空间设置奖励函数,并且将奖励函数添加到深度确定性策略梯度算法中;在深度确定性策略梯度算法中引入基于动作值的自适应贪婪噪声和优先经验回放机制,得到变道控制算法;基于样本数据对变道控制算法进行训练得到变道控制模型;利用变道控制模型对自动驾驶汽车进行变道控制

【技术实现步骤摘要】
一种自动驾驶汽车变道控制方法


[0001]本专利技术涉及自动驾驶
,具体的说是一种自动驾驶汽车变道控制方法


技术介绍

[0002]近年来,随着汽车保有量的上升,交通安全问题和交通拥堵问题日益严重

在数量庞大的交通安全事故或者交通拥堵事件中,很多都是因为车辆变道引起的

随着自动驾驶技术的快速发展,由车辆根据周围环境状态和自身运动状态自行变道,能够避免因为驾驶员错误变道引发的事故或者拥堵

但是,想要实现这样的效果,需要精确度高

且执行效率高的变道控制算法

[0003]现有的自动驾驶超车变道决策模型主要以安全性为研究前提开展研究

单纯以保证超车安全距离及换道时间作为决策基础,虽然可以保障行车的安全性,但对于交通的通行率的提升效果有限,而且没有考虑到人类驾驶员所具有的不确定性,不能更好地与环境相结合


技术实现思路

[0004]为了解决现有技术中的不足,本专利技术提供一种自动驾驶汽车变道控制本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种自动驾驶汽车变道控制方法,其特征在于,包括如下步骤:基于车辆变道过程中的横摆运动和侧向运动建立非线性二自由度车辆模型;根据非线性而自由度车辆模型确定状态变量和动作变量,并且确定车辆的状态空间和动作空间;根据车辆的状态空间和动作空间设置奖励函数,并且将奖励函数添加到深度确定性策略梯度算法中;在深度确定性策略梯度算法中引入基于动作值的自适应贪婪噪声和优先经验回放机制,得到变道控制算法;基于样本数据对变道控制算法进行训练得到变道控制模型;利用变道控制模型对自动驾驶汽车进行变道控制
。2.
如权利要求1所述的一种自动驾驶汽车变道控制方法,其特征在于,建立非线性二自由度车辆模型时采用魔术公式建立,非线性二自由度车辆模型表示为:其中
Vehical
为非线性二自由度车辆模型,
ξ
(t)

u(t)
分别为车辆状态和控制输入,
y
c
(t)
为预测输出,
η
为系数矩阵
。3.
如权利要求1所述的一种自动驾驶汽车变道控制方法,其特征在于,确定状态变量和动作变量的具体方法包括:基于非线性二自由度车辆模型确定多个能够获取到的状态值和动作值;分别评估状态值的获取难度和动作值的复杂程度;根据评估结果对状态值和动作值分别排序;基于排序结果选取若干个状态值作为状态变量

选取若干个动作值作为动作变量
。4.
如权利要求3所述的一种自动驾驶汽车变道控制方法,其特征在于,车辆的状态空间表示为:
States

{x y V
x V
y sin
ω
cos
ω
dis_h}
;其中,
x
为当前车辆水平位置,
y
为当前车辆垂直位置,
V
x
为车辆横向速度,
V
y
为车辆纵向速度,
sin
ω
为车辆与车道线夹角的正弦值,
cos
ω
为车辆与车道线夹角的余弦值,
dis_h
为车辆与前方物体之间的距离值;车辆的动作空间表示为:
Actions

{
θ
a}
;其中,
θ
为方向盘角度,
a
为车辆加速度

【专利技术属性】
技术研发人员:陶发展周春涛冀保峰朱龙龙付主木李梦杨马浩翔毕淑慧张冀吴红海李帅永张中才杨艺陈灵峰
申请(专利权)人:河南科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1