【技术实现步骤摘要】
一种基于多人博弈的自动驾驶车辆换道轨迹规划方法
[0001]本专利技术属于自动驾驶
,具体地说是涉及一种基于多人博弈的自动驾驶车辆换道轨迹规划方法。
技术介绍
[0002]自动驾驶车辆运用环境感知、决策、规划和车辆控制等关键技术,相较于人工驾驶车辆在交通安全与通行效率方面具有显著优势。随着自动驾驶技术的发展,道路上自动驾驶车辆的占有率将会逐步提升,交通环境中同时包含自动驾驶车辆与人工驾驶车辆将成为常见的交通场景。
[0003]换道行为是道路上常见的驾驶行为,但是换道过程中车辆冲突的风险上升,容易诱发交通事故。自动驾驶技术有望提升车辆在换道过程中的安全性。自动驾驶车辆的换道算法通常有4个层次:(1)战略规划层,负责规划车辆在出行行程中的行驶路径,会影响车辆的换道选择;(2)战术决策层,负责对车辆的行为进行决策,包括跟驰和换道的选择以及加、减速的选择;(3)轨迹规划层,依据决策行为生成一条安全、合理的换道轨迹,需要依据周边的交通环境进行实时优化;(4)操作控制层,依据轨迹规划层生成的最优轨迹,指挥车辆控制速度、方向沿着轨迹行驶。换道决策和轨迹规划分别属于战术决策层和轨迹规划层。
[0004]换道决策模型种类众多,包括基于规则的模型、基于效用计算的模型、基于机器学习的模型和基于博弈论的模型等。基于规则的模型预设需要更换车道的场景使得车辆状态满足一定条件就需要换道,然而固定的规则通常难以适应复杂多变的道路环境;基于效用计算的模型为换道、跟驰等行为计算效用,采取效用值最高的行为,该类模型同样难以给出具有泛 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于多人博弈的自动驾驶车辆换道轨迹规划方法,其特征在于,包括以下步骤:S1、获取自动驾驶车辆及其所在车道的车辆信息和目标车道的车辆信息;S2、自动驾驶车辆生成换道意图,根据自身信息与获取的车辆信息,基于支持向量回归模型预测本车道前车与目标车道前车在所需换道时间内的运动状态,根据运动状态判断是否满足换道条件,若满足,则进入S3
‑
1,否则回到S1;S3、建立博弈模型,获得当前时刻的最优换道决策:S3
‑
1、建立自动驾驶车辆与目标车道后车的双人博弈模型,获得当前时刻的最优换道决策,定义自动驾驶车辆为A车,目标车道后车为B车:生成A车与B车的效用函数U
payoff
::式中,分别是车辆A、B的博弈收益函数,角标2表示博弈人数为2;a0是初始状态车辆加速度,a
A
是车辆的横向加速度即换道决策变量;q
A
和q
B
分别是车辆A、B的侵略性系数,侵略性系数的定义是:侵略系数越大,驾驶员决策时更加倾向于提升效率而非安全性;β(q)是侵略性q的累积分布函数,且0≤β(q)≤1,U
safety
是安全收益,U
space
是空间收益,δ是前车防碰撞参数,f
w
是惩罚函数;根据A车与B车的效用函数进行博弈,求解下列博弈的均衡解:式中,x
A
为自动驾驶车辆A在博弈过程的决策,x
A*
是自动驾驶车辆A的最优换道决策;x
B
为目标车道后车B在博弈过程的决策,x
B*
是目标车道后车B的最优换道决策;若车辆A得到的最优博弈决策为执行换道,则进入S4
‑
1;若车辆A得到的最优博弈决策为返回原车道,则进入S4
‑
2;S3
‑
2、当车辆A选择返回原车道时,可能会与车辆C发生潜在冲突,建立自动驾驶车辆与目标车道后车、原车道后车的多人博弈模型,获得当前时刻的最优换道决策,定义原车道后车为C车:生成A车、B车与C车的效用函数U
payoff
:::式中,分别为车辆A、B、C的博弈收益函数值,角标3表示博弈者数量为3;a
B
和a
C
分别表示车辆B与C的加速度;q
C
是车辆C的侵略性系数;O
n
是原车道后车的超车期望参数,超车期望参数的定义为:超车期望参数越高,后车的决策越倾向于加速超越前
车而非减速为前车让位;根据A车、B车与C车的效用函数进行博弈,求解下列博弈的均衡解:式中,x
C
为C车在博弈过程的决策,x
C*
为C车的最优换道决策;若车辆A得到的最优博弈决策为重新执行换道,则进入S4
‑
3;若车辆A得到的最优博弈决策为返回原车道,则进入S4
‑
技术研发人员:苏启明,罗霞,禹乐文,彭炜康,
申请(专利权)人:西南交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。