一种基于多人博弈的自动驾驶车辆换道轨迹规划方法技术

技术编号:37719750 阅读:13 留言:0更新日期:2023-06-02 00:18
本发明专利技术属于自动驾驶技术领域,具体地说是涉及一种基于多人博弈的自动驾驶车辆换道轨迹规划方法,解决了现有决策方法不能兼顾动态轨迹规划、复杂车路环境下适用性差的问题。其技术要点是通过双人或多人博弈方法实时确定车辆的换道策略,并完成轨迹线规划。具体来说,通过构建支持向量回归预测模型预测前车状态并确定换道可行性;换道过程中构建车辆与目标车道后车的双人博弈模型,在车辆换道失败决定返回原车道后,构建涉及原车道与目标车道后车的多人博弈模型;根据实时换道决策与预测的前车状态用五次多项式动态地拟合换道轨迹,保证换道过程的安全性与平稳性。本发明专利技术实现了自动驾驶车辆在复杂车路环境下的安全换道。驾驶车辆在复杂车路环境下的安全换道。驾驶车辆在复杂车路环境下的安全换道。

【技术实现步骤摘要】
一种基于多人博弈的自动驾驶车辆换道轨迹规划方法


[0001]本专利技术属于自动驾驶
,具体地说是涉及一种基于多人博弈的自动驾驶车辆换道轨迹规划方法。

技术介绍

[0002]自动驾驶车辆运用环境感知、决策、规划和车辆控制等关键技术,相较于人工驾驶车辆在交通安全与通行效率方面具有显著优势。随着自动驾驶技术的发展,道路上自动驾驶车辆的占有率将会逐步提升,交通环境中同时包含自动驾驶车辆与人工驾驶车辆将成为常见的交通场景。
[0003]换道行为是道路上常见的驾驶行为,但是换道过程中车辆冲突的风险上升,容易诱发交通事故。自动驾驶技术有望提升车辆在换道过程中的安全性。自动驾驶车辆的换道算法通常有4个层次:(1)战略规划层,负责规划车辆在出行行程中的行驶路径,会影响车辆的换道选择;(2)战术决策层,负责对车辆的行为进行决策,包括跟驰和换道的选择以及加、减速的选择;(3)轨迹规划层,依据决策行为生成一条安全、合理的换道轨迹,需要依据周边的交通环境进行实时优化;(4)操作控制层,依据轨迹规划层生成的最优轨迹,指挥车辆控制速度、方向沿着轨迹行驶。换道决策和轨迹规划分别属于战术决策层和轨迹规划层。
[0004]换道决策模型种类众多,包括基于规则的模型、基于效用计算的模型、基于机器学习的模型和基于博弈论的模型等。基于规则的模型预设需要更换车道的场景使得车辆状态满足一定条件就需要换道,然而固定的规则通常难以适应复杂多变的道路环境;基于效用计算的模型为换道、跟驰等行为计算效用,采取效用值最高的行为,该类模型同样难以给出具有泛用性的效用计算法;基于机器学习的模型通过大量数据训练出能够根据当前交通状态判断是否换道的机器学习模型,该方法难以保证决策结果的安全性;基于博弈论的方法是将当前车道和目标车道上的车辆状态都纳入决策过程,考虑多方可能策略之后为意图换道车辆给出最合适的行为决策,能满足复杂交通状态下的换道决策需求。换道博弈模型通常只包含两个决策主体:意图换道车辆和目标车道的后车,然而在车流密度较高的复杂交通环境中换道行为会受到更多周边车辆的影响,因此纳入更多决策主体构成的多人博弈模型更贴合真实的换道过程。
[0005]换道轨迹规划通常以几何曲线作为生成轨迹的基础,这其中基于多项式曲线的轨迹最为常见,此外正(余)弦曲线、B样条曲线、梯形曲线和螺旋线等也被普遍使用。由于换道过程中交通环境会迅速变化,所以需要频繁对换道轨迹进行修改与优化以确保安全和效率,这项技术被称为动态轨迹规划。
[0006]现有的自动驾驶车辆换道技术存在以下难点需要解决:
[0007]1、自动驾驶车辆换道过程中,需要同时兼顾换道决策与换道轨迹规划。若在做出决策后才考虑轨迹线规划,可能导致车辆无法规划出平滑的、符合现实情况轨迹线;
[0008]2、自动驾驶车辆在做出换道决策时需要考虑前车运动状态,若仅将前车视为匀速运动,在车流密度较高的复杂交通环境中可能导致换道过程中出现安全隐患;
[0009]3、自动驾驶车辆在换道过程中需要考虑因车辆发生横向偏移导致后车出现超车期望,若仅考虑目标车道车辆,则自动驾驶车在因为目标车道车辆的侵略性而退回原车道时,会产生与后车的潜在冲突。
[0010]因此,需要提出一种结合多车博弈决策算法与动态轨迹规划的方法体系,应对自动驾驶与人工驾驶混合交通流下的换道场景,提升自动驾驶车辆的换道行为质量。

技术实现思路

[0011]本专利技术的目的是针对自动驾驶与人工驾驶混合交通流下的换道场景,提供一种基于多人博弈的自动驾驶车辆换道轨迹规划方法及仿真测试方法。本专利技术具有如下特点:一、兼顾自动驾驶车辆换道决策和轨迹规划;二、使用支持向量回归模型预测本车道前车与目标车道前车在所需换道时间内的运动状态,减少现有技术将前车视为匀速运动导致的安全隐患;三、将多人博弈理论引入自动驾驶车辆换道轨迹规划方法中,自动驾驶车辆能够根据自身及周围车辆运动状态判断是否继续换道,纳入更多决策主体构成的多人博弈模型可有效考虑目标车道及原车道后车在换道过程中的反应,提高换道安全性;四、自动驾驶车辆换道轨迹规划方法采取五次多项式拟合车辆换道轨迹线,在优化过程中考虑车辆碰撞约束、车辆运动学约束,并在不同情形下规划出符合车辆运动学约束的轨迹线,更符合现实换道过程。
[0012]本专利技术的技术方案是:
[0013]一种基于多人博弈的自动驾驶车辆换道轨迹规划方法,其特征在于,包括以下步骤:
[0014]S1、获取自动驾驶车辆及其所在车道的车辆信息和目标车道的车辆信息;
[0015]S2、自动驾驶车辆生成换道意图,根据自身信息与获取的车辆信息,基于支持向量回归模型预测本车道前车与目标车道前车在所需换道时间内的运动状态,根据运动状态判断是否满足换道条件,若满足,则进入S3

1,否则回到S1;
[0016]S3、建立博弈模型,获得当前时刻的最优换道决策:
[0017]S3

1、建立自动驾驶车辆(车辆A)与目标车道后车(车辆B)的双人博弈模型,获得当前时刻的最优换道决策:
[0018]生成A车与B车的效用函数U
payoff

[0019][0020][0021]式中,分别是车辆A、B的博弈收益函数,角标2表示博弈人数为2;a0是初始状态车辆加速度,a
A
是车辆的横向加速度即换道决策变量;q
A
和q
B
分别是车辆A、B的侵略性系数(侵略系数越大,驾驶员决策时更加倾向于提升效率而非安全性),β(q)是侵略性q的累积分布函数,且0≤β(q)≤1,U
safety
是安全收益,U
space
是空间(效率)收益,δ是前车防碰撞参数,f
w
是惩罚函数;
[0022]根据A车与B车的效用函数进行博弈,求解下列博弈的均衡解:
[0023][0024]式中,x
A
为自动驾驶车辆A在博弈过程的决策,x
A*
是自动驾驶车辆A的最优换道决策;x
B
为目标车道后车B在博弈过程的决策,x
B*
是目标车道后车B的最优换道决策。
[0025]若车辆A得到的最优博弈决策为执行换道,则进入S4

1;若车辆A得到的最优博弈决策为返回原车道,则进入S4

2。
[0026]S3

2、当车辆A选择返回原车道时,可能会与车辆C发生潜在冲突,建立自动驾驶车辆(车辆A)与目标车道后车(车辆B)、原车道后车(车辆C)的多人博弈模型,获得当前时刻的最优换道决策:
[0027]生成A车、B车与C车的效用函数U
payoff

[0028][0029][0030][0031]式中,分别为车辆A、B、C的博弈收益函数值,角标3表示博弈者数量为3;a
B
和a
C
分别表示车辆B与C的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多人博弈的自动驾驶车辆换道轨迹规划方法,其特征在于,包括以下步骤:S1、获取自动驾驶车辆及其所在车道的车辆信息和目标车道的车辆信息;S2、自动驾驶车辆生成换道意图,根据自身信息与获取的车辆信息,基于支持向量回归模型预测本车道前车与目标车道前车在所需换道时间内的运动状态,根据运动状态判断是否满足换道条件,若满足,则进入S3

1,否则回到S1;S3、建立博弈模型,获得当前时刻的最优换道决策:S3

1、建立自动驾驶车辆与目标车道后车的双人博弈模型,获得当前时刻的最优换道决策,定义自动驾驶车辆为A车,目标车道后车为B车:生成A车与B车的效用函数U
payoff
::式中,分别是车辆A、B的博弈收益函数,角标2表示博弈人数为2;a0是初始状态车辆加速度,a
A
是车辆的横向加速度即换道决策变量;q
A
和q
B
分别是车辆A、B的侵略性系数,侵略性系数的定义是:侵略系数越大,驾驶员决策时更加倾向于提升效率而非安全性;β(q)是侵略性q的累积分布函数,且0≤β(q)≤1,U
safety
是安全收益,U
space
是空间收益,δ是前车防碰撞参数,f
w
是惩罚函数;根据A车与B车的效用函数进行博弈,求解下列博弈的均衡解:式中,x
A
为自动驾驶车辆A在博弈过程的决策,x
A*
是自动驾驶车辆A的最优换道决策;x
B
为目标车道后车B在博弈过程的决策,x
B*
是目标车道后车B的最优换道决策;若车辆A得到的最优博弈决策为执行换道,则进入S4

1;若车辆A得到的最优博弈决策为返回原车道,则进入S4

2;S3

2、当车辆A选择返回原车道时,可能会与车辆C发生潜在冲突,建立自动驾驶车辆与目标车道后车、原车道后车的多人博弈模型,获得当前时刻的最优换道决策,定义原车道后车为C车:生成A车、B车与C车的效用函数U
payoff
:::式中,分别为车辆A、B、C的博弈收益函数值,角标3表示博弈者数量为3;a
B
和a
C
分别表示车辆B与C的加速度;q
C
是车辆C的侵略性系数;O
n
是原车道后车的超车期望参数,超车期望参数的定义为:超车期望参数越高,后车的决策越倾向于加速超越前
车而非减速为前车让位;根据A车、B车与C车的效用函数进行博弈,求解下列博弈的均衡解:式中,x
C
为C车在博弈过程的决策,x
C*
为C车的最优换道决策;若车辆A得到的最优博弈决策为重新执行换道,则进入S4

3;若车辆A得到的最优博弈决策为返回原车道,则进入S4

【专利技术属性】
技术研发人员:苏启明罗霞禹乐文彭炜康
申请(专利权)人:西南交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1