【技术实现步骤摘要】
一种人机混驾环境下的多车协同决策方法
[0001]本专利技术涉及自动驾驶领域,尤其是涉及一种人机混驾环境下的多车协同决策方法
。
技术介绍
[0002]随着自动驾驶汽车的快速发展,在未来很长一段时间里,人类驾驶汽车
(Human
‑
driving Vehicle,HV)
与网联自动驾驶汽车
(Connected and Automated Vehicle,CAV)
将会以人机混驾交通流的形式共享道路资源
。
人机混驾场景下如何保证安全
、
提高效率是未来自动驾驶研究的重要议题
。
单车智能的自动驾驶在复杂交互环境中具有环境感知局限性,难以保证交互安全;往往表现出相对保守的交互行为,难以保证交互效率;在面对复杂场景时难以做出最佳决策,且存在设备成本较高等现实问题
。
随着
CAV
渗透率的提高,可以考虑采用车车协同的方式解决复杂环境中的驾驶冲突,提升安全和效率
。
[0003]但是,目前车车协同相关研究,多为纯
CAV
环境下研究车辆协同或以单车智能的视角研究
CAV
与
HV
的交互,缺乏混驾场景
CAV
与
HV
交互以及
CAV
之间协同的综合考虑
。
目前大多研究仅将
HV
当作动态障碍物或用跟驰模型进行简单表达,
HV />的动态交互特征未能有效捕捉,
CAV
与
HV
的交互性未能很好体现
。
此外,现有研究未考量协同
CAV
之间个体需求差异,所得模型难以满足
CAV
个性化的驾乘需求
。
技术实现思路
[0004]本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供的一种人机混驾环境下的多车协同决策方法,是一种可实现
CAV
车间协同以及
CAV
与
HV
交互相耦合的协同决策方法
。
在具体的模型方法设计中,通过收益函数实现
CAV
个性化驾乘偏好,并根据
HV
交互的不确定性采用孪生博弈的方式实现模型动态调整,然后进行模型求解,得出最优的车辆动作决策结果
。
[0005]本专利技术的目的可以通过以下技术方案来实现:
[0006]一种人机混驾环境下的多车协同决策方法,总涉及构建三个决策模型:
CAV
与
HV
交互模型
、CAV
协同决策模型
、
人机混驾交互与协同模型;总涉及包括以下步骤:
[0007]S1
车辆属性及状态信息更新步骤:输入场景中所有车辆的属性信息,包含车辆类型
、
运动学参数等;车辆状态信息,包含车辆位置
、
车辆速度
、
加速度等
。
[0008]S2
博弈对象列表更新及模型切换步骤:根据车辆状态,判断进入近冲突区域及冲突区域内的车辆,更新博弈对象列表中所包含的交互与协同车辆;根据博弈对象类型与数量,确定实际执行的模型
。
[0009]S3 CAV
与
HV
交互建模步骤:建立
CAV
与
HV
交互的模型
。
[0010]S4 CAV
协同决策建模步骤:建立
CAV
车辆内部协同决策的模型
。
[0011]S5
人机混驾交互协同建模步骤:耦合上述
CAV
与
HV
交互模型
、CAV
协同决策模型,进行人机混驾交互协同模型,并进行模型求解,预测博弈对象列表中
HV
的动作,求解
CAV
的最
优动作策略,即加速度
。
[0012]S6
车辆状态更新步骤:
CAV
根据输出的加速度决策结果,通过运动学公式实现车辆状态更新,求解更新速度
、
位置;
HV
的加速度
、
速度
、
位置从环境中重新采集
。
[0013]与现有技术相比,本专利技术具有以下优点:
[0014](1)
本专利技术提出同时考虑混驾场景网联自动驾驶车之间的协同以及网联自动驾驶车与人类驾驶车的交互,更加契合真实的混驾场景且能有效解决单车智能的自动驾驶存在的安全效率问题
。
[0015](2)
本专利技术通过对人类驾驶车收益函数组分权重相关参数的辨识和动态调整,充分考虑人类驾驶车动态交互过程中的不确定性
。
[0016](3)
本专利技术所提出基于合作博弈的网联自动驾驶车协同决策模型模型还可适应网联自动驾驶车现实的个性化驾乘需求
。
附图说明
[0017]图1为本专利技术方法流程图
[0018]图2为本专利技术
S3
的算法流程图
[0019]图3为本专利技术
S4
的算法流程图
[0020]图4为本专利技术算法中关键步骤之间的数据流关系示意
[0021]图5为实施例场景
具体实施方式
[0022]冲突区域
、
近冲突区域的定义:
[0023]冲突区域即含有车辆轨迹交叉的而产生的冲突点的区域,如城市道路
、
高速公路中交叉口内部;
[0024]本专利技术将近冲突区域定义为车辆到达冲突区域之前的一段距离,本专利技术以停车线前停车视距长度为近冲突区域计算范围
。
本专利技术对近冲突区域及冲突区域内部的车辆纳入考虑对象
。
[0025]停车视距,为专业名词,指的是同一车道上,车辆行驶时遇到前方障碍物而必须采取制动停车时所需要最短行车距离
。
[0026]本专利技术技术方案适用于城市场景
、
高速公路场景等
。
本专利技术方法通过网联的路侧设备对近冲突区域及冲突区域内的车辆状态信息进行检测收集,并进行策略计算和决策信息发布
。
在技术上具有可行性
。
[0027]以下结合附图和实施例对本专利技术技术方案做进一步介绍
。
[0028]实施例
[0029]一种人机混驾环境下的多车协同决策方法,总涉及构建三个决策模型:
CAV
与
HV
交互模型
、CAV
协同决策模型
、
人机混驾交互与协同模型;总涉及包括以下步骤:
[0030]S1
车辆属性及状态信息更新步骤:输入场景中所有车辆的属性信息,包含车辆类本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种人机混驾环境下的多车协同决策方法,其特征在于,总涉及构建三个决策模型:
CAV
与
HV
交互模型
、CAV
协同决策模型
、
人机混驾交互与协同模型;总涉及包括以下步骤:
S1
车辆属性及状态信息更新步骤:输入场景中所有车辆的属性信息,包含车辆类型
、
运动学参数;车辆状态信息,包含车辆位置
、
车辆速度
、
加速度;
S2
博弈对象列表更新及模型切换步骤:根据车辆状态,判断进入近冲突区域及冲突区域内的车辆,更新博弈对象列表中所包含的交互与协同车辆;根据博弈对象类型与数量,确定实际执行的模型;
S3 CAV
与
HV
交互建模步骤:建立
CAV
与
HV
交互的模型;
S4 CAV
协同决策建模步骤:建立
CAV
车辆内部协同决策的模型;
S5
人机混驾交互协同建模步骤:耦合上述
CAV
与
HV
交互模型
、CAV
协同决策模型,进行人机混驾交互协同模型,并进行模型求解,预测博弈对象列表中
HV
的动作,求解
CAV
的最优动作策略,即加速度;
S6
车辆状态更新步骤:
CAV
根据输出的加速度决策结果,通过运动学公式实现车辆状态更新,求解更新速度
、
位置;
HV
的加速度
、
速度
、
位置从环境中重新采集
。2.
如权利要求1所述的方法,其特征在于,所述步骤
S1
中,所述车辆属性及状态信息更新步骤具体为:从环境中获取每辆车的车辆类型信息,即车辆为
CAV
或
HV
;运动学相关参数,包括最大加速度
、
最大减速度
、
最大速度;在每一个时间步,采集更新环境中
HV
当下的加速度
、
速度
、
位置;
CAV
按照模型输出的最优加速度根据运动学公式更新车辆速度
、
位置;车辆状态信息作为模型的输入
。3.
如权利要求1所述的方法,其特征在于,所述步骤
S2
中,所述博弈对象列表更新及模型切换步骤,具体为:场景中所有的车辆
S
=
{S1,
S2,
…
,
S
k
,
…
,
S
K
}
,其中包含
I
辆
CAV
,表示为
M
=
{M1,
M2,
…
,
M
i
,
…
,
M
I
}
和
J
辆
HV
,表示为
N
=
{N1,
N2,
…
,
N
j
,
…
,
N
J
}
;定义博弈范围,即近冲突区域及冲突区域内;进入博弈范围内的车辆被加入到博弈对象列表;车辆通过冲突区域后即退出博弈对象列表;博弈对象列表中的车辆其中包含
P
辆
CAV
,表示为,表示为
Q
辆
HV
,表示为根据博弈对象列表中车辆的种类和各类车的数量,进行模型的选择和切换,当博弈对象列表中无
CAV
车辆或仅有一辆车,则车辆可自由通过,无需考虑交互协同;当博弈对象列表中车辆均为
CAV
车辆时,仅进行
CAV
协同决策,选择
CAV
协同决策模型进行车辆最优加速度策略求解;当博弈对象列表中车辆同时含
CAV
和
HV
,且仅有一辆
CAV
时,仅需
CAV
与
HV
交互决策,选择
CAV
与
HV
交互模型进行
CAV
最优加速度策略求解;当博弈对象列表中车辆为同时含
CAV
和
HV
,且含多辆
CAV
时,需要耦合
CAV
协同决策模型和
CAV
与
HV
交互决策模型实现人机混驾场景下的协同决策
。4.
如权利要求1所述的方法,其特征在于,所述步骤
S3
中,
CAV
与
HV
交互建模步骤中交互模型具体为:
基于博弈理论,构建一个非合作模型,将
CAV
和
HV
分别划分为领导者和跟随者;考虑车辆运行过程中安全
、
效率
、
舒适性三方面的需求,设计
CAV
的收益函数
f
p
和
HV
的收益函数
f
q
;两者的收益函数形式一致,车辆个体收益值为三者的加权求和;;两者的收益函数形式一致,车辆个体收益值为三者的加权求和;式中,为
CAV
的安全性指标,为
CAV
的效率指标,为
CAV
舒适性指标;分别是三个指标的权重值;分别为
HV
的安全
、
效率
、
舒适性指标,为各自的权重值;具体指标计算如下式所示:为各自的权重值;具体指标计算如下式所示:为各自的权重值;具体指标计算如下式所示:为各自的权重值;具体指标计算如下式所示:为各自的权重值;具体指标计算如下式所示:为各自的权重值;具体指标计算如下式所示:式中,
Δ
L
p
为
CAV
车辆
p
距离与
HV
车辆
q
的冲突点的距离,
v
p
(k+1)
为第
k+1
时刻
CAV
车辆
p
的速度,
a
p
(k)、a
p
(k+1)
分别为第
k、k+1
时刻
CAV
车辆
p
的加速度;
Δ
L
q
为
HV
车辆
q
距离与
CAV
车辆
p
的冲突点的距离,
v
q
(k+1)
为第
k+1
时刻
HV
车辆
q
的速度,
a
q
(k)、a
q
(k+1)
分别为第
k、k+1
时刻
HV
车辆
q
的加速度;
HV
的安全
、
效率权重值在前一时刻权重值的基础上,根据
CAV
对其的预测加速度与其实际加速度的相似程度,实时进行更新;为了降低模型参数更新...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。