【技术实现步骤摘要】
面向扩展式博弈的智能驾驶连续域决策层次空间优化方法
[0001]本专利技术属于智能驾驶车辆交互式行为决策及其优化求解的
,特别是面向扩展式博弈的智能驾驶连续域决策层次空间优化方法。
技术介绍
[0002]随着智能化技术的研究不断向纵深发展,智能驾驶车辆得到了广泛的关注,其是未来汽车发展的前沿热点和必然趋势,决策是提升车辆驾驶智能性和类人性的重要枢纽和关键一环,起到类似人类驾驶员大脑的中枢作用。同时,智能驾驶车辆、周围交通车辆和交通环境因素之间动态耦联,具有极强的交互性。扩展式博弈是能够描述决策交互性的有力技术工具,但其蕴含的决策动作序贯特性、先行者先准确预测跟随者的最优应对策略进而提前做出决策、决策的信息戳非同时的性质均给决策和优化求解带来了技术上的挑战。
[0003]现有的一些解决方案以具体的任务定义来描述决策,集合了众多归纳推理机能,常将行为动作间隔采样为有限个离散变量,但忽略了其为有限的连续变量的性质,离散动作也不利于准确决策出最优策略。扩展式博弈中的先行者和跟随者的优化目标泛函同时与自身和环境相关,形成 ...
【技术保护点】
【技术特征摘要】
1.面向扩展式博弈的智能驾驶连续域决策层次空间优化方法,其特征在于,包括:S1、智能驾驶车辆分别与周围交通车辆和交通环境实现信息获取及共享;S2、基于获取的信息,在连续的动作域内建立智能驾驶车辆扩展式博弈决策模型;S3、参与博弈的各辆汽车预测其他汽车对自身驾驶行为的反应,分别获得先行车辆和跟随车辆的预期效用函数、等式约束和不等式约束;S4、根据所述先行车辆和跟随车辆的预期效用函数、等式约束和不等式约束,利用层次空间优化方法求解所述智能驾驶车辆扩展式博弈决策模型,输出参与博弈的各辆汽车在T时刻的加速度策略;S5、智能驾驶车辆执行自身在T时刻的加速度策略;S6、在T+1时刻更新智能驾驶车辆、周围交通车辆和交通环境的信息,并且参与博弈的各辆汽车重新预测其他汽车对自身驾驶行为的反应;S7、重复执行步骤S1
‑
S6,直至各个车辆消解风险而退出博弈交互过程。2.如权利要求1所述的面向扩展式博弈的智能驾驶连续域决策层次空间优化方法,其特征在于,所述S1还包括:当获取的信息不完备时,智能驾驶车辆利用采集的包括周围交通车辆在内的交通环境的历史信息,并结合对周围交通车辆和交通环境的理解与认知,补全不完备的信息。3.如权利要求1所述的面向扩展式博弈的智能驾驶连续域决策层次空间优化方法,其特征在于,在所述S2中,所述智能驾驶车辆扩展式博弈决策模型涉及嵌入驾驶风格的多目标车辆驾驶需求和交通性能需求;所述多目标车辆驾驶需求包括智能驾驶车辆的安全性需求、舒适性需求和空间性需求;所述交通性能需求包括交通系统的效率性需求、节能性需求和协同性需求。4.如权利要求3所述的面向扩展式博弈的智能驾驶连续域决策层次空间优化方法,其特征在于:所述安全性需求对应的安全性模型表示如下:所述安全性需求对应的安全性模型表示如下:所述安全性需求对应的安全性模型表示如下:其中,表示T时刻车辆p和车辆q通过目标区域的剩余时间差;和分别表示T时刻车辆p和车辆q通过目标区域的剩余时间;v
p
(T)和v
q
(T)分别表示T时刻车辆p和车辆q的瞬时速度;a
p
(τ)和a
q
(τ)分别表示τ时刻车辆p和车辆q的瞬时加速度;O
p
(T+T
m
)和
O
q
(T+T
m
)分别表示目标区域的位置坐标;O
p
(T)和O
q
(T)分别表示当前时刻车辆p和车辆q的位置坐标;表示求解以T
m
为因变量的函数;所述舒适性需求对应的舒适性模型表示如下:所述舒适性需求对应的舒适性模型表示如下:其中,和分别表示从起始时刻到T时刻内车辆p和车辆q的相邻时域加速度波动幅值平方的累积;a
p
(τ)和a
q
(τ)分别表示τ时刻车辆p和车辆q的瞬时加速度;a
p
(τ
‑
1)和a
q
(τ
‑
1)分别表示τ
‑
1时刻车辆p和车辆q的瞬时加速度;所述空间性需求对应的空间性模型表示如下:O
p
(T)=[X
p
(T),Y
p
(T)],O
q
(T)=[X
q
(T),Y
q
(T)]D
p
(Θ)=D
p
(α,β,γ;T),D
q
(Ξ)=D
q
(δ,η,θ;T)其中,O
p
(T)和O
q
(T)分别表示T时刻车辆p和车辆q的位置坐标;[X
p
(T),Y
p
(T)]和[X
q
(T),Y
q
(T)]分别表示T时刻车辆p和车辆q的横纵坐标;D
p
(Θ)和D
q
(Ξ)分别表示车辆p和车辆q的心理接受程度;α,β,γ和δ,η,θ分别表示与车辆p和车辆q驾驶风格相关的因子,旨在区别不同驾驶风格对周围可行驶空间心理接受程度的差异。5.如权利要求3所述的面向扩展式博弈的智能驾驶连续域决策层次空间优化方法,其特征在于:所述效率性需求对应的效率性模型表示如下:其中,和分别表示T时刻车辆p和车辆q通过目标区域的剩余时间;所述节能性需求对应的节能性模型表示如下:其中,N
c
(a
p
(T)|a
p
(T
‑
1))和N
c
(a
q
(T)|a
q
(T
‑
1))分别表示在相邻时刻车辆p和车辆q博弈决策输出的加减速模态跳变的次数;表示能耗模型;a
p
(T)和a
q
(T)分别表示车辆p和车辆q在T时刻的瞬时加速度;a
p
(T
‑
1)和a
q
(T
‑
1)分别表示车辆p和车辆q在T
‑
1时刻的瞬时加速度;v
p
(T)和v
q
(T)分别表示车辆p和车辆q在T时刻的瞬时速度;
所述协同性需求对应的协同性模型表示如下:其中,P
e
和S
g
分别表示博弈交互的持续时间和阶段博弈演进的阶段数;R
r
表示各个车辆消解风险而退出博弈交互过程的条件。6.如权利要求1所述的面向扩展式博弈的智能驾驶连续域决策层次空间优化方法,其特征在于,在所述S3中,所述先行车辆的预期效用函数、等式约束和不等式约束表示为:特征在于,在所述S3中,所述先行车辆的预期效用函数、等式约束和不等式约束表示为:特征在于,在所述S3中,所述先行车辆的预期效用函数、等式约束和不等式约束表示为:V1(a
p
,a
q
)=a
p
‑
a
max
≤0V2(a
p
,a
q
)=v
p
‑
v
max
≤0V4(a
p
,a
q
)=a
p
‑
a
min
≥0V5(a
p
,a
q
)=v
p
‑
v
min
≥0其中,表示先行车辆的预期效用函数;a
p
表示车辆p在当前时刻的瞬时加速度;a
q
表示车辆q在当前时刻的瞬时加速度;表示车辆p和车辆q通过目标区域的剩余时间差;表示车辆p的相邻时域加速度波动幅值平方的累积;表示车辆p和车辆q融合心理接受程度的车间距;ε
pq
...
【专利技术属性】
技术研发人员:朱冰,贾士政,赵健,韩嘉懿,唐衍鹏,宋东鉴,
申请(专利权)人:吉林大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。