【技术实现步骤摘要】
不确定性到确定性行驶场景的实现方法、设备及存储介质
[0001]本专利技术涉及一种不确定性到确定性行驶场景的实现方法、设备及存储介质,属于智能车 辆驾驶领域。
技术介绍
[0002]自动驾驶车辆在一些较为简单的路况可以实现智能化行驶,诸如结构化道路环境,道路 曲率和车辆、行人密度有限的环境下,车辆的智能化都是容易实现的,另外在良好的天气下, 没有雨雪雾气等天气对道路环境的影响,车辆是在良好的环境内有序行驶,对于实现智能化 是极为容易的一种情况。然而自动驾驶车辆不仅是在上述行驶环境较为容易可控的环境行驶, 而且还需要经历各种极限行驶的情况,例如道路曲率较高的情况下车辆的动力学特性对于车 辆智能化水平的限制,当车辆急速转弯时,会引起车辆前后轮的垂向力,以至于影响车辆路 径规划的准确性和车辆控制的安全性;例如在道路湿滑程度较高的情况下车辆行驶容易呈现 极限动力学特性,当车辆以中高速行驶时,路面的湿滑会导致车辆呈现横向运动,尤其当路 面粗糙度过高时,自动驾驶车辆会容易出现“甩尾”行驶的特点,以至于实时规划的路径会 偏离正常的车道行驶 ...
【技术保护点】
【技术特征摘要】
1.一种不确定性到确定性行驶场景的实现方法,其特征在于,包括以下步骤:获取自动驾驶车辆在极限行驶状况下的状态数据和道路状态数据,并且进行归一化处理;将现实道路场景转化成虚拟行驶场景,从所述道路状态数据中提取关键道路边界点形成模拟坐标点映射到虚拟场景;实现虚拟极限行驶场景的不确定性道路环境到确定性道路环境转换策略,进行车辆状态分布,所述车辆状态包括可控状态和不可控状态,将不可控状态部分通过增加可控状态的响应因子来确定车辆状态数值,并进行在线车辆状态计算,构建贝叶斯法则进行不可控状态预测,并且进行离线数据平衡过程以及道路赋能的车辆状态分布过程,将其输入到虚拟极限道路场景中,以离线数据化在虚拟极限道路场景中进行模拟,实现对虚拟行驶场景下的道路赋能的车辆状态分布。2.根据权利要求1所述的实现方法,其特征在于,在实现虚拟极限行驶场景的不确定性道路环境到确定性道路环境转换策略后,将其迁移到自动驾驶车辆中,使自动驾驶车辆在现实不确定性道路环境中进行探索交互。3.根据权利要求1所述的实现方法,其特征在于,从所述道路状态数据中提取关键道路边界点时,时间间隔采样标注如下:道路边界点表述为:当选择稠密度数据点区域中的某一组点{p1‑
n
,p1‑
n
‑1,
…
,p1‑
n
‑
n
}距离稠密度区域较远时,此时让车辆重新在此距离段按照同样的采样时间和状态重新行驶,记录下第二次距离点{p2‑
n
,p2‑
n
‑1,
…
,p2‑
n
‑
n
},并计算第二次距离点与稠密度区域的距离和第一组点的距离,第一组点的平均点为p1‑
n
‑
i
,第二组点的平均点为p2‑
n
‑
i
,采用欧式距离公式计算二者的距离当|p
12
|=0时,说明这两组点都不可取,车辆要在此距离段按照同样的采样时间和状态重新行驶,以获取标准数据,当p
12
<0时,采用第二组所采样的道路边界数据点,并将其与其它稠密度数据点进行结合形成一组新的道路边界点,具体可以表述为:将上述这组新的数据点连接起来,形成虚拟极限行驶场景下的道路边界。
4.根据权利要求1所述的实现方法,其特征在于,所述进行车辆状态分布具体步骤包括:设定整条道路环境的关键道路点环境片段的集合为:E~{e
n
,e
n+1
,
…
,e
2n
},每一条关键道路点环境片段对应的因果因素集合为:s
u
~s
uij
(j=0,1,
…
,n
‑
1),则车辆在关键道路点环境的不可控状态表述为:式中,w
z
是横摆角速度;w
x
是侧倾角变化;α是航向角变化;v
x
是纵向车速;v
y
是侧向车速;设车辆在t时刻的状态是可控的,标记为s
t
,在t+1时刻的状态是不可控的,标记为s
t+1
,则车辆从s
t
→
s
t+1
的可控状态过渡函数为:p(s
t+1
/s
t
,f(s
u
,s
t
,a
t
),a
t
),式中,f(s
u
,s
t
,a
t
)是状态从s
t
→
s
t+1
的有效因果因素;观测值可以由以下数值获取:o=o(s
t
,f(s
u
,s
t
,a
t
),a
t
);当道路边界点呈现结构化特征时,此时道路场景较为简单,车辆状态是可控的,设定整条道路环境的非关键道路点环境片段的集合为:E~{e1,e2,
…
,e
n
},对应的非关键道路点环境片段的可控状态为:s
s
~s
si
,则车辆在非关键道路点环境的可控状态表述为:通过将道路的关键点环境片段和非关键点环境片段所产生的车辆可控状态和不可控状态后,产生车辆总状态为:当车辆处于可控状态较多时,通过增加不可控状态的响应因子ε(ε=0,
…
,1),来确定车辆状态数值,其表达公式是:当车辆处于不可控状态较多时,通过增加可控状态的响应因子ε(ε=0,
…
,1),来确定车辆状态数值,其表达公式是:所述在线车辆状态计算具体包括:当车辆在整条道路环境的关键道路点环境片段时,车辆探测的状态是不可控的,标记为:s
ui
~(s
u1
,s
u2
,s
u3
,
…
,s
un
‑2,s
un
‑1,s
un
,s
un+1
,s
un+2
,s
un+3
,
…
,s
2un
),路侧设备探测的观测数据,标记为:s
oi
~(s
o1
,s
o2
,s
o3
,
…
,s
on
‑2,s
on
‑1,s
on
,s
on+1
,s
on+2
,s
on+3
,
…
,s
2on
)观测数据s
oi
实时对s
ui
进行状态观测;定义状态集s
ui
前后时刻的状态误差为Δs
un
,表述前后时刻的误差值表达式是:
Δs
un
=||s
un
‑
s
un
‑1||>>0
①
当Δs
un
>>0时,表明在t
n
‑1时刻,车辆探测的数据误差累积较大,此时可以使用观测数据来替代原来的状态数据,可以表述为:此时将可观测的数据作为状态,即作为车辆的状态,并从第n个变量的观测数据编码为状态:s
n
=(s
on
,s
on+1
,s
on+2
,s
on+3
,
…
,s
2on
),同时从t
n
‑1开始时刻的状态s
un
‑1作为系统的初始状态,构成了状态空间采用基于LSTM的编码器f
enc
:的作用实现了将观测数据映射到状态空间的过程;解码器f
dec
:是将状态映射到动作的过程,最后进行模型优化以学习到最优策略,得到如下策略梯度是:以得到最大化期望累积增益;
②
当在t
n+i
(i=1,
…
,n)时刻,Δs
un
≈0时,此时可以继续使用车辆状态,以降低路侧设备计算数据的复杂性,假如i=3可以表述为:此时将可观测的数据和可替代观测数据作为车辆状态,即作为车辆状态,并从第n个变量的观测数据编码为状态:s
n
=(s
on
,s
on+1
,s
on+2
,s
on+3
,s
un+4
,
…
,s
2un
),同时从t
n
‑1开始时刻的状态s
un
‑1作为系统的初始状
态,构成了状态空间采用基于LSTM的编码器f
enc
:的作用实现了将观测数据映射到状态空间的过程;解码器f
dec
:是将状态映射到动作的过程;当车辆探测行驶环境的状态处于可控模式时,此时路侧设备探测的观测数据不进入计算模式,而只是起到观测作用,此时车辆状态数据可以表述为:s
si
~(s
s1
,s
s2
,s
s3
,
…
,s
sn
‑2,s
sn
‑1,s
sn
,s
sn+1
,s
sn+2
,s
sn+3
,
…
,s
2sn
),同时从t1时刻的状态s1作为系统的初始状态,构成了状态空间采用基于注意力机制的编码器f
enc
:的作用实现了将观测数据映射到状态空间的过程;解码器f
dec
:是将状态映射到动作的过程;当车辆所探测的行驶环境从非关键道路点环境片段转移到关键道路点环境片段时,设t
n
时刻是非关键道路点环境片段和关键道路点环境片段的交接点,那么,车辆的状态表述为:路侧设备探测的观测数据,标记为:s
oi
~(s
o1
,s
o2
,s
o3
,
…
,s
on
‑2,s
on
‑1,s
on
,s
on+1
,s
on+2
,s
on+3
,
…
,s
2on
)观测数据s
oi
实时对s
ui
进行状态观测,t0~t
n
时刻,车辆处于非关键道路点环境片段,此时不需要使用观测数据,在t
n
~t
2n
车辆处于关键道路点环境片段,此时需要使用观测数据,车辆状态可以表述为:在t
n
~t
2n
时刻,从第n个变量的观测数据完全替代关键道路点环境片段的数据作为车辆状态,即将观测数据s
oi
~(s
on+1
,s
on+2
,s
on+3
,s
on+4
,s
on+5
,
…
,s
2on
)完全替代为不可控状态数据s
ui
~(s
un+1
,s
un+2
,s
un+3
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。