当前位置: 首页 > 专利查询>吉林大学专利>正文

一种冰雪环境人车决策一致性评估方法技术

技术编号:39403264 阅读:8 留言:0更新日期:2023-11-19 15:55
本发明专利技术公开了一种冰雪环境人车决策一致性评估方法,首先建立决策一致性评估马尔科夫模型,然后设计双

【技术实现步骤摘要】
一种冰雪环境人车决策一致性评估方法


[0001]本专利技术属于汽车驾驶控制领域,涉及一种冰雪环境人车决策一致性评估方法


技术介绍

[0002]未来
20

40
年交通环境中,存在传统车辆

智能车混行现象,不同的智能化程度使得智能车辆除车载信息和智能传感信息外获得的网联信息量不均且断续出现;另外,冰雪环境下车辆动力学响应差异会使驾驶人产生紧张情绪,造成心理压力过大,导致驾驶恐慌;面对白色的景观,会产生视觉和心理上的疲劳,使驾驶人的反应或判断操作能力下降

[0003]因此,面对冰雪环境下智能车辆决策算法信息量不均

人车能力不对称

车辆动力学特性变化问题,合理协调驾驶人决策与智能车决策,完成驾驶人与智能车的协同控制,给出一致性评价准则,可有效降低冰雪环境下交通事故的发生概率


技术实现思路

[0004]本专利技术为了有效协调驾驶人决策和智能车决策,提出一种冰雪环境人车决策一致性评估方法;
[0005]本专利技术所述的一种冰雪环境人车决策一致性评估方法,是采用如下技术方案实现的:
[0006]一种冰雪环境人车决策一致性评估方法,假设智能车决策模块与驾驶人决策模块的输出结果分别是智能车决策出的期望车道

车速和驾驶人决策出的期望车道

车速,均为已知量,分别可由现有的智能车决策和驾驶人意图识别算法得到,作为决策一致性评估模块的输入,其中,期望车道的车道中心线为智能车的参考轨迹,考虑到使用连续变量量化决策差异会更贴近真实情况,因此采用能处理连续动作空间的深度确定性策略梯度算法描述决策一致性评估问题,选择智能车决策与驾驶人决策中更安全可靠

符合行车规范的决策结果作为执行模块的输入,如果选择的是智能车决策结果意味着采取智能车驾驶模式,如果选择的是驾驶人决策结果意味着采取驾驶人驾驶模式,由执行模块进行速度跟踪和轨迹跟踪,使得驾驶人与智能车在面临信息量不均

人车能力不对称

车辆动力学特性变化问题的情况下仍能保证安全

舒适地行驶;定义智能车为使用本方法的车辆,有且只有一辆,智能车上存在能够定位自身的位置和速度以及障碍物的位置和速度的传感器,为了模拟智能车的避障行为,定义能够阻碍智能车正常行驶的车辆为障碍车,本方法不会对障碍车的运动状态做出改变,其特征在于,本方法具体步骤如下:
[0007]步骤一

建立决策一致性评估马尔科夫模型:
[0008]马尔科夫模型是强化学习的基础,由智能体和环境构成,智能体负责针对当前环境状态和奖励做出相应的动作,环境则根据智能体的动作发生状态的变化;
[0009]构造动作空间:
[0010]A

{P
human
,P
machine
,
β
con
}(1)
[0011]其中:
P
human
表示驾驶人决策正确的概率,
P
human
∈[0,1];
[0012]P
machine
表示智能车决策正确的概率,
P
machine
∈[0,1];
[0013]β
con
表示决策一致性,
β
con
∈[
β
conmin
,1];
[0014]β
conmin
表示决策一致性最小值,
β
conmin

0.1

[0015]构造状态空间:
[0016]S

{S
ego
,S
obc
,D
human
,D
machine
,P
human
,P
machine
,
β
con
,
β
swi
}(2)
[0017]其中,
S
ego
表示智能车的状态,包括
{x,y,v,
δ
,d
c
,y
lat
,v
err
}
;其中,
x
表示智能车的纵向位置;
y
表示智能车的侧向位置;
v
表示智能车的车速,
v∈[0,v
max
],
v
max
表示当前车道允许的最大车速;
δ
表示智能车的前轮转角;
d
c
表示智能车所处车道的编号,
d
c
∈[1,d
cmax
],
d
cmax
表示当前道路总车道数,
d
cmax
为大于1的正整数;编号的顺序是由道路中心向道路边界依次递增,每条车道都对应有一个车道编号;
y
lat
表示智能车与离智能车最近的车道中心线的侧向距离;
v
err
表示智能车的车速与期望车速
v
ref
的偏差;
[0018]S
obc
表示障碍车的状态,包括
{x
i
,y
i
,v
i
}

i∈{1,2,

,n}
;其中,
x
i
表示第
i
辆障碍车的纵向位置;
y
i
表示第
i
辆障碍车的侧向位置;
v
i
表示第
i
辆障碍车的车速;
n
表示障碍车的数量,
n
为正整数;
[0019]D
human
表示驾驶人决策模块的输出结果,包括
{v
human
,d
chuman
}

v
human
表示驾驶人决策出的车速,
v
human
∈[0,v
max
];
d
chuman
表示驾驶人决策出的期望车道,
d
chuman
∈[1,d
cmax
];
[0020]D
machine
表示智能车决策模块的输出结果,包括
{v
machine
,d
cmachine
}

v
machine
表示智能车决策出的车速,
v本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种冰雪环境人车决策一致性评估方法,假设智能车决策模块与驾驶人决策模块的输出结果分别是智能车决策出的期望车道

车速和驾驶人决策出的期望车道

车速,均为已知量,分别可由现有的智能车决策和驾驶人意图识别算法得到,作为决策一致性评估模块的输入,其中,期望车道的车道中心线为智能车的参考轨迹,考虑到使用连续变量量化决策差异会更贴近真实情况,因此采用能处理连续动作空间的深度确定性策略梯度算法描述决策一致性评估问题,选择智能车决策与驾驶人决策中更安全可靠

符合行车规范的决策结果作为执行模块的输入,如果选择的是智能车决策结果意味着采取智能车驾驶模式,如果选择的是驾驶人决策结果意味着采取驾驶人驾驶模式,由执行模块进行速度跟踪和轨迹跟踪,使得驾驶人与智能车在面临信息量不均

人车能力不对称

车辆动力学特性变化问题的情况下仍能保证安全

舒适地行驶;定义智能车为使用本方法的车辆,有且只有一辆,智能车上存在能够定位自身的位置和速度以及障碍物的位置和速度的传感器,为了模拟智能车的避障行为,定义能够阻碍智能车正常行驶的车辆为障碍车,本方法不会对障碍车的运动状态做出改变,其特征在于,本方法具体步骤如下:步骤一

建立决策一致性评估马尔科夫模型:马尔科夫模型是强化学习的基础,由智能体和环境构成,智能体负责针对当前环境状态和奖励做出相应的动作,环境则根据智能体的动作发生状态的变化;构造动作空间:
A

{P
human
,P
machine
,
β
con
}(1)
其中:
P
human
表示驾驶人决策正确的概率,
P
human
∈[0,1]

P
machine
表示智能车决策正确的概率,
P
machine
∈[0,1]

β
con
表示决策一致性,
β
con
∈[
β
conmin
,1]

β
conmin
表示决策一致性最小值,
β
conmin

0.1
;构造状态空间:
S

{S
ego
,S
obc
,D
human
,D
machine
,P
human
,P
machine
,
β
con
,
β
swi
}(2)
其中,
S
ego
表示智能车的状态,包括
{x,y,v,
δ
,d
c
,y
lat
,v
err
}
;其中,
x
表示智能车的纵向位置;
y
表示智能车的侧向位置;
v
表示智能车的车速,
v∈[0,v
max
]

v
max
表示当前车道允许的最大车速;
δ
表示智能车的前轮转角;
d
c
表示智能车所处车道的编号,
d
c
∈[1,d
cmax
]

d
cmax
表示当前道路总车道数,
d
cmax
为大于1的正整数;编号的顺序是由道路中心向道路边界依次递增,每条车道都对应有一个车道编号;
y
lat
表示智能车与离智能车最近的车道中心线的侧向距离;
v
err
表示智能车的车速与期望车速
v
ref
的偏差;
S
obc
表示障碍车的状态,包括
{x
i
,y
i
,v
i
}

i∈{1,2,

,n}
;其中,
x
i
表示第
i
辆障碍车的纵向位置;
y
i
表示第
i
辆障碍车的侧向位置;
v
i
表示第
i
辆障碍车的车速;
n
表示障碍车的数量,
n
为正整数;
D
human
表示驾驶人决策模块的输出结果,包括
{v
human
,d
chuman
}

v
human
表示驾驶人决策出的车速,
v
human
∈[0,v
max
]

d
chuman
表示驾驶人决策出的期望车道,
d
chuman
∈[1,d
cmax
]

D
machine
表示智能车决策模块的输出结果,包括
{v
machine
,d
cmachine
}

v
machine
表示智能车决策出的车速,
v
machine
∈[0,v
max
]

d
cmachine
表示智能车决策出的期望车道,
d
cmachine
∈[1,d
cmax
]

β
swi
表示驾驶模式,存在:
每一时刻得到驾驶模式的取值,采取智能车驾驶模式意味着要将智能车的决策结果
{v
machine
,d
cmachine
}
作用到执行模块,采取驾驶人驾驶模式意味着要将驾驶人决策结果
{v
human
,d
chuman
}
作用到执行模块;设计奖励函数时从以下几方面考虑:在行驶过程中应尽量减少切换驾驶模式的行为:
r1=

w1(
β
swi
(t)

β
swi
(t

1))2(4)
其中,
r1表示切换驾驶模式带来的惩罚;
w1为
r1的权重系数;
β
swi
(t)
表示第
t
时刻的驾驶模式;
β
swi
(t

1)
表示第
t
‑1时刻的驾驶模式;保持设定的期望车速行驶:
r2=

w2v
err2
(5)
其中,
r2表示未保持期望车速行驶带来的惩罚;
w2为
r2的权重系数;保证沿着车道中心线行驶:
r3=

w3y
lat2
(6)
其中,
r3表示未沿着车道中心线行驶带来的惩罚;
w3为
r3的权重系数;尽量减少智能体动作的变化:
r4=

w4((P
human
(t)

P
human
(t

1))2+(P
machine
(t)

P
machine
(t

1))2)(7)
其中,
r4表示智能体动作变化带来的惩罚;
w4为
r4的权重系数;
P
human
(t)
表示第
t
时刻驾驶人决策正确的概率,
P
human
(t)∈[0,1]

P
human
(t

1)
表示第
t
‑1时刻驾驶人决策正确的概率,
P
human
(t

1)∈[0,1]

P
machine
(t)
表示第
t
时刻智能车决策正确的概率,
P
machine
(t)∈[0,1]

P
machine
(t

1)
表示第
t
‑1时刻智能车决策正确的概率,
P
machine
(t

1)∈[0,1]
;要与障碍车保持安全的碰撞时间:其中,
r5表示保持安全的碰撞时间的奖励;
w5为
r5的权重系数;
T
ttc,i
表示智能车与第
i
辆障碍车的碰撞时间,描述为:其中,
P(x,x
i
)
表示智能车与第
i
辆障碍车的位置关系;
C4表示智能车所在车道行驶方向前方
5m

10m
至智能车所在车道行驶方向后方
5m

10m
的区域;
C1表示智能车所在车道的除
C4以外的区域;
C2表示智能车所在车道的左右两侧相邻车道区域;
C3表示左右两侧与智能车所在车道相隔一个车道的车道区域;
T1表示最大碰撞时间;
T2表示左右两侧相邻车道最小碰
撞时间;
L
safe
表示智能车在静止状态时与障碍车的安全距离;当智能车决策和驾驶人决策的结果存在差异时,将会导致下一时刻智能车的纵向位置

侧向位置和车速与式
(9)
的计算结果不同,为了更好地区分采取智能车决策结果计算出的碰撞时间
T
ttc,machine,i
和驾驶人决策结果计算出的碰撞时间
T
ttc,human,i
的差异,将其描述为:为:其中,
P(x
machine
,x
i
)
表示采取智能车决策结果时智能车与第
i
辆障碍车的位置关系,
x
machine
表示采取智能车决策时智能车的纵向位置,
v
machine
表示采取智能车决策时智能车的车速;
P(x
human
,x
i
)
表示采取驾驶人决策结果时智能车与第
i
辆障碍车的位置关系,
x
human
表示采取驾驶人决策时智能车的纵向位置,
v
human
表示采取驾驶人决策时智能车的车速;将障碍车划分为智能车所在车道上的障碍车

智能车所在车道的左右两侧相邻车道上的障碍车

其他车道上的障碍车,因此,将
T
ttc,machine,i

T
ttc,human,i
也划分为智能车与智能车所在车道上的障碍车的碰撞时间

智能车与智能车所在车道的左右两侧相邻车道上的障碍车的碰撞时间:车的碰撞时间:车的碰撞时间:车的碰撞时间:其中,
T
machine,cur
表示采取智能车决策时智能车所在车道的碰撞时间;
T
machine,adj
表示采取智能车决策时智能车所在车道的左右两侧相邻车道的碰撞时间;
T
human,cur
表示采取驾驶人决策时智能车所在车道的碰撞时间;
T
human,adj
表示采取驾驶人决策时智能车所在车道的
左右两侧相邻车道的碰撞时间;
d
为一个车道宽;保证正确的概率
P
human

P
machine
与碰撞时间符合逻辑关系,以安全时间阈值为界限,在大于安全时间阈值时,正确的概率越大,获得的奖励越多;在小于安全时间阈值时,正确的概率越小,获得的惩罚越少;其中,
r6表示保证正确的概率与碰撞时间符...

【专利技术属性】
技术研发人员:郭洪艳于文雅戴启坤刘俊孟庆瑜陈虹
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1