【技术实现步骤摘要】
一种匝道行驶决策的控制方法、车辆及存储介质
[0001]本申请涉及但不限于智能驾驶
,尤其涉及一种匝道行驶决策的控制方法
、
车辆及存储介质
。
技术介绍
[0002]匝道汇入与普通换道行为模式相比,属于强制换道
。
匝道汇入是需要从侧向
、
纵向控制群车的综合交通行为,而所有相关车辆的驾驶员往往并不都能做出正确判断
、
正确驾驶,任一车辆的失误都会引发由于车速不协调导致交通堵塞情况加剧甚至严重安全事故
。
[0003]相关技术中,针对匝道汇入的车辆,要么如申请号为
202010075592.9
的专利,基于安全阈值实现汇入决策;要么如申请号为
202210699345.5
的专利,结合最小安全碰撞距离实现汇入决策
。
上述两种方案中,均基于安全距离实现车辆的汇入,且确定匝道汇入策略的方式较为单一
。
技术实现思路
[0004]本申请的目的之一在于提供一种匝道行驶决策的控制方法
、
车辆及存储介质,以解决现有技术中确定匝道汇入策略的方式较为单一的问题
。
[0005]为了解决上述问题,本申请实施例的技术方案是这样实现的:
[0006]第一方面,本申请实施例提供一种匝道行驶决策的控制方法,所述方法包括:
[0007]获得当前时刻目标匝道车辆和相关车辆的当前行驶状态数据;
[0008]基于所述目标匝道车 ...
【技术保护点】
【技术特征摘要】
1.
一种匝道行驶决策的控制方法,其特征在于,所述方法包括:获得当前时刻目标匝道车辆和相关车辆的当前行驶状态数据;基于所述目标匝道车辆和所述相关车辆的当前行驶状态数据,采用车辆行驶决策网络,确定与所述目标匝道车辆的驾驶风格对应的行驶决策结果;其中,所述目标匝道车辆的驾驶风格是基于所述车辆行驶决策网络包括的匝道汇入场景状态环境中各驾驶风格的奖励函数确定的;若所述行驶决策结果为所述目标匝道车辆换道汇入行驶决策,获得所述目标匝道车辆和所述相关车辆在所述当前时刻之前的目标时段的历史行驶状态数据,并基于所述历史行驶状态数据,确定未来时段内与所述目标匝道车辆的驾驶风格对应的预测换道轨迹;基于所述预测换道轨迹,采用模型预测控制,对所述目标匝道车辆进行跟踪控制
。2.
根据权利要求1所述的匝道行驶决策的控制方法,其特征在于,待训练的车辆行驶决策网络包括两个结构相同的评估网络和目标网络,所述车辆行驶决策网络的训练过程包括:获取样本匝道车辆的包括已标注驾驶风格的样本时序数据,基于各驾驶风格的样本时序数据,确定所述匝道汇入场景状态环境中各所述驾驶风格的奖励函数;将所述样本时序数据中的每一样本数据作为一个当前状态输入至所述评估网络,得到所述评估网络输出的当前行驶决策行为,并将所述当前行驶决策行为作为当前动作;将所述当前动作输入所述匝道汇入场景状态环境,得到下一状态,以及得到与已标注驾驶风格对应的奖励函数对应的奖励值;将所述当前状态
、
所述当前动作
、
所述与已标注驾驶风格对应的奖励函数对应的奖励值和所述下一状态,以四元组形式作为样本序列存储在经验回放池,得到多个样本数据对应的多个样本序列;从所述经验回放池中采样目标数量的样本序列,基于所述评估网络输出的第一数值
、
所述目标网络输出的第二数值和所述奖励值,对所述评估网络的网络参数进行调整,并按照更新频率,替换所述目标网络的网络参数为所述评估网络的最新的网络参数,直至达到迭代条件
。3.
根据权利要求2所述的匝道行驶决策的控制方法,其特征在于,所述基于各驾驶风格的样本时序数据,确定所述匝道汇入场景状态环境中各所述驾驶风格的奖励函数,包括:基于各所述驾驶风格的样本时序数据,确定各所述驾驶风格的至少一个驾驶指标的指标权重;获得每一驾驶指标对应的指标奖励函数;基于各所述驾驶风格的每一驾驶指标的指标权重,以及所述每一驾驶指标对应的指标奖励函数,确定各所述驾驶风格的奖励函数
。4.
根据权利要求3所述的匝道行驶决策的控制方法,其特征在于,所述样本数据包括车辆的速度和加速度,所述至少一个驾驶指标包括安全指标
、
高效指标和舒适度指标,所述基于各所述驾驶风格的样本时序数据,确定各所述驾驶风格的至少一个驾驶指标的指标权重,包括:针对每一驾驶风格,预先设定所述安全指标对应的安全指标权重为第一权重;基于所述样本时序数据,通过第一计算公式,得到所述舒适度指标对应的舒适度指标
权重;基于所述样本时序数据,通过第二计算公式,得到所述高效指标对应的高效指标权重;其中,所述第一计算公式和所述第二计算公式分别为,其中,所述第一计算公式和所述第二计算公式分别为,其中,
ω
comf
表示所述舒适度指标权重,
M
表示所述样本时序数据中包含的时刻个数,
a_host0
m
表示第
m
时刻车辆的加速度,表示所述样本时序数据中的车辆的平均加速度;
ω
eff
表示所述高效指标权重,
v_host0
m
表示所述第
m
时刻车辆的速度,表示所述样本时序数据中的车辆的平均速度
。5.
根据权利要求3所述的匝道行驶决策的控制方法,其特征在于,所述至少一个驾驶指标包括安全指标
、
高效指标和舒适度指标,所述安全指标对应的安全奖励函数为,所述舒适度指标对应的舒适度奖励函数为,
r
comf
=
‑
a_host
所述高效指标对应的高效奖励函数为,所述高效指标对应的高效奖励函数为,
r
eff
=
r
eff
,1+r
eff
,2其中,
J(t)
表示第
t
时刻所述样本匝道车辆的总体风险度,
a_host
表示所述第
t
时刻所述样本匝道车辆的实时加速度,
v_host
表示所述第
t
时刻所述样...
【专利技术属性】
技术研发人员:包宇,陈达兴,黎平,
申请(专利权)人:重庆长安汽车股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。