一种匝道行驶决策的控制方法技术

技术编号:39835484 阅读:9 留言:0更新日期:2023-12-29 16:19
本申请公开了一种匝道行驶决策的控制方法

【技术实现步骤摘要】
一种匝道行驶决策的控制方法、车辆及存储介质


[0001]本申请涉及但不限于智能驾驶
,尤其涉及一种匝道行驶决策的控制方法

车辆及存储介质


技术介绍

[0002]匝道汇入与普通换道行为模式相比,属于强制换道

匝道汇入是需要从侧向

纵向控制群车的综合交通行为,而所有相关车辆的驾驶员往往并不都能做出正确判断

正确驾驶,任一车辆的失误都会引发由于车速不协调导致交通堵塞情况加剧甚至严重安全事故

[0003]相关技术中,针对匝道汇入的车辆,要么如申请号为
202010075592.9
的专利,基于安全阈值实现汇入决策;要么如申请号为
202210699345.5
的专利,结合最小安全碰撞距离实现汇入决策

上述两种方案中,均基于安全距离实现车辆的汇入,且确定匝道汇入策略的方式较为单一


技术实现思路

[0004]本申请的目的之一在于提供一种匝道行驶决策的控制方法

车辆及存储介质,以解决现有技术中确定匝道汇入策略的方式较为单一的问题

[0005]为了解决上述问题,本申请实施例的技术方案是这样实现的:
[0006]第一方面,本申请实施例提供一种匝道行驶决策的控制方法,所述方法包括:
[0007]获得当前时刻目标匝道车辆和相关车辆的当前行驶状态数据;
[0008]基于所述目标匝道车辆和所述相关车辆的当前行驶状态数据,采用车辆行驶决策网络,确定与所述目标匝道车辆的驾驶风格对应的行驶决策结果;其中,所述目标匝道车辆的驾驶风格是基于所述车辆行驶决策网络包括的匝道汇入场景状态环境中各驾驶风格的奖励函数确定的;
[0009]若所述行驶决策结果为所述目标匝道车辆换道汇入行驶决策,获得所述目标匝道车辆和所述相关车辆在所述当前时刻之前的目标时段的历史行驶状态数据,并基于所述历史行驶状态数据,确定未来时段内与所述目标匝道车辆的驾驶风格对应的预测换道轨迹;
[0010]基于所述预测换道轨迹,采用模型预测控制,对所述目标匝道车辆进行跟踪控制

[0011]根据上述技术手段,本申请根据目标匝道车辆和周围相关车辆的行驶状态特征,结合驾驶员风格,对车辆汇入进行拟人化的决策规划与控制,如此,在保障安全的前提下,根据驾驶员风格选择匝道汇入时机,从而改善了复杂匝道汇入场景下的汇入策略;进一步地,生成拟人化的规划轨迹,有效改善了匝道汇入场景的适应性问题,使智能驾驶的汇入轨迹更贴近用户的驾驶习惯

[0012]第二方面,本申请实施例提供一种车辆,所述车辆包括控制器,其中,
[0013]所述控制器,配置为实现上述所述的方法来运行车辆

[0014]第三方面,本申请实施例提供一种存储介质,所述存储介质存储有一个或者多个计算机程序,一个或者多个计算机程序可被一个或者多个处理器执行,以实现上述方法中
的部分或全部步骤

[0015]本申请的有益效果:
[0016](1)
保障安全的前提下,根据驾驶员风格选择匝道汇入时机,为后续的轨迹规划提供了有安全保障的拟人化高层决策

[0017](2)
在考虑周围车辆和自车行为特性的基础上,生成拟人化的规划轨迹,有效改善了匝道汇入场景的适应性问题,使智能驾驶的汇入轨迹更贴近用户的驾驶习惯

[0018](3)
通过在轨迹跟踪控制模型中引入驾驶员风格的优化目标,实现基于三种驾驶风格的拟人化控制,提高了智能驾驶在跟踪控制上的体验感

附图说明
[0019]此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本申请的实施例,并与说明书一起用于说明本申请的技术方案

[0020]图1为本申请实施例提供的一种可选的匝道行驶决策的控制方法的实施环境示意图;
[0021]图2为本申请实施例提供的一种可选的匝道行驶决策的控制方法的流程示意图;
[0022]图3为本申请实施例提供的一种可选的
Attention

BiLSTM
网络的结构示意图;
[0023]图4为本申请实施例提供的一种可选的匝道汇入场景的
DQN
网络的结构示意图;
[0024]图5为本申请实施例提供的一种车辆的结构示意图

具体实施方式
[0025]为了使本申请的目的

技术方案和优点更加清楚,下面结合附图和实施例对本申请的技术方案进一步详细阐述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围

[0026]在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合

所涉及的术语“第一
/
第二
/
第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一
/
第二
/
第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施

[0027]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同

本文中所使用的术语只是为了描述本申请的目的,不是旨在限制本申请

[0028]参见图1,图1是本申请的一示例性实施例示出的匝道行驶决策的控制方法的实施环境示意图

如图1所示,一种示例的车辆控制系统包括目标匝道车辆
11、
目标匝道车辆
11
周围的多个相关车辆
12、13、14

15、
服务器
16
,目标匝道车辆
11
和相关车辆可以为本领域技术人员所设置的任何车辆

服务器可以为本领域技术人员所需要的服务器,在此不做限定

图中包括两条车道,一条为用于提供目标匝道车辆进入主干线的匝道,该匝道又称加速车道,加速车道是基于加速车道汇入起点和加速车道汇入终点确定的;另一条为主干线中
与加速车道相邻的主车道

需要说明的是,本申请实施例所提供的方法不限于匝道场景下使用,其他需要进行车道汇流的场景也可以适用

这里,车辆的行驶方向为沿着匝道向右方所示的方向行驶

图中仅是以四个相关车辆为示例,相关车辆的数量可以由本领域技术人员根据需要进行选取
。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种匝道行驶决策的控制方法,其特征在于,所述方法包括:获得当前时刻目标匝道车辆和相关车辆的当前行驶状态数据;基于所述目标匝道车辆和所述相关车辆的当前行驶状态数据,采用车辆行驶决策网络,确定与所述目标匝道车辆的驾驶风格对应的行驶决策结果;其中,所述目标匝道车辆的驾驶风格是基于所述车辆行驶决策网络包括的匝道汇入场景状态环境中各驾驶风格的奖励函数确定的;若所述行驶决策结果为所述目标匝道车辆换道汇入行驶决策,获得所述目标匝道车辆和所述相关车辆在所述当前时刻之前的目标时段的历史行驶状态数据,并基于所述历史行驶状态数据,确定未来时段内与所述目标匝道车辆的驾驶风格对应的预测换道轨迹;基于所述预测换道轨迹,采用模型预测控制,对所述目标匝道车辆进行跟踪控制
。2.
根据权利要求1所述的匝道行驶决策的控制方法,其特征在于,待训练的车辆行驶决策网络包括两个结构相同的评估网络和目标网络,所述车辆行驶决策网络的训练过程包括:获取样本匝道车辆的包括已标注驾驶风格的样本时序数据,基于各驾驶风格的样本时序数据,确定所述匝道汇入场景状态环境中各所述驾驶风格的奖励函数;将所述样本时序数据中的每一样本数据作为一个当前状态输入至所述评估网络,得到所述评估网络输出的当前行驶决策行为,并将所述当前行驶决策行为作为当前动作;将所述当前动作输入所述匝道汇入场景状态环境,得到下一状态,以及得到与已标注驾驶风格对应的奖励函数对应的奖励值;将所述当前状态

所述当前动作

所述与已标注驾驶风格对应的奖励函数对应的奖励值和所述下一状态,以四元组形式作为样本序列存储在经验回放池,得到多个样本数据对应的多个样本序列;从所述经验回放池中采样目标数量的样本序列,基于所述评估网络输出的第一数值

所述目标网络输出的第二数值和所述奖励值,对所述评估网络的网络参数进行调整,并按照更新频率,替换所述目标网络的网络参数为所述评估网络的最新的网络参数,直至达到迭代条件
。3.
根据权利要求2所述的匝道行驶决策的控制方法,其特征在于,所述基于各驾驶风格的样本时序数据,确定所述匝道汇入场景状态环境中各所述驾驶风格的奖励函数,包括:基于各所述驾驶风格的样本时序数据,确定各所述驾驶风格的至少一个驾驶指标的指标权重;获得每一驾驶指标对应的指标奖励函数;基于各所述驾驶风格的每一驾驶指标的指标权重,以及所述每一驾驶指标对应的指标奖励函数,确定各所述驾驶风格的奖励函数
。4.
根据权利要求3所述的匝道行驶决策的控制方法,其特征在于,所述样本数据包括车辆的速度和加速度,所述至少一个驾驶指标包括安全指标

高效指标和舒适度指标,所述基于各所述驾驶风格的样本时序数据,确定各所述驾驶风格的至少一个驾驶指标的指标权重,包括:针对每一驾驶风格,预先设定所述安全指标对应的安全指标权重为第一权重;基于所述样本时序数据,通过第一计算公式,得到所述舒适度指标对应的舒适度指标
权重;基于所述样本时序数据,通过第二计算公式,得到所述高效指标对应的高效指标权重;其中,所述第一计算公式和所述第二计算公式分别为,其中,所述第一计算公式和所述第二计算公式分别为,其中,
ω
comf
表示所述舒适度指标权重,
M
表示所述样本时序数据中包含的时刻个数,
a_host0
m
表示第
m
时刻车辆的加速度,表示所述样本时序数据中的车辆的平均加速度;
ω
eff
表示所述高效指标权重,
v_host0
m
表示所述第
m
时刻车辆的速度,表示所述样本时序数据中的车辆的平均速度
。5.
根据权利要求3所述的匝道行驶决策的控制方法,其特征在于,所述至少一个驾驶指标包括安全指标

高效指标和舒适度指标,所述安全指标对应的安全奖励函数为,所述舒适度指标对应的舒适度奖励函数为,
r
comf


a_host
所述高效指标对应的高效奖励函数为,所述高效指标对应的高效奖励函数为,
r
eff

r
eff
,1+r
eff
,2其中,
J(t)
表示第
t
时刻所述样本匝道车辆的总体风险度,
a_host
表示所述第
t
时刻所述样本匝道车辆的实时加速度,
v_host
表示所述第
t
时刻所述样...

【专利技术属性】
技术研发人员:包宇陈达兴黎平
申请(专利权)人:重庆长安汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1