当前位置: 首页 > 专利查询>东南大学专利>正文

一种面向开放干扰场景的营运车辆前向防撞驾驶决策方法技术

技术编号:35427157 阅读:11 留言:0更新日期:2022-11-03 11:30
本发明专利技术公开了一种面向开放干扰场景的营运车辆前向防撞驾驶决策方法。首先,提取人类驾驶员的安全驾驶行为,构建形成用于前向防撞驾驶决策学习的“类人”驾驶行为数据库。其次,利用行为克隆算法从“类人”驾驶行为数据库中学习前向防撞驾驶策略。最后,利用生成对抗模仿学习算法继续学习驾驶策略,得到具有高度类人水平的前向防撞驾驶策略。本发明专利技术提出的方法,能够模拟人类驾驶员的安全驾驶行为,且考虑了视觉盲区、突遇障碍物、不同行驶工况等因素对前向防撞决策的影响,输出加速、减速、转向等高级决策策略,实现了开放干扰场景下的营运车辆前向防撞驾驶决策。车辆前向防撞驾驶决策。车辆前向防撞驾驶决策。

【技术实现步骤摘要】
一种面向开放干扰场景的营运车辆前向防撞驾驶决策方法


[0001]本专利技术涉及一种营运车辆驾驶决策方法,尤其是涉及一种面向开放干扰场景的营运车辆前向防撞驾驶决策方法,属于汽车安全


技术介绍

[0002]营运车辆承担了公路物流运输、道路旅客运输等任务,是交通运输这一国民经济先行官的“主力军”。作为多式联运的关键一环,营运车辆是实现跨省运输、跨区运输的重要工具,其技术水平和安全状况是道路运输服务能力的重要表征。目前,营运车辆在安全运输方面仍存在诸多棘手难题,突出体现在事故易发和安全性低两个方面。
[0003]具体而言,由于营运车辆具有质心高、载重量大、运营时间长、视觉盲区广等特点,加之我国道路条件和交通状况复杂,致使交通事故频发。特别是在城市等开放干扰环境下,突遇障碍物的情况时有发生,若进行紧急变道或紧急制动等前向防撞操作,营运车辆极易因失稳而发生侧翻。此外,由于营运车辆的车头前方、右前轮附近和右后视镜下方附近均存在静态视觉盲区,当车辆向右转向时,车头极易与视觉盲区内的行人和非机动车发生碰撞。由此可见,营运车辆的车头前方是所有视觉盲区中最危险的区域之一,也是产生恶性安全事故的主要区域。因此,在开放、多交通目标干扰的城市交通环境下,如何避免因视觉盲区、突遇障碍物等因素造成的前向碰撞是保障营运车辆行车安全、提高运输效率的关键问题。
[0004]目前,积极发展自动驾驶技术已成为国内外广泛认可的保障车辆运行安全的重要手段。作为实现高品质自动驾驶的关键一环,驾驶决策决定了营运车辆自动驾驶的合理性和安全性。如果能在交通事故发生前的1.5秒对驾驶员进行危险预警,并提供可靠、有效的防撞决策策略,可以大幅度降低因前向碰撞造成的交通事故发生频率或减轻其造成的伤害。因此,研究开放干扰场景下的营运车辆前向防撞驾驶决策方法,对于降低碰撞事故的发生频率具有重要意义。
[0005]为此,已有较多专利和文献对防碰撞驾驶决策进行了研究,但主要面向乘用车辆。相比于乘用车辆,营运车辆在紧急变道或紧急制动过程中,更容易因失稳而发生侧翻,且具有更长的制动距离和制动时间。因此,面向乘用车辆的防撞决策方法,无法直接应用于营运车辆。另一方面,已有专利对营运车辆的防撞决策进行了研究,如一种综合考虑前后障碍物的重型营运车辆防碰撞预警方法(专利号:ZL202011512720.8)、一种基于前向障碍物识别的自适应防撞分级预警方法(专利号:ZL202010436618.8)、一种考虑路面附着条件的大型营运车辆防碰撞决策方法(公开号:CN113753026A)等,但这些方法均面向高速公路场景。
[0006]不同于高速公路场景中仅考虑防追尾问题,在开放干扰、机非混行的城市交通环境下,前向防撞决策应考虑以下三个方面:(1)应避免发生追尾事故;(2)应避免与车辆前方横向接近的交通参与者发生碰撞,即避免与突遇障碍物发生碰撞;(3)在车辆转向(特别是右转向)过程中,应避免与视觉盲区内出现的其它交通参与者发生碰撞。因此,面向高速公路场景的营运车辆防撞决策方法,亦无法直接应用于开放干扰的城市交通环境。
[0007]总体而言,针对开放、多交通目标干扰的城市交通环境,现有的前向防撞决策方法
存在可靠性低、准确性差等不足,尚缺乏能够提供驾驶动作、行车路径等具体驾驶建议的前向防撞驾驶决策方法,特别是缺乏考虑视觉盲区和突遇障碍物影响的营运车辆前向防撞可靠驾驶决策方法。

技术实现思路

[0008]专利技术目的:为了实现开放干扰场景下的营运车辆前向防撞驾驶决策,保障车辆行车安全,本专利技术针对重型货车、重型卡车等自动驾驶营运车辆,提出了一种面向开放干扰场景的营运车辆前向防撞驾驶决策方法。该方法能够模拟人类驾驶员的安全驾驶行为,且考虑了视觉盲区、突遇障碍物、不同行驶工况等因素对前向防撞决策的影响,输出加速、减速、转向等高级决策策略。同时,该方法无需考虑复杂的车辆动力学方程和车身参数,计算方法简单清晰,可以实时输出大型营运车辆的前向防撞驾驶策略,且使用的传感器成本较低,便于大规模推广。
[0009]技术方案:为实现本专利技术的目的,本专利技术所采用的技术方案是:一种面向开放干扰场景的营运车辆前向防撞驾驶决策方法。首先,提取人类驾驶员的安全驾驶行为,构建形成用于前向防撞驾驶决策学习的“类人”驾驶行为数据库。其次,利用行为克隆算法从“类人”驾驶行为数据库中学习前向防撞驾驶策略。最后,利用生成对抗模仿学习算法继续学习驾驶策略,得到具有高度类人水平的前向防撞驾驶策略。具体包括以下步骤:
[0010]步骤一:构建“类人”驾驶行为数据库
[0011]为了实现与人类驾驶员相媲美的驾驶决策,本专利技术通过实际道路测试和驾驶模拟仿真的方式,采集不同驾驶条件和行驶工况下人类驾驶员的安全驾驶行为,进而构建“类人”驾驶行为数据库。具体包括以下5个子步骤:
[0012]子步骤1:利用毫米波雷达、视觉传感器、北斗传感器和惯性传感器搭建多维目标信息同步采集系统。
[0013]子步骤2:在真实城市环境下,多名驾驶员依次驾驶搭载多维目标信息同步采集系统的营运车辆。
[0014]子步骤3:对驾驶员的车道变换、车道保持、车辆跟驰、加减速等各种安全驾驶行为的相关数据进行分析,重点针对城市车辆行驶中常见且易引发交通事故的跟驰与换道行为,提取出各典型驾驶行为的多源异质描述数据,如位置、速度、加速度、与周围交通参与者的相对距离和相对速度等。
[0015]子步骤4:为了模拟人类驾驶员在危险工况、边缘场景等极端工况下的安全驾驶行为,搭建基于硬件在环仿真的驾驶模拟场景(涵盖直道、弯道、十字路口等多种路网结构以及营运车辆、乘用车、非机动车、行人等多类交通参与者),所构建的城市交通场景包括以下两类:(1)在车辆行驶过程中,车辆前方会出现横向接近的交通参与者(即突遇障碍物);(2)在车辆转向过程中,车辆的视觉盲区内存在其他交通参与者。
[0016]驾驶员通过真实控制器驾驶仿真场景中的营运车辆,采集自车的位置、速度、加速度、与周围交通参与者的相对距离和相对速度等信息。
[0017]子步骤5:基于真实城市环境和驾驶模拟仿真环境采集的数据,构建形成用于前向防撞驾驶决策学习的“类人”驾驶行为数据库,具体可表示为:
[0018][0019]式中,X表示涵盖状态、动作的二元组,即构建的驾驶行为数据库,(s
j
,a
j
)表示j时刻的“状态

动作”对,s
j
表示j时刻的状态,a
j
表示j时刻的动作,即人类驾驶员基于状态s
j
做出的动作,n表示数据库中“状态

动作”对的数量。
[0020]步骤二:利用行为克隆算法学习“类人”驾驶行为数据库中的安全驾驶行为
[0021]为了高效、快速地从驾驶行为数据库中学习驾驶行为,常通过模仿学习的方式进行策略优化和行为学习。模仿学习主要包括行为克隆、逆向强化学习、从观察量进行模仿学习和概率推理4类方法。行为克隆本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向开放干扰场景的营运车辆前向防撞驾驶决策方法;首先,提取人类驾驶员的安全驾驶行为,构建形成用于前向防撞驾驶决策学习的“类人”驾驶行为数据库;其次,利用行为克隆算法从“类人”驾驶行为数据库中学习前向防撞驾驶策略;最后,利用生成对抗模仿学习算法继续学习驾驶策略,得到具有高度类人水平的前向防撞驾驶策略;其特征在于:步骤一:构建“类人”驾驶行为数据库通过实际道路测试和驾驶模拟仿真的方式,采集不同驾驶条件和行驶工况下人类驾驶员的安全驾驶行为,进而构建“类人”驾驶行为数据库;具体包括以下5个子步骤:子步骤1:利用毫米波雷达、视觉传感器、北斗传感器和惯性传感器搭建多维目标信息同步采集系统;子步骤2:在真实城市环境下,多名驾驶员依次驾驶搭载多维目标信息同步采集系统的营运车辆;子步骤3:对驾驶员的包括车道变换、车道保持、车辆跟驰、加减速的各种安全驾驶行为的相关数据进行分析,提取出各典型驾驶行为的多源异质描述数据,包括位置、速度、加速度、与周围交通参与者的相对距离和相对速度;子步骤4:搭建基于硬件在环仿真的驾驶模拟场景,涵盖直道、弯道、十字路口的多种路网结构以及营运车辆、乘用车、非机动车、行人的多类交通参与者,所构建的城市交通场景包括以下两类:(1)在车辆行驶过程中,车辆前方会出现横向接近的交通参与者,即突遇障碍物;(2)在车辆转向过程中,车辆的视觉盲区内存在其他交通参与者;驾驶员通过真实控制器驾驶仿真场景中的营运车辆,采集自车的位置、速度、加速度、与周围交通参与者的相对距离和相对速度等信息;子步骤5:基于真实城市环境和驾驶模拟仿真环境采集的数据,构建形成用于前向防撞驾驶决策学习的“类人”驾驶行为数据库,具体可表示为:式中,X表示涵盖状态、动作的二元组,即构建的驾驶行为数据库,(s
j
,a
j
)表示j时刻的“状态

动作”对,s
j
表示j时刻的状态,a
j
表示j时刻的动作,即人类驾驶员基于状态s
j
做出的动作,n表示数据库中“状态

动作”对的数量;步骤二:利用行为克隆算法学习“类人”驾驶行为数据库中的安全驾驶行为利用行为克隆算法学习“类人”驾驶行为数据库中的安全驾驶行为;首先,构建基于行为克隆的驾驶决策网络,该网络包含3个全连接层FC1、FC2和FC3,每层包含64个神经元;其次,基于步骤一构建的驾驶行为数据库对驾驶决策网络进行训练,其目标如下式所示:式中,π
θ
(s
i
)表示i时刻输出的确定性动作;将驾驶决策网络看作一个多类别分类器,用监督学习的方法训练这个分类器,目标是让策略网络做出的决策与人类专家相同;具体的训练过程如下:
子步骤1:对驾驶行为数据库中的动作a
j
进行一位有效编码,输出的向量表示为子步骤2:进行T个时间步长的循环,直到算法收敛;每一次循环包括子步骤2.1至子步骤2.2,具体地:子步骤2.1:从序号{1,2,...,n}中做均匀随机抽样;子步骤2.2:设当前策略网络的参数是θ
now
;将s
j
,作为输入,通过反向传播计算梯度,进而利用下式更新参数θ;式中,θ
new
表示更新后的参数θ,π(
·
|s
j
;θ
now
)表示随机策略网络,表示参数为θ的神经网络损失函数的梯度函数,H表示向量与随机策略网络π(
·
|s
j
;θ
now
)的交叉熵;步骤三:利用生成对抗模仿学习算法学习前向防撞驾驶策略基于步骤二训练得到的决策模型,利用生成对抗模仿学习继续前向防撞驾驶策略;首先,定义生成对抗模仿学习网络的基本参数:(1)定义状态空间利用时间序列数据和占据栅格图构建状态空间;具体描述如下:S
t
=[S1(t),S2(t),S3(t)]
ꢀꢀ
(4)式中,S
t
表示t时刻的状态空间,S1(t)表示t时刻与时间序列数据相关的状态空间,S2(t)表示t时刻与占据栅格图相对位置关系相关的状态空间,S3(t)表示t时刻与占据栅格图相对速度关系相关的状态空间;首先,利用连续位置、速度、加速度和航向角信息描述自车的运动状态:S1(t)=[p
x
,p
y
,v
x
,v
y
,a
x
,a
y

s
]
ꢀꢀ
(5)式中,p
x
,p
y
分别表示自车的横向位置和纵向位置,单位为米,v
x<...

【专利技术属性】
技术研发人员:李旭胡玮明胡锦超孔栋徐启敏
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1