当前位置: 首页 > 专利查询>东南大学专利>正文

城市低速环境下的大型营运车辆安全驾驶决策方法技术

技术编号:35427150 阅读:15 留言:0更新日期:2022-11-03 11:30
本发明专利技术公开了城市低速环境下的大型营运车辆安全驾驶决策方法,首先,采集城市交通环境下人类驾驶员的安全驾驶行为,构建形成安全驾驶行为数据集。其次,构建基于多头注意力的营运车辆安全驾驶决策模型。该模型包含深度双Q网络和生成对抗模仿学习两个子网络。其中,深度双Q网络通过无监督学习的方式,学习危险场景、冲突场景等边缘场景下的安全驾驶策略;生成对抗模仿学习子网络模仿人类驾驶员在不同驾驶条件和行驶工况下的安全驾驶行为。最后,训练安全驾驶决策模型,得到不同驾驶条件和行驶工况下的驾驶策略。本发明专利技术提出的方法,能够模拟人类驾驶员的安全驾驶行为,且考虑了视觉盲区、突遇障碍物等因素对行车安全的影响。突遇障碍物等因素对行车安全的影响。突遇障碍物等因素对行车安全的影响。

【技术实现步骤摘要】
城市低速环境下的大型营运车辆安全驾驶决策方法


[0001]本专利技术涉及一种营运车辆驾驶决策方法,尤其是涉及一种城市低速环境下的大型营运车辆安全驾驶决策方法,属于汽车安全


技术介绍

[0002]在城市交通环境下,因驾驶员视线盲区引发的道路交通事故占比最高,这些事故的肇事主体多为重型货车、大型客车、汽车列车等大型营运车辆。不同于乘用车辆,大型营运车辆具有体积大、车身长、轴距大、驾驶位置高等特点,其车身周围存在较多的静态和动态视觉盲区,如车头前方、右前轮附近和右后视镜下方等。当营运车辆转向特别是右转时,极易碰撞甚至碾压视野盲区内行人和非机动车,是产生恶性安全事故的主要区域。此外,相比于较为封闭的高速公路场景,在机非混行的城市交通环境下,交通参与者的类型和数量相对较多,营运车辆突遇障碍物的情况时有发生,具有更高的危险性。因此,在开放、多交通目标干扰的城市交通环境下,如何提高营运车辆的行车安全性,是目前亟需解决的关键问题,也是保障城市道路交通安全的重点。
[0003]目前,积极发展自动驾驶技术已成为国内外广泛认可的保障车辆运行安全的重要手段。作为实现高品质自动驾驶的关键一环,驾驶决策决定了营运车辆自动驾驶的合理性和安全性。如果能在交通事故发生前的1.5秒对驾驶员进行危险预警,并提供可靠、有效的安全驾驶策略,可以大幅度降低因视觉盲区、突遇障碍物等因素造成的交通事故发生频率。因此,研究大型营运车辆的安全驾驶决策方法,对于保障营运车辆的行车安全具有重要作用。
[0004]已有较多专利和文献对防碰撞驾驶决策进行了研究,但主要面向乘用车辆。相比于乘用车辆,营运车辆具有较大的视觉盲区,且具有更长的制动距离和制动时间。面向乘用车辆的防撞决策方法,无法直接应用于营运车辆。另一方面,已有部分专利对营运车辆的安全驾驶决策进行了研究,如一种高度类人的自动驾驶营运车辆安全驾驶决策方法(申请号:202210158758.2)、一种基于深度学习的大型营运车辆车道变换决策方法(公开号:CN113954837A)等,但这些决策方法均面向高速公路场景。
[0005]不同于交通参与者类型较少的高速公路场景,城市交通环境具有开放、多交通目标干扰、机非混行等特点。特别是车辆视觉盲区、突遇障碍物等因素的存在,对城市交通环境下的营运车辆安全驾驶提出了更高的挑战。因此,面向高速公路场景的营运车辆安全驾驶决策方法,无法直接应用于开放干扰的城市交通环境。
[0006]总体而言,针对开放、多交通目标干扰的城市交通环境,现有的方法难以满足营运车辆对于安全驾驶决策的要求,尚缺乏能够提供驾驶动作、行车路径等具体驾驶建议的安全驾驶决策方法,特别是缺乏考虑视觉盲区和突遇障碍物影响的大型营运车辆安全驾驶决策研究。

技术实现思路

[0007]专利技术目的:为了实现城市低速环境下的大型营运车辆安全驾驶决策,保障车辆行车安全,本专利技术针对重型货车、重型卡车等自动驾驶营运车辆,提出了一种城市低速环境下的大型营运车辆安全驾驶决策方法。该方法综合考虑了视觉盲区、突遇障碍物、不同行驶工况等因素对行车安全的影响,且能够模拟人类驾驶员的安全驾驶行为,为自动驾驶营运车辆提供更加合理、安全的驾驶策略,可以有效保障自动驾驶营运车辆的行车安全。同时,该方法无需考虑复杂的车辆动力学方程和车身参数,计算方法简单清晰,可以实时输出自动驾驶营运车辆的安全驾驶策略,且使用的传感器成本较低,便于大规模推广。
[0008]技术方案:为实现本专利技术的目的,本专利技术所采用的技术方案是:城市低速环境下的大型营运车辆安全驾驶决策方法。首先,采集城市交通环境下人类驾驶员的安全驾驶行为,构建形成安全驾驶行为数据集。其次,构建基于多头注意力的营运车辆安全驾驶决策模型。该模型包含深度双Q网络和生成对抗模仿学习两个子网络。其中,深度双Q网络通过无监督学习的方式,学习危险场景、冲突场景等边缘场景下的安全驾驶策略;生成对抗模仿学习子网络模仿不同驾驶条件和行驶工况下的安全驾驶行为。最后,训练安全驾驶决策模型,得到不同驾驶条件和行驶工况下的驾驶策略,实现对营运车辆安全驾驶行为的高级决策输出。具体包括以下步骤:
[0009]步骤一:采集城市交通环境下人类驾驶员的安全驾驶行为
[0010]为了实现与人类驾驶员相媲美的驾驶决策,本专利技术通过实际道路测试和驾驶模拟仿真的方式,采集不同驾驶条件和行驶工况下的安全驾驶行为,进而构建表征人类驾驶员安全驾驶行为的数据集。具体包括以下4个子步骤:
[0011]子步骤1:利用毫米波雷达、128线激光雷达、视觉传感器、北斗传感器和惯性传感器搭建多维目标信息同步采集系统。
[0012]子步骤2:在真实城市环境下,多名驾驶员依次驾驶搭载多维目标信息同步采集系统的营运车辆,对驾驶员的车道变换、车道保持、车辆跟驰、加减速等各种驾驶行为的相关数据进行采集和处理,获取各驾驶行为的多源异质描述数据,如雷达或视觉传感器测得多个不同方位的障碍物距离,北斗传感器及惯性传感器测得的位置、速度、加速度及横摆角速度等,以及车载传感器测得的方向盘转角等。
[0013]子步骤3:为了模仿危险场景、冲突场景等边缘场景下的安全驾驶行为,搭建基于硬件在环仿真的虚拟城市场景,所构建的城市交通场景包括以下三类:
[0014](1)在车辆行驶过程中,车辆前方会出现横向接近的交通参与者(即突遇障碍物);
[0015](2)在车辆转向过程中,车辆的视觉盲区内存在静止的交通参与者;
[0016](3)在车辆转向过程中,车辆的视觉盲区内存在运动的交通参与者。
[0017]在上述交通场景中,存在多种路网结构(直道、弯道和十字路口)和多类交通参与者(营运车辆、乘用车、非机动车和行人)。
[0018]多名驾驶员通过真实控制器(方向盘、油门和制动踏板)驾驶虚拟场景中的营运车辆,采集自车的横纵向位置、横纵向速度、横纵向加速度、与周围交通参与者的相对距离和相对速度等信息。
[0019]子步骤4:基于真实城市环境和驾驶模拟仿真环境采集的数据,构建形成用于安全驾驶决策学习的驾驶行为数据集,具体可表示为:
[0020][0021]式中,X表示涵盖状态、动作的二元组,即构建的表征人类驾驶员安全驾驶行为的数据集,(s
j
,a
j
)表示j时刻的“状态

动作”对,其中,s
j
表示j时刻的状态,a
j
表示j时刻的动作,即人类驾驶员基于状态s
j
做出的动作,n表示数据库中“状态

动作”对的数量。
[0022]步骤二:构建基于多头注意力的营运车辆安全驾驶决策模型
[0023]为了实现城市低速环境下的大型营运车辆安全驾驶决策,本专利技术综合考虑视觉盲区、突遇障碍物、行驶工况等因素对行车安全的影响,建立营运车辆安全驾驶决策模型。考虑到深度强化学习将深度学习的感知能力和强化学习的决策能力相结合,通过无监督学习的方式对交通环境进行探索,本专利技术利用深度强化学习对危本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.城市低速环境下的大型营运车辆安全驾驶决策方法,首先,采集城市交通环境下人类驾驶员的安全驾驶行为,构建形成安全驾驶行为数据集;其次,构建基于多头注意力的营运车辆安全驾驶决策模型;该模型包含深度双Q网络和生成对抗模仿学习两个子网络;其中,深度双Q网络通过无监督学习的方式,学习危险场景、冲突场景等边缘场景下的安全驾驶策略;生成对抗模仿学习子网络模仿人类驾驶员在不同驾驶条件和行驶工况下的安全驾驶行为;最后,训练安全驾驶决策模型,得到不同驾驶条件和行驶工况下的驾驶策略,实现对营运车辆安全驾驶行为的高级决策输出;其特征在于:步骤一:采集城市交通环境下人类驾驶员的安全驾驶行为通过实际道路测试和驾驶模拟仿真的方式,采集不同驾驶条件和行驶工况下的安全驾驶行为,进而构建表征人类驾驶员安全驾驶行为的数据集;具体包括以下4个子步骤:子步骤1:利用毫米波雷达、128线激光雷达、视觉传感器、北斗传感器和惯性传感器搭建多维目标信息同步采集系统;子步骤2:在真实城市环境下,多名驾驶员依次驾驶搭载多维目标信息同步采集系统的营运车辆,对驾驶员的车道变换、车道保持、车辆跟驰、加减速的各种驾驶行为的相关数据进行采集和处理,获取各驾驶行为的多源异质描述数据,包括雷达或视觉传感器测得多个不同方位的障碍物距离,北斗传感器及惯性传感器测得的位置、速度、加速度及横摆角速度,以及车载传感器测得的方向盘转角;子步骤3:为了模仿危险场景、冲突场景等边缘场景下的安全驾驶行为,搭建基于硬件在环仿真的虚拟城市场景;所构建的城市交通场景包括以下三类:(1)在车辆行驶过程中,车辆前方会出现横向接近的交通参与者,即突遇障碍物;(2)在车辆转向过程中,车辆的视觉盲区内存在静止的交通参与者;(3)在车辆转向过程中,车辆的视觉盲区内存在运动的交通参与者;在上述交通场景中,存在多种路网结构,包括直道、弯道和十字路口和多类交通参与者,包括营运车辆、乘用车、非机动车和行人;多名驾驶员通过具有方向盘、油门和制动踏板的真实控制器,驾驶虚拟场景中的营运车辆,采集自车的横纵向位置、横纵向速度、横纵向加速度、与周围交通参与者的相对距离和相对速度信息;子步骤4:基于真实城市环境和驾驶模拟仿真环境采集的数据,构建形成用于安全驾驶决策学习的驾驶行为数据集,具体表示为:式中,X表示涵盖状态、动作的二元组,即构建的表征人类驾驶员安全驾驶行为的数据集,(s
j
,a
j
)表示j时刻的“状态

动作”对,其中,s
j
表示j时刻的状态,a
j
表示j时刻的动作,即人类驾驶员基于状态s
j
做出的动作,n表示数据库中“状态

动作”对的数量;步骤二:构建基于多头注意力的营运车辆安全驾驶决策模型利用深度强化学习对危险场景、冲突场景的边缘场景下的安全驾驶策略进行学习;此外,考虑到模仿学习具有仿效榜样的能力,利用模仿学习模拟人类驾驶员在不同驾驶条件和行驶工况下的安全驾驶行为;因此,构建的安全驾驶决策模型由两部分组成,具体描述如下:
子步骤1:定义安全驾驶决策模型的基本参数首先,将城市低速环境下的安全驾驶决策问题转化为有限马尔科夫决策过程;其次,定义安全驾驶决策模型的基本参数;(1)定义状态空间为了描述自车和附近交通参与者的运动状态,利用时间序列数据和占据栅格图构建状态空间;具体描述如下:S
t
=[S1(t),S2(t),S3(t)]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)式中,S
t
表示t时刻的状态空间,S1(t)表示t时刻与时间序列数据相关的自车的状态空间,S2(t)表示t时刻与时间序列数据相关的周围交通参与者的状态空间,S3(t)表示t时刻与占据栅格图相关的状态空间;首先,利用连续位置、速度、加速度和航向角信息描述自车的运动状态:S1(t)=[p
x
,p
y
,v
x
,v
y
,a
x
,a
y

s
]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)式中,p
x
,p
y
分别表示自车的横向位置和纵向位置,单位为米,v
x
,v
y
分别表示自车的横向速度和纵向速度,单位为米每秒,a
x
,a
y
分别表示自车的横向加速度和纵向加速度,单位为米每二次方秒,θ
s
表示自车的航向角,单位为度;其次,利用自车与周围交通参与者的相对运动状态信息描述周围交通参与者的运动状态:式中,a
i
分别表示自车与第i个交通参与者的相对距离、相对速度和加速度,单位分别为米、米每秒和米每二次方秒;最后,将道路区域栅格化,划分成若干个p
×
q的网格区域,将道路区域及车辆目标抽象成栅格图,即用于描述相对位置关系的“存在”栅格图S3(t);其中,p表示网格区域的长度,q表示网格区域的宽度;“存在”栅格图包含四种属性,包括栅格坐标、是否存在车辆、对应车辆的类别、与左右车道线的距离;其中,不存在交通参与者的网格置为“0”,存在交通参与者的网格置为“1”,该网格与自车所在网格的位置分布,用于描述两车的相对间距;(2)定义动作空间利用横向和纵向驾驶动作定义动作空间:A
t
=[a
left
,a
straight
,a
right
,a
accel
,a
cons
,a
decel
]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)式中,A
t
表示t时刻的动作空间,a
left
,a
straight
,a
right
分别表示左转、直行和右转,a
accel
,a
cons
,a
decel
分别表示加速、匀速和减速;(3)定义奖励函数R
t
=r1+r2+r3ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)式中,R
t
表示t时刻的奖励函数,r1,r2,r3分别表示前向防撞奖励函数、后向防撞奖励函数和侧向防撞奖励函数,可通过式(7)、式(8)和式(9)获得;数和侧向防撞奖励函数,可通过式(7)、式(8)和式(9)获得;
式中,TTC表示自车与前方障碍物发生碰撞的时间,可通过自车与前方障碍物之间的距离除以相对速度获得,TTC
thr
表示距离碰撞时间阈值,RTTC表示后向碰撞时间,RTTC
thr
表示后向碰撞时间阈值,单位均为秒,x
lat
表示自车与两侧交通参与者的距离,x
min
表示最小侧向安全距离,单位均为米,β1,β2,β3分别表示前向防撞奖励函数、后向防撞奖励函数和侧向防撞奖励函数的权重系数...

【专利技术属性】
技术研发人员:李旭胡玮明胡悦胡锦超陆红伟徐启敏
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1