【技术实现步骤摘要】
城市低速环境下的大型营运车辆安全驾驶决策方法
[0001]本专利技术涉及一种营运车辆驾驶决策方法,尤其是涉及一种城市低速环境下的大型营运车辆安全驾驶决策方法,属于汽车安全
技术介绍
[0002]在城市交通环境下,因驾驶员视线盲区引发的道路交通事故占比最高,这些事故的肇事主体多为重型货车、大型客车、汽车列车等大型营运车辆。不同于乘用车辆,大型营运车辆具有体积大、车身长、轴距大、驾驶位置高等特点,其车身周围存在较多的静态和动态视觉盲区,如车头前方、右前轮附近和右后视镜下方等。当营运车辆转向特别是右转时,极易碰撞甚至碾压视野盲区内行人和非机动车,是产生恶性安全事故的主要区域。此外,相比于较为封闭的高速公路场景,在机非混行的城市交通环境下,交通参与者的类型和数量相对较多,营运车辆突遇障碍物的情况时有发生,具有更高的危险性。因此,在开放、多交通目标干扰的城市交通环境下,如何提高营运车辆的行车安全性,是目前亟需解决的关键问题,也是保障城市道路交通安全的重点。
[0003]目前,积极发展自动驾驶技术已成为国内外广泛认可的保障车辆运行安全的重要手段。作为实现高品质自动驾驶的关键一环,驾驶决策决定了营运车辆自动驾驶的合理性和安全性。如果能在交通事故发生前的1.5秒对驾驶员进行危险预警,并提供可靠、有效的安全驾驶策略,可以大幅度降低因视觉盲区、突遇障碍物等因素造成的交通事故发生频率。因此,研究大型营运车辆的安全驾驶决策方法,对于保障营运车辆的行车安全具有重要作用。
[0004]已有较多专利和文献对防碰撞驾驶决策 ...
【技术保护点】
【技术特征摘要】
1.城市低速环境下的大型营运车辆安全驾驶决策方法,首先,采集城市交通环境下人类驾驶员的安全驾驶行为,构建形成安全驾驶行为数据集;其次,构建基于多头注意力的营运车辆安全驾驶决策模型;该模型包含深度双Q网络和生成对抗模仿学习两个子网络;其中,深度双Q网络通过无监督学习的方式,学习危险场景、冲突场景等边缘场景下的安全驾驶策略;生成对抗模仿学习子网络模仿人类驾驶员在不同驾驶条件和行驶工况下的安全驾驶行为;最后,训练安全驾驶决策模型,得到不同驾驶条件和行驶工况下的驾驶策略,实现对营运车辆安全驾驶行为的高级决策输出;其特征在于:步骤一:采集城市交通环境下人类驾驶员的安全驾驶行为通过实际道路测试和驾驶模拟仿真的方式,采集不同驾驶条件和行驶工况下的安全驾驶行为,进而构建表征人类驾驶员安全驾驶行为的数据集;具体包括以下4个子步骤:子步骤1:利用毫米波雷达、128线激光雷达、视觉传感器、北斗传感器和惯性传感器搭建多维目标信息同步采集系统;子步骤2:在真实城市环境下,多名驾驶员依次驾驶搭载多维目标信息同步采集系统的营运车辆,对驾驶员的车道变换、车道保持、车辆跟驰、加减速的各种驾驶行为的相关数据进行采集和处理,获取各驾驶行为的多源异质描述数据,包括雷达或视觉传感器测得多个不同方位的障碍物距离,北斗传感器及惯性传感器测得的位置、速度、加速度及横摆角速度,以及车载传感器测得的方向盘转角;子步骤3:为了模仿危险场景、冲突场景等边缘场景下的安全驾驶行为,搭建基于硬件在环仿真的虚拟城市场景;所构建的城市交通场景包括以下三类:(1)在车辆行驶过程中,车辆前方会出现横向接近的交通参与者,即突遇障碍物;(2)在车辆转向过程中,车辆的视觉盲区内存在静止的交通参与者;(3)在车辆转向过程中,车辆的视觉盲区内存在运动的交通参与者;在上述交通场景中,存在多种路网结构,包括直道、弯道和十字路口和多类交通参与者,包括营运车辆、乘用车、非机动车和行人;多名驾驶员通过具有方向盘、油门和制动踏板的真实控制器,驾驶虚拟场景中的营运车辆,采集自车的横纵向位置、横纵向速度、横纵向加速度、与周围交通参与者的相对距离和相对速度信息;子步骤4:基于真实城市环境和驾驶模拟仿真环境采集的数据,构建形成用于安全驾驶决策学习的驾驶行为数据集,具体表示为:式中,X表示涵盖状态、动作的二元组,即构建的表征人类驾驶员安全驾驶行为的数据集,(s
j
,a
j
)表示j时刻的“状态
‑
动作”对,其中,s
j
表示j时刻的状态,a
j
表示j时刻的动作,即人类驾驶员基于状态s
j
做出的动作,n表示数据库中“状态
‑
动作”对的数量;步骤二:构建基于多头注意力的营运车辆安全驾驶决策模型利用深度强化学习对危险场景、冲突场景的边缘场景下的安全驾驶策略进行学习;此外,考虑到模仿学习具有仿效榜样的能力,利用模仿学习模拟人类驾驶员在不同驾驶条件和行驶工况下的安全驾驶行为;因此,构建的安全驾驶决策模型由两部分组成,具体描述如下:
子步骤1:定义安全驾驶决策模型的基本参数首先,将城市低速环境下的安全驾驶决策问题转化为有限马尔科夫决策过程;其次,定义安全驾驶决策模型的基本参数;(1)定义状态空间为了描述自车和附近交通参与者的运动状态,利用时间序列数据和占据栅格图构建状态空间;具体描述如下:S
t
=[S1(t),S2(t),S3(t)]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)式中,S
t
表示t时刻的状态空间,S1(t)表示t时刻与时间序列数据相关的自车的状态空间,S2(t)表示t时刻与时间序列数据相关的周围交通参与者的状态空间,S3(t)表示t时刻与占据栅格图相关的状态空间;首先,利用连续位置、速度、加速度和航向角信息描述自车的运动状态:S1(t)=[p
x
,p
y
,v
x
,v
y
,a
x
,a
y
,θ
s
]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)式中,p
x
,p
y
分别表示自车的横向位置和纵向位置,单位为米,v
x
,v
y
分别表示自车的横向速度和纵向速度,单位为米每秒,a
x
,a
y
分别表示自车的横向加速度和纵向加速度,单位为米每二次方秒,θ
s
表示自车的航向角,单位为度;其次,利用自车与周围交通参与者的相对运动状态信息描述周围交通参与者的运动状态:式中,a
i
分别表示自车与第i个交通参与者的相对距离、相对速度和加速度,单位分别为米、米每秒和米每二次方秒;最后,将道路区域栅格化,划分成若干个p
×
q的网格区域,将道路区域及车辆目标抽象成栅格图,即用于描述相对位置关系的“存在”栅格图S3(t);其中,p表示网格区域的长度,q表示网格区域的宽度;“存在”栅格图包含四种属性,包括栅格坐标、是否存在车辆、对应车辆的类别、与左右车道线的距离;其中,不存在交通参与者的网格置为“0”,存在交通参与者的网格置为“1”,该网格与自车所在网格的位置分布,用于描述两车的相对间距;(2)定义动作空间利用横向和纵向驾驶动作定义动作空间:A
t
=[a
left
,a
straight
,a
right
,a
accel
,a
cons
,a
decel
]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)式中,A
t
表示t时刻的动作空间,a
left
,a
straight
,a
right
分别表示左转、直行和右转,a
accel
,a
cons
,a
decel
分别表示加速、匀速和减速;(3)定义奖励函数R
t
=r1+r2+r3ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)式中,R
t
表示t时刻的奖励函数,r1,r2,r3分别表示前向防撞奖励函数、后向防撞奖励函数和侧向防撞奖励函数,可通过式(7)、式(8)和式(9)获得;数和侧向防撞奖励函数,可通过式(7)、式(8)和式(9)获得;
式中,TTC表示自车与前方障碍物发生碰撞的时间,可通过自车与前方障碍物之间的距离除以相对速度获得,TTC
thr
表示距离碰撞时间阈值,RTTC表示后向碰撞时间,RTTC
thr
表示后向碰撞时间阈值,单位均为秒,x
lat
表示自车与两侧交通参与者的距离,x
min
表示最小侧向安全距离,单位均为米,β1,β2,β3分别表示前向防撞奖励函数、后向防撞奖励函数和侧向防撞奖励函数的权重系数...
【专利技术属性】
技术研发人员:李旭,胡玮明,胡悦,胡锦超,陆红伟,徐启敏,
申请(专利权)人:东南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。