【技术实现步骤摘要】
一种面向开放干扰场景的营运车辆前向防撞驾驶决策方法
[0001]本专利技术涉及一种营运车辆驾驶决策方法,尤其是涉及一种面向开放干扰场景的营运车辆前向防撞驾驶决策方法,属于汽车安全
技术介绍
[0002]营运车辆承担了公路物流运输、道路旅客运输等任务,是交通运输这一国民经济先行官的“主力军”。作为多式联运的关键一环,营运车辆是实现跨省运输、跨区运输的重要工具,其技术水平和安全状况是道路运输服务能力的重要表征。目前,营运车辆在安全运输方面仍存在诸多棘手难题,突出体现在事故易发和安全性低两个方面。
[0003]具体而言,由于营运车辆具有质心高、载重量大、运营时间长、视觉盲区广等特点,加之我国道路条件和交通状况复杂,致使交通事故频发。特别是在城市等开放干扰环境下,突遇障碍物的情况时有发生,若进行紧急变道或紧急制动等前向防撞操作,营运车辆极易因失稳而发生侧翻。此外,由于营运车辆的车头前方、右前轮附近和右后视镜下方附近均存在静态视觉盲区,当车辆向右转向时,车头极易与视觉盲区内的行人和非机动车发生碰撞。由此可见,营运车辆的车头前方是所有视觉盲区中最危险的区域之一,也是产生恶性安全事故的主要区域。因此,在开放、多交通目标干扰的城市交通环境下,如何避免因视觉盲区、突遇障碍物等因素造成的前向碰撞是保障营运车辆行车安全、提高运输效率的关键问题。
[0004]目前,积极发展自动驾驶技术已成为国内外广泛认可的保障车辆运行安全的重要手段。作为实现高品质自动驾驶的关键一环,驾驶决策决定了营运车辆自动驾驶的合理性和安全性。 ...
【技术保护点】
【技术特征摘要】
1.一种面向开放干扰场景的营运车辆前向防撞驾驶决策方法;首先,提取人类驾驶员的安全驾驶行为,构建形成用于前向防撞驾驶决策学习的“类人”驾驶行为数据库;其次,利用行为克隆算法从“类人”驾驶行为数据库中学习前向防撞驾驶策略;最后,利用生成对抗模仿学习算法继续学习驾驶策略,得到具有高度类人水平的前向防撞驾驶策略;其特征在于:步骤一:构建“类人”驾驶行为数据库通过实际道路测试和驾驶模拟仿真的方式,采集不同驾驶条件和行驶工况下人类驾驶员的安全驾驶行为,进而构建“类人”驾驶行为数据库;具体包括以下5个子步骤:子步骤1:利用毫米波雷达、视觉传感器、北斗传感器和惯性传感器搭建多维目标信息同步采集系统;子步骤2:在真实城市环境下,多名驾驶员依次驾驶搭载多维目标信息同步采集系统的营运车辆;子步骤3:对驾驶员的包括车道变换、车道保持、车辆跟驰、加减速的各种安全驾驶行为的相关数据进行分析,提取出各典型驾驶行为的多源异质描述数据,包括位置、速度、加速度、与周围交通参与者的相对距离和相对速度;子步骤4:搭建基于硬件在环仿真的驾驶模拟场景,涵盖直道、弯道、十字路口的多种路网结构以及营运车辆、乘用车、非机动车、行人的多类交通参与者,所构建的城市交通场景包括以下两类:(1)在车辆行驶过程中,车辆前方会出现横向接近的交通参与者,即突遇障碍物;(2)在车辆转向过程中,车辆的视觉盲区内存在其他交通参与者;驾驶员通过真实控制器驾驶仿真场景中的营运车辆,采集自车的位置、速度、加速度、与周围交通参与者的相对距离和相对速度等信息;子步骤5:基于真实城市环境和驾驶模拟仿真环境采集的数据,构建形成用于前向防撞驾驶决策学习的“类人”驾驶行为数据库,具体可表示为:式中,X表示涵盖状态、动作的二元组,即构建的驾驶行为数据库,(s
j
,a
j
)表示j时刻的“状态
‑
动作”对,s
j
表示j时刻的状态,a
j
表示j时刻的动作,即人类驾驶员基于状态s
j
做出的动作,n表示数据库中“状态
‑
动作”对的数量;步骤二:利用行为克隆算法学习“类人”驾驶行为数据库中的安全驾驶行为利用行为克隆算法学习“类人”驾驶行为数据库中的安全驾驶行为;首先,构建基于行为克隆的驾驶决策网络,该网络包含3个全连接层FC1、FC2和FC3,每层包含64个神经元;其次,基于步骤一构建的驾驶行为数据库对驾驶决策网络进行训练,其目标如下式所示:式中,π
θ
(s
i
)表示i时刻输出的确定性动作;将驾驶决策网络看作一个多类别分类器,用监督学习的方法训练这个分类器,目标是让策略网络做出的决策与人类专家相同;具体的训练过程如下:
子步骤1:对驾驶行为数据库中的动作a
j
进行一位有效编码,输出的向量表示为子步骤2:进行T个时间步长的循环,直到算法收敛;每一次循环包括子步骤2.1至子步骤2.2,具体地:子步骤2.1:从序号{1,2,...,n}中做均匀随机抽样;子步骤2.2:设当前策略网络的参数是θ
now
;将s
j
,作为输入,通过反向传播计算梯度,进而利用下式更新参数θ;式中,θ
new
表示更新后的参数θ,π(
·
|s
j
;θ
now
)表示随机策略网络,表示参数为θ的神经网络损失函数的梯度函数,H表示向量与随机策略网络π(
·
|s
j
;θ
now
)的交叉熵;步骤三:利用生成对抗模仿学习算法学习前向防撞驾驶策略基于步骤二训练得到的决策模型,利用生成对抗模仿学习继续前向防撞驾驶策略;首先,定义生成对抗模仿学习网络的基本参数:(1)定义状态空间利用时间序列数据和占据栅格图构建状态空间;具体描述如下:S
t
=[S1(t),S2(t),S3(t)]
ꢀꢀ
(4)式中,S
t
表示t时刻的状态空间,S1(t)表示t时刻与时间序列数据相关的状态空间,S2(t)表示t时刻与占据栅格图相对位置关系相关的状态空间,S3(t)表示t时刻与占据栅格图相对速度关系相关的状态空间;首先,利用连续位置、速度、加速度和航向角信息描述自车的运动状态:S1(t)=[p
x
,p
y
,v
x
,v
y
,a
x
,a
y
,θ
s
]
ꢀꢀ
(5)式中,p
x
,p
y
分别表示自车的横向位置和纵向位置,单位为米,v
x<...
【专利技术属性】
技术研发人员:李旭,胡玮明,胡锦超,孔栋,徐启敏,
申请(专利权)人:东南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。