当前位置: 首页 > 专利查询>东南大学专利>正文

一种面向营运车辆的道路合流区路侧实时精准诱导方法技术

技术编号:34456327 阅读:39 留言:0更新日期:2022-08-06 17:03
本发明专利技术公开了一种面向营运车辆的道路合流区路侧实时精准诱导方法。现有的路侧诱导方法在诱导的实时性、诱导精准性方面无法适用于营运车辆。本发明专利技术的方法包含以下几个步骤:步骤一:训练环境中的输入数据预处理;步骤二:设计状态空间、动作空间、奖励函数;步骤三:基于深度确定性策略梯度算法,设计深度策略网络和动作网络并进行训练;步骤四:评估营运车辆诱导效果。本发明专利技术能够将转向、制动、加速等方面精准量化的安全性最优的驾驶建议发送给营运车辆,诱导营运车辆安全且高效地通过道路合流区。区。区。

【技术实现步骤摘要】
一种面向营运车辆的道路合流区路侧实时精准诱导方法


[0001]本专利技术涉及在道路合流区域,智能路侧设备诱导营运车辆安全高效驾驶,尤其涉及一种面向营运车辆的道路合流区路侧诱导方法,属于路侧设备智能化


技术介绍

[0002]相比乘用车辆,危险品运输罐车、物流运输车等营运车辆具有载重量大、质心位置高、驾驶员视野盲区大等特点,导致其制动距离较长、侧倾稳定性较差、碰撞风险更高。营运车辆运行途中一旦发生交通事故,易造成财产损失、环境污染、群死群伤等恶劣影响,且极易诱发大型、特大型安全事故。尤其在道路合流区域,处于驾驶员视野盲区内的匝道时常有车辆汇入,交通流运行波动较大,营运车辆紧急制动、紧急变道更加频繁。营运车辆发生碰撞、侧翻等交通事故的可能性更大、风险也更高。因此,在道路合流区域,针对营运车辆的特点,对其进行路侧安全诱导具有十分重要的意义。
[0003]目前路侧安全诱导方法有静态诱导法、准动态诱导法。静态诱导法有布设光学车道线、交通标志牌、交通信号灯、无线地磁等。虽然该类诱导方法能够给驾驶人员提前预知路段拥堵信息,帮助驾驶员重新规划行驶路线,诱导驾驶员避开拥堵路段,很好地缓解了道路拥堵,但是静态诱导方法多基于静态交通信息对车辆进行诱导,诱导实时性不强。准动态诱导法采用交通信息采集及大数据分析技术,基于分析结果将诱导信息发送至可变情报板或自适应交通信号灯。虽然准动态诱导法在静态诱导法的基础上结合了采集的准动态交通信息,具有一定的自适应性,但由于营运车辆驾驶员视野盲区大,并且处于盲区内的匝道时常有车辆汇入,导致营运车辆驾驶员常常面临突发的碰撞危险工况,此时紧急变道与紧急制动,进一步导致营运车辆发生侧翻。总体而言,针对营运车辆所具有的危险工况突发特点及其防碰撞、防侧翻的需求,静态诱导法和准动态诱导法无法适用于营运车辆,特别是在合流区这类营运车辆碰撞或侧翻事故多发的典型区域,目前尚缺乏面向营运车辆的路侧实时精准量化的诱导方法。

技术实现思路

[0004]专利技术目的:针对现有的路侧诱导方法在诱导的实时性、精准性方面无法适用于营运车辆的问题,面向道路合流区的营运车辆,专利技术一种基于深度强化学习的路侧实时精准诱导方法,该方法基于道路环境先验信息、智能路侧设备实时感知车辆目标的信息,实时决策出转向、制动、加速等方面精准的安全最优的驾驶建议,通过营运车辆前装或后装的车路通信设备,将转向、制动、加速等方面精准的安全性最优的驾驶建议发送给营运车辆,诱导营运车辆安全且高效地通过道路合流区。
[0005]技术方案:为实现本专利技术的目的,本专利技术所采用的技术方案是:
[0006]首先构建用于深度强化学习的仿真环境,并对输入数据进行预处理;其次是分析营运车辆在道路合流区安全性最优的驾驶建议决策需求,设计奖励函数、状态空间、动作空间;其次是基于深度确定性策略梯度算法,构建深度策略网络和深度动作网络,并对深度策
略网络和深度动作网络进行迭代训练,直至收敛;最后对诱导效果进行评估,将该算法部署在智能路侧设备中,对合流区营运车辆进行安全诱导,具体方法包括以下步骤:
[0007]步骤一、输入数据预处理
[0008]智能路侧设备实时感知车辆目标的位置、速度、类别信息,结合合流区道路线形、车道数、车道宽度、智能路侧设备传感器探测范围的先验信息,将合流区道路划分成若干个a
×
b的栅格,将道路合流区及车辆目标抽象成栅格图G,其中a表示栅格的长度,b表示栅格的宽度;每个栅格包含四种属性,分别为栅格坐标、对应车辆的类别、对应车辆的速度、与左右车道线的距离;
[0009]步骤二、设计状态空间、动作空间、奖励函数
[0010]子步骤(1)、利用步骤一中的栅格图信息,确定状态空间为步骤一中的栅格图G;
[0011]子步骤(2)、确定动作空间actions=[Δs,Δt,Δb],其中,Δs表示方向盘转角的变化量,Δt表示油门开度的变化量,Δb表示制动压力的变化量;
[0012]子步骤(3)、设计奖励函数包含四个子项,分别为:碰撞风险子奖励、侧倾角子奖励、侧向加速度子奖励、效率子奖励,其中
[0013]1)碰撞风险子奖励
[0014]利用智能路侧设备的全局视角优势,感知合流区域内营运车辆前后方车辆与营运车辆的距离、车辆的速度信息,计算营运车辆即将发生碰撞的时间T
r
(i)
[0015][0016]式中,T
r
(i)表示营运车辆由当前位置与前后方车辆即将发生碰撞所经历的时间,r表示营运车辆前后方车辆的集合,i表示车辆的编号,d
r
(i)表示车辆i与营运车辆的位移,v
r
(i)表示车辆i的速度,由于d
r
(i)和v
r
(i)具有动态性和不确定性,故T
r
(i)也具有动态性和不确定性,lane=ego表示前后方车辆在车道上保持直行,未发生换道行为;
[0017]根据公式(1)计算的当前时刻T
r
(i)的大小,代入公式(2)、公式(3)、公式(4)所构造的碰撞风险的条件概率分布函数;
[0018][0019][0020][0021]式中,p(T
r
(i)|D)、p(T
r
(i)|A)、p(T
r
(i)|S)均为碰撞风险评估指标T
r
(i)的条件概率,反映合流区碰撞风险关于T
r
(i)的先验知识,D、A、S分别表示碰撞风险为高(危险)、中(谨慎)、低(安全);k1,k2,k3均表示比例系数,σ表示T
r
(i)的标准差,表示营运车辆与前后方车辆发生碰撞的不确定性,表示第一个时间阈值,表示第二个时间阈值;
[0022]假设各车辆的碰撞风险服从均匀分布,建立基于概率的碰撞风险模型:
[0023][0024]式中,p(z(i)|T
r
(i))表示营运车辆前后方车辆所处的碰撞风险z的概率,p(T
r
(i)|z)表示营运车辆与前后方车辆即将发生碰撞的时间T
r
(i)的条件概率,p(T
r
(i)|Z(j))表示各碰撞风险等级下T
r
(i)的条件概率,Z(j)表示Z中的第j个元素,N
z
表示碰撞风险等级的数量,由于将碰撞风险等级分为高、中、低三个等级,即N
z
=3;
[0025]2)侧倾角子奖励
[0026][0027]式中,β为智能路侧设备通过车路通信的方式获得的营运车辆的侧倾角,β
T
为预设的侧倾角阈值,β
T
>0;
[0028]3)侧向加速度子奖励
[0029][0030]式中,a为智能路侧设备通过车路通信的方式获得的营运车辆的侧向加速度,a
T
为预设的侧向加速度阈值,a
T
>0;
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向营运车辆的道路合流区路侧实时精准诱导方法,其特征在于:首先构建用于深度强化学习的仿真环境,并对输入数据进行预处理;其次是分析营运车辆在道路合流区安全性最优的驾驶建议决策需求,设计奖励函数、状态空间、动作空间;其次是基于深度确定性策略梯度算法,构建深度策略网络和深度动作网络,并对深度策略网络和深度动作网络进行迭代训练,直至收敛;最后对诱导效果进行评估,将该算法部署在智能路侧设备中,对合流区营运车辆进行安全诱导,具体方法包括以下步骤:步骤一、输入数据预处理智能路侧设备实时感知车辆目标的位置、速度、类别信息,结合合流区道路线形、车道数、车道宽度、智能路侧设备传感器探测范围的先验信息,将合流区道路划分成若干个a
×
b的栅格,将道路合流区及车辆目标抽象成栅格图G,其中a表示栅格的长度,b表示栅格的宽度;每个栅格包含四种属性,分别为栅格坐标、对应车辆的类别、对应车辆的速度、与左右车道线的距离;步骤二、设计状态空间、动作空间、奖励函数子步骤(1)、利用步骤一中的栅格图信息,确定状态空间为步骤一中的栅格图G;子步骤(2)、确定动作空间actions=[Δs,Δt,Δb],其中,Δs表示方向盘转角的变化量,Δt表示油门开度的变化量,Δb表示制动压力的变化量;子步骤(3)、设计奖励函数包含四个子项,分别为:碰撞风险子奖励、侧倾角子奖励、侧向加速度子奖励、效率子奖励,其中1)碰撞风险子奖励利用智能路侧设备的全局视角优势,感知合流区域内营运车辆前后方车辆与营运车辆的距离、车辆的速度信息,计算营运车辆即将发生碰撞的时间T
r
(i)式中,T
r
(i)表示营运车辆由当前位置与前后方车辆即将发生碰撞所经历的时间,r表示营运车辆前后方车辆的集合,i表示车辆的编号,d
r
(i)表示车辆i与营运车辆的位移,v
r
(i)表示车辆i的速度,由于d
r
(i)和v
r
(i)具有动态性和不确定性,故T
r
(i)也具有动态性和不确定性,lane=ego表示前后方车辆在车道上保持直行,未发生换道行为;根据公式(1)计算的当前时刻T
r
(i)的大小,代入公式(2)、公式(3)、公式(4)所构造的碰撞风险的条件概率分布函数;
式中,p(T
r
(i)|D)、p(T
r
(i)|A)、p(T
r
(i)|S)均为碰撞风险评估指标T
r
(i)的条件概率,反映合流区碰撞风险关于T
r
(i)的先验知识,D、A、S分别表示碰撞风险为高(危险)、中(谨慎)、低(安全);k1,k2,k3均表示比例系数,σ表示T
r
(i)的标准差,表示营运车辆与前后方车辆发生碰撞的不确定性,表示第一个时间阈值,表示第二个时间阈值;假设各车辆的碰撞风险服从均匀分布,建立基于概率的碰撞风险模型:式中,p(z(i)|T
r
(i))表示营运车辆前后方车辆所处的碰撞风险z的概率,p(T
r
(i)|z)表示营运车辆与前后方车辆即将发生碰撞的时间T
r
(i)的条件概率,p(T
r
(i)|Z(j))表示各碰撞风险等级下T
r
(i)的条件概率,Z(j)表示Z中的第j个元素,N
z
表示碰撞风险等级的数量,由于将碰撞风险等级分为高、中、低三个等级,即N
z
=3;2)侧倾角子奖励式中,β为智能路侧设备通过车路通信的方式获得的营运车辆的侧倾角,β
T
为预设的侧倾角阈值,β
T
>0;3)侧向加速度子奖励式中,a为智能路侧设备通过车路通信的方式获得的营运车辆的侧向加速度,a
T
为预设的侧向加速度阈值,a
T
>0;4)效率子奖励以断面时间平均车速表征效率,即在单位时间内测得通过道路某个断面各车辆的点速度,这些点速度的算术平均值,即为该断面的时间平均车速,即:
式中,v
i
表示第i辆车的点速度(km/h)、n表示单位时间内观测到的车辆总数(辆);5)奖励函数r
t
=r1+r2+r3+r4(9)步骤三:构建、训练深度策略网络和深度动作网络采用基于深度确定性策略梯度算法,所述基于深度确定性策略梯度算法使用异策略的Actor

Critic框架完成强化学习过程,Actor

...

【专利技术属性】
技术研发人员:李旭胡锦超朱建潇徐启敏祝雪芬胡玮明孔栋胡悦
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1