当前位置: 首页 > 专利查询>东南大学专利>正文

一种面向二次事故预防动态车道与可变限速协同控制方法技术

技术编号:27063716 阅读:46 留言:0更新日期:2021-01-15 14:44
本发明专利技术提出了一种面向二次事故预防动态车道与可变限速协同控制方法。在事故发生后,交管中心基于摄像头获取的实时交通流数据评估事故影响与上游交通状态,控制不同断面处的可变信号标识发布动态车道与可变限速协同控制指令,引导上游来车提前于上游自由流段合理换道并适当减速以减少下游事故影响,从而降低下游事故引发的二次事故风险,保障交通安全并提高城市快速路通行能力。本发明专利技术基于深度强化学习算法,设置奖励函数时兼顾安全与效率两项指标,并针对动态车道与可变限速的不同效果设置修正因子以充分发挥两类控制策略的协同效果。模型采用演员‑评论家(Actor Critic,AC)框架优化。

【技术实现步骤摘要】
一种面向二次事故预防动态车道与可变限速协同控制方法
本专利技术属于道路交通安全设计、智能交通管理与控制
,尤其涉及一种面向二次事故预防的动态车道与可变限速协同控制方法。
技术介绍
快速道路属于少数能提供完全不间断高速交通流的公路设施类型,在区域交通运输体系中起骨架作用,而事故的发生会形成固定瓶颈,造成伤亡与财产损失,还会产生额外的排放和能源浪费。另外,事故的发生还可能引发二次事故,不仅进一步加剧已有事故的影响,还会极大危害应急人员的生命健康。因此对二次事故发生概率及严重程度的有效控制即是事故预防管理领域的重要任务。在事故影响下将会形成沿纵向的速度差与横向各车道间的速度差。前者会迫使上游来车剧烈减速,而后者也会产生强烈的换道需求从而形成时走时停波。两类现象叠加一方面降低通行能力,另一方面也增加了追尾等二次事故风险。动态车道控制与可变限速控制技术均以此出发,基于探测器获取的交通信息在事故发生后于上游交通条件较好处发布合理换道建议和速度建议以降低二次事故风险。前者旨在缓解事故形成的横向速度差,而后者则以平滑纵向速度差为目的。因为控制中心可获取全局交通状态,其发布的换道建议和速度建议具有较高的合理性。
技术实现思路
专利技术目的:本专利技术的目的是提出面向二次事故预防的动态车道与可变限速协同控制方法,通过动态车道与可变限速协同控制降低快速道路事故发生后因受迫换道、盲目换道及受迫减速等行为形成的追尾等二次事故风险。技术方案:为实现本专利技术的目的,本专利技术所采用的技术方案是:一种面向二次事故预防的动态车道与可变限速协同控制方法,该方法包括以下步骤:1)构建面向二次事故预防的动态车道与可变限速协同控制系统,包括交通指令发布设备、交通数据采集设备、协同控制模型(Actor)与评价模型(Critic),交通指令发布设备与交通数据采集设备沿快速道路布设,协同控制模型与评价模型均为神经网络模型,协同控制模型与评价模型共同组成控制-评价模型(Actor-Critic);2)选择可变信号板作为交通指令发布设备,布设于交通龙门架上,悬于道路横断面上方;一台龙门架即为一道控制断面,挂有多片可变信号板,一片可变信号板针对一车道同时发布动态车道与可变限速指令,其中动态车道指令包括“正常通行”、“建议向左换道”、“建议向右换道”三种;可变限速指令包括“保持默认限速”、“下调限速20km/h”两种,可变限速控制指令不区分车道,同一断面的所有车道具有相同的限速,控制断面间距设为500米;3)选择流量监测摄像头作为交通数据采集设备,间隔地布设于交通龙门架与单悬臂杆上,悬于道路横断面上方,一台龙门架或一支悬臂杆即为一道探测断面,挂有多台摄像头,一台摄像头针对一车道,监控上游50米长区间,每隔1秒采集监控区间内的车道占用率(%)、速度(m/s)、排队长度(m)等交通信息(车道占用率反映交通密度,当一车道被机动车完全占满时对应的占用率为100%)。多道探测断面共同采集的交通信息经过预处理后共同组成交通状态。探测断面间距设为250米。当探测断面与控制断面重合时,摄像头与可变信号板共用相同的龙门架;当探测断面位于两控制断面中间时,摄像头安装于单臂悬臂杆上;4)构造一神经网络作为控制-评价模型,包含协同控制模型与评价模型两部分,协同控制模型与评价模型共用相同的输入层和中间层,仅输出层不同,每隔一个控制周期T,神经网络以交通状态作为输入值,同时输出控制策略与控制策略的“价值”(Value),其中,控制策略为动态车道与可变限速协同控制,一方面引导上游来车提前于合理断面处减速,一方面引导上游来车提前于合理断面处换道至相邻开放车道;“价值”为一个实数,是对控制策略的长短期综合效益的量化,越大表示相应控制策略在相应交通状态下具有越大的效益,也就是越合适。进一步的,所述步骤3)中,交通状态由摄像头采集。记摄像头每隔1秒采集实时交通状态为矩阵下标t为相应的时刻,其中t=1指代事故开始的时刻,矩阵由各车道各摄像头采集所得占用率(%)、速度(m/s)、排队长度(m)共同组成,前两项交通变量为宏观交通流基本变量,描述宏观交通特征,最后一项变量更具体地刻画事故影响,在基础上计算修正交通状态St,递推式如下:注意到修正交通状态St不仅包括当前的交通状态也包括此前的所有交通状态从而反映了t时刻及之前的综合交通状态,α表示遗忘因子,以确保在决定St的所有交通状态中近期的交通状态对St具有更大的影响,α越接近1意味着近期信息影响越大,本专利技术设置其为0.3。与St具有相同的维度3×M×N,其中,3表示采集的3类交通变量,M为路段的车道数,N为路段中探测断面的数量。进一步的,所述步骤4)中控制-评价模型每隔一个控制周期T=25s,基于该时刻的修正交通状态St,t=kT,输出一次协同控制指令At,t=kT,和对控制指令的期望“价值”V(St),t=kT,AkT通过可变信号板发布,引导上游来车于适当断面减速并换道,持续整个控制周期。进一步的,所述步骤4)中,为量化控制-评价模型于kT时刻输出的动作AkT的实际效果,计算该控制周期结束后的(k+1)T时刻的奖励值R(k+1)T:式中,SkT,spd即为修正交通状态SkT中与速度有关的元素集合,路段速度均值MEAN(SkT,spd)与标准差S.D.(SkT,spd)共同定义实际奖励值其中速度均值越大说明运输效率越高,而速度变异性越低则意味着相对越安全;定义为修正奖励值,在的基础上加入针对限速控制的修正因子以约束限速控制策略的复杂性与不合理性,具体定义如下:在至少一个断面的限速控制被激活时,修正因子由两项乘积而成,第一项中Vlimit(m/s)为具体的限速大小,MEAN(SkT,spd)为路段速度均值,由此避免于交通条件相对较好的情况下激活限速控制,从而限制策略的不合理性,第二项中为期望的限速控制断面占总断面的比例,由此避免过多的控制断面被激活,从而限制策略的复杂性。(k+1)T时刻的奖励值R(k+1)T定义为相对于的增量,以引导模型尝试超越上一控制周期的效果。进一步的,所述步骤4)中,控制-评价模型的训练算法采用深度强化学习PPO算法,并引入演员-评论家(Actor-Critic)框架加速收敛。进一步的,所述步骤4)中,因为强化学习要求模型与环境多次交互,故模型训练过程在交通仿真平台上进行。在仿真平台上初始化事故仿真环境,包括路段长度、车道数、限速、流量、事故位置、事故开始时间、事故结束时间,并布设摄像头和可变信号板,形成探测断面和控制断面。开始事故仿真后基于修正交通状态SkT,控制-评价模型输出的控制指令AkT及“价值”V(SkT),并观察奖励值RkT,计算策略梯度与估值误差并更新控制-评价模型。在交通仿真平台重复进行事故仿真,直至误差收敛得到最优控制-评价模型。进一步的,所述步骤4)中,在得到最优控制-评价模型后,仅需其中的控制模型即可进行实际控制,即每隔一个控制周期基于修正交通状态SkT输出动态车道与可变限速协同本文档来自技高网...

【技术保护点】
1.一种面向二次事故预防动态车道与可变限速协同控制方法,其特征在于,该方法包括以下步骤:/n1)构建面向二次事故预防的动态车道与可变限速协同控制系统,包括交通指令发布设备、交通数据采集设备、协同控制模型与评价模型,交通指令发布设备与交通数据采集设备沿快速道路布设,协同控制模型与评价模型均为神经网络模型,协同控制模型与评价模型共同组成控制-评价模型;/n2)选择可变信号板作为交通指令发布设备,布设于交通龙门架上,悬于道路横断面上方;一台龙门架即为一道控制断面,挂有多片可变信号板,一片可变信号板针对一车道同时发布动态车道与可变限速指令,其中,动态车道指令包括“正常通行”、“建议向左换道”、“建议向右换道”三种;可变限速指令包括“保持默认限速”、“下调限速”两种,可变限速控制指令不区分车道,同一断面的所有车道具有相同的限速,控制断面间距设为L

【技术特征摘要】
1.一种面向二次事故预防动态车道与可变限速协同控制方法,其特征在于,该方法包括以下步骤:
1)构建面向二次事故预防的动态车道与可变限速协同控制系统,包括交通指令发布设备、交通数据采集设备、协同控制模型与评价模型,交通指令发布设备与交通数据采集设备沿快速道路布设,协同控制模型与评价模型均为神经网络模型,协同控制模型与评价模型共同组成控制-评价模型;
2)选择可变信号板作为交通指令发布设备,布设于交通龙门架上,悬于道路横断面上方;一台龙门架即为一道控制断面,挂有多片可变信号板,一片可变信号板针对一车道同时发布动态车道与可变限速指令,其中,动态车道指令包括“正常通行”、“建议向左换道”、“建议向右换道”三种;可变限速指令包括“保持默认限速”、“下调限速”两种,可变限速控制指令不区分车道,同一断面的所有车道具有相同的限速,控制断面间距设为L1米;
3)选择流量监测摄像头作为交通数据采集设备,间隔地布设于交通龙门架与单悬臂杆上,悬于道路横断面上方,一台龙门架或一支悬臂杆即为一道探测断面,挂有多台摄像头,一台摄像头针对一车道,监控上游L2米长区间,每隔t秒采集监控区间内的车道占用率(%)、速度(m/s)、排队长度(m)的交通信息,车道占用率反映交通密度,当一车道被机动车完全占满时对应的占用率为100%;多道探测断面共同采集的交通信息经过预处理后共同组成交通状态,探测断面间距设为L3米,当探测断面与控制断面重合时,摄像头与可变信号板共用相同的龙门架;当探测断面位于两控制断面中间时,摄像头安装于单臂悬臂杆上;
4)构造一神经网络作为控制-评价模型,包含协同控制模型与评价模型两部分,协同控制模型与评价模型共用相同的输入层和中间层,仅输出层不同,每隔一个控制周期T,神经网络以交通状态作为输入值,同时输出控制策略与控制策略的价值,其中,控制策略为动态车道与可变限速协同控制,一方面引导上游来车提前于合理断面处减速,一方面引导上游来车提前于合理断面处换道至相邻开放车道;价值为一个实数,是对控制策略的综合效益的量化。


2.根据权利要求1所述的一种面向二次事故预防动态车道与可变限速协同控制方法,其特征在于,所述步骤3)中,交通状态由摄像头采集,记摄像头每隔t秒采集实时交通状态为矩阵下标t为相应的时刻,其中,t=1指代事故开始的时刻,矩阵由各车道各摄像头采集所得占用率(%)、速度(m/s)、排队长度(m)共同组成,前两项交通变量为宏观交通流基本变量,描述宏观交通特征,最后一项变量地刻画事故影响,在基础上计算修正交通状态St,递推式如下:



其中,修正交通状态St不仅包括当前的交通状态也包括此前的所有交通状态从而反映了t时刻及之前的综合交通状态,α表示遗忘因子,以确保在决定St的所有交通状态中近期的交通状态对S...

【专利技术属性】
技术研发人员:徐铖铖彭畅刘攀季彦婕李志斌
申请(专利权)人:东南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1