【技术实现步骤摘要】
一种融合多模型与数据驱动的瓶颈路段交通流控制方法
[0001]本专利技术属于智能交通
,特别是涉及到一种融合多模型与数据驱动的瓶颈路段交通流控制方法、
技术介绍
[0002]随着机动车保有量的不断增加,如何使有限的高速公路资源得到充分利用成为了亟需解决的难题。当前,主动交通管控技术的发展为提高高速公路的通行效率做出了重要贡献。可变限速控制作为主动交通管控技术的一种已经被广泛应用到高速公路上,当高速公路上交通流出现拥堵时,可变限速控制技术基于一定控制策略自动调整当前限速值,并通过可变情报板将限速信息实时发布给道路使用者,从而实现对高速公路交通流的主动干预,以达到改善交通流运行效率、缓解交通拥堵、提升行车安全等目的。
[0003]近年来有越来越多的针对高速公路瓶颈路段可变限速的研究,现有的大部分可变限速控制方法是通过在瓶颈上游路段处安装可变情报板对限速值进行调整,从而达到减少拥堵和通行能力的下降以及提高通行效率的目的。但是上游控制路段采取的行为对下游瓶颈路段所存在的时间迟滞效应使得可变限速控制效果降低,虽然PID控制能够一定程度上解决迟滞性,但传统的PID控制参数的确定依赖专家经验,控制效果具有主观随意性。因此如何针对波动性大的交通流状况做出精准快速且有效的限速调整从而得到一个适应性广、抗干扰性强的可变限速控制系统是值得关注的重点。
[0004]通行能力较小且波动性较大的下游路段是制约高速公路通行能力的一个重要因素,且上游路段的限速行为对下游瓶颈路段的作用的迟滞性也会进一步影响通行能力,严重的甚至会
【技术保护点】
【技术特征摘要】
1.一种融合多模型与数据驱动的瓶颈路段交通流控制方法,其特征在于,包括以下步骤:步骤一:对高速公路进行路段划分,在具有瓶颈路段的高速公路上布设雷视一体化检测设备实时测量高速公路各路段的交通数据,具体包括交通流占有率、车辆加速度、车辆平均速度和平均车头时距,将这些数据传输至PID控制器,计算高速公路多目标通行指标Y,并在高速公路瓶颈上游控制区域设置可变情报信息板;步骤二:基于改进粒子群算法,利用粒子对PID控制器中的积分参数K
I
和微分参数K
D
依次赋值,针对不同拥堵等级调整动态惯性权重从而更新粒子的速度和位置,并根据设置的满足高速公路可变限速系统快速响应特性和超调小需求的适应值函数来找到粒子群中适应度最佳的粒子所对应的K
I
和K
D
参数;步骤三:使用深度确定性策略梯度DDPG强化学习算法,根据步骤二所得优化后的PID参数K
I
和K
D
以及雷视一体化检测设备采集的高速公路各路段的交通流占有率和平均车头时距作为状态空间的输入;根据高速公路各路段车辆执行限速值的滞后时间以及天气条件参数设置动作空间以增加PID比例参数K
P
的探索度,通过与高速公路可变限速环境的交互以及奖励函数的引导使得智能体学习到在高速公路各种交通流状况下能够对PID参数K
P
进行调优的策略;步骤四:当发生交通拥堵时,将拥堵信息反馈至PID控制器,基于改进粒子群算法和强化学习融合调参后的PID控制参数K
P
、K
I
、K
D
组合成控制项并通过预期高速公路多目标通行指标与实际高速公路多目标通行指标的误差e
Y
(k)来计算路段限速值,通过可变情报信息板调整k时刻高速公路内各区段车速v(k)。2.根据权利要求1所述一种融合多模型与数据驱动的瓶颈路段交通流控制方法,其特征在于,步骤二所述不同拥堵等级的具体划分如下:当满足o
a
>30%且v
a
<80km/h时为一级拥堵;当满足o
a
>30%且v
a
<70km/h时为二级拥堵;其中,o
a
为高速公路各路段实时交通流占有率,v
a
为检测到的高速公路各路段实时速度。3.根据权利要求2所述一种融合多模型与数据驱动的瓶颈路段交通流控制方法,其特征在于,步骤二所述改进粒子群算法中动态惯性权重w
d
设置为;式中,T
now
是当前迭代次数,T
max
是最大迭...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。