当前位置: 首页 > 专利查询>东南大学专利>正文

一种融合多模型与数据驱动的瓶颈路段交通流控制方法技术

技术编号:34557703 阅读:13 留言:0更新日期:2022-08-17 12:44
本发明专利技术公开了一种融合多模型与数据驱动的瓶颈路段交通流控制方法,在高速公路常发孤立瓶颈路段架设检测设备用于采集实时交通流数据并在瓶颈上游设置信息板发布可变限速信息。设置适应值函数来挖掘控制效果最优的积分参数K

【技术实现步骤摘要】
一种融合多模型与数据驱动的瓶颈路段交通流控制方法


[0001]本专利技术属于智能交通
,特别是涉及到一种融合多模型与数据驱动的瓶颈路段交通流控制方法、

技术介绍

[0002]随着机动车保有量的不断增加,如何使有限的高速公路资源得到充分利用成为了亟需解决的难题。当前,主动交通管控技术的发展为提高高速公路的通行效率做出了重要贡献。可变限速控制作为主动交通管控技术的一种已经被广泛应用到高速公路上,当高速公路上交通流出现拥堵时,可变限速控制技术基于一定控制策略自动调整当前限速值,并通过可变情报板将限速信息实时发布给道路使用者,从而实现对高速公路交通流的主动干预,以达到改善交通流运行效率、缓解交通拥堵、提升行车安全等目的。
[0003]近年来有越来越多的针对高速公路瓶颈路段可变限速的研究,现有的大部分可变限速控制方法是通过在瓶颈上游路段处安装可变情报板对限速值进行调整,从而达到减少拥堵和通行能力的下降以及提高通行效率的目的。但是上游控制路段采取的行为对下游瓶颈路段所存在的时间迟滞效应使得可变限速控制效果降低,虽然PID控制能够一定程度上解决迟滞性,但传统的PID控制参数的确定依赖专家经验,控制效果具有主观随意性。因此如何针对波动性大的交通流状况做出精准快速且有效的限速调整从而得到一个适应性广、抗干扰性强的可变限速控制系统是值得关注的重点。
[0004]通行能力较小且波动性较大的下游路段是制约高速公路通行能力的一个重要因素,且上游路段的限速行为对下游瓶颈路段的作用的迟滞性也会进一步影响通行能力,严重的甚至会引发交通拥堵。虽然PID算法与可变限速的结合对解决高速公路瓶颈路段的拥堵有一定的帮助,但是由于PID算法的结构与参数比较固定,不能根据实时的交通流状况变化对限速值进行及时的调整,对高速公路瓶颈路段的拥堵排队响应慢

技术实现思路

[0005]为了解决上述
技术介绍
提到的技术问题,本专利技术提出一种融合多模型与数据驱动的瓶颈路段交通流控制方法,引入改进粒子群算法迅速寻找全局最优的PID参数K
I
、K
D
达到减少超调和快速收敛的目的,在此基础上,结合强化学习训练智能体学习到一套在高速公路各种交通流状况下能够根据输入与实际输出的偏差对PID参数K
P
进行快速精准调优的策略。
[0006]为了实现上述技术目的,本专利技术的技术方案为:
[0007]一种融合多模型与数据驱动的瓶颈路段交通流控制方法,包括以下步骤:
[0008]步骤一:对高速公路进行路段划分,在具有瓶颈路段的高速公路上布设雷视一体化检测设备实时测量高速公路各路段的交通数据,具体包括交通流占有率、车辆加速度、车辆平均速度和平均车头时距,将这些数据传输至PID控制器,计算高速公路多目标通行指标Y,并在高速公路瓶颈上游控制区域设置可变情报信息板;
[0009]步骤二:基于改进粒子群算法,利用粒子对PID控制器中的积分参数K
I
和微分参数K
D
依次赋值,针对不同拥堵等级调整动态惯性权重从而更新粒子的速度和位置,并根据设置的满足高速公路可变限速系统快速响应特性和超调小需求的适应值函数来找到粒子群中适应度最佳的粒子所对应的K
I
和K
D
参数;
[0010]步骤三:使用深度确定性策略梯度DDPG强化学习算法,根据步骤二所得优化后的PID参数K
I
和K
D
以及雷视一体化检测设备采集的高速公路各路段的交通流占有率和平均车头时距作为状态空间的输入;根据高速公路各路段车辆执行限速值的滞后时间以及天气条件参数设置动作空间以增加PID比例参数K
P
的探索度,通过与高速公路可变限速环境的交互以及奖励函数的引导使得智能体学习到在高速公路各种交通流状况下能够对PID参数K
P
进行调优的策略;
[0011]步骤四:当发生交通拥堵时,将拥堵信息反馈至PID控制器,基于改进粒子群算法和强化学习融合调参后的PID控制参数K
P
、K
I
、K
D
组合成控制项并通过预期高速公路多目标通行指标与实际高速公路多目标通行指标的误差e
Y
(k)来计算路段限速值,通过可变情报信息板调整k时刻高速公路内各区段车速v(k)。
[0012]优选地,步骤二所述不同拥堵等级的具体划分如下:
[0013]当满足o
a
>30%且v
a
<80km/h时为一级拥堵;当满足o
a
>30%且v
a
<70km/h时为二级拥堵;其中,o
a
为高速公路各路段实时交通流占有率,v
a
为检测到的高速公路各路段实时速度。
[0014]优选地,步骤二所述改进粒子群算法中动态惯性权重w
d
设置为;
[0015][0016]式中,T
now
是当前迭代次数,T
max
是最大迭代次数,w
start
是初始权重,w
end
是终止权重;当满足一级拥堵等级时,λ>1;当满足二级拥堵等级时,λ=1;在拥堵严重时,增加惯性权重扩大粒子的探寻范围以获取全局最优值。
[0017]优选地,所述步骤四中v(k)由如下公式确定:
[0018][0019][0020][0021]式中,Y是高速公路多目标通行指标;
[0022]为k时刻预期要达到的高速公路多目标通行指标,
[0023]Y
vsl
(k)为k时刻实际的高速公路多目标通行指标,ε是高速公路拥堵等级,t是高速公路控制周期,q是各路段交通流量,d是各路段交通流密度,o是各路段交通流占有率,l是各路段排队长度。
[0024]优选地,所述步骤三中利用强化学习对PID参数K
P
进行调参优化步骤如下:(1)对强化学习方法所涉及的状态空间进行设置,将高速公路路段划分成3个区域,分别为可变限速控制区域、过渡区域以及下游瓶颈路段区域;基于此,强化学习状态输入为s=[适应度最
佳粒子所对应的K
I
参数,适应度最佳粒子所对应的K
D
参数,o1=可变限速控制区域的交通流占有率,o2=过渡区域的交通流占有率,o3=下游瓶颈路段区域的交通流占有率,l1=可变限速控制区域的平均车头时距,l2=过渡区域的平均车头时距,l3=下游瓶颈路段区域的平均车头时距];
[0025](2)对强化学习方法所涉及的动作空间进行设置,设定优化约束如下:
[0026][0027]其中,T和V与路况、车况、天气条件有关,并且是随时间不断变化的,V表示控制区域内所有车辆速度的加权平均值,T表示控制区域内车辆执行路段限速值的滞后时间,T和V由如下公式确定:...

【技术保护点】

【技术特征摘要】
1.一种融合多模型与数据驱动的瓶颈路段交通流控制方法,其特征在于,包括以下步骤:步骤一:对高速公路进行路段划分,在具有瓶颈路段的高速公路上布设雷视一体化检测设备实时测量高速公路各路段的交通数据,具体包括交通流占有率、车辆加速度、车辆平均速度和平均车头时距,将这些数据传输至PID控制器,计算高速公路多目标通行指标Y,并在高速公路瓶颈上游控制区域设置可变情报信息板;步骤二:基于改进粒子群算法,利用粒子对PID控制器中的积分参数K
I
和微分参数K
D
依次赋值,针对不同拥堵等级调整动态惯性权重从而更新粒子的速度和位置,并根据设置的满足高速公路可变限速系统快速响应特性和超调小需求的适应值函数来找到粒子群中适应度最佳的粒子所对应的K
I
和K
D
参数;步骤三:使用深度确定性策略梯度DDPG强化学习算法,根据步骤二所得优化后的PID参数K
I
和K
D
以及雷视一体化检测设备采集的高速公路各路段的交通流占有率和平均车头时距作为状态空间的输入;根据高速公路各路段车辆执行限速值的滞后时间以及天气条件参数设置动作空间以增加PID比例参数K
P
的探索度,通过与高速公路可变限速环境的交互以及奖励函数的引导使得智能体学习到在高速公路各种交通流状况下能够对PID参数K
P
进行调优的策略;步骤四:当发生交通拥堵时,将拥堵信息反馈至PID控制器,基于改进粒子群算法和强化学习融合调参后的PID控制参数K
P
、K
I
、K
D
组合成控制项并通过预期高速公路多目标通行指标与实际高速公路多目标通行指标的误差e
Y
(k)来计算路段限速值,通过可变情报信息板调整k时刻高速公路内各区段车速v(k)。2.根据权利要求1所述一种融合多模型与数据驱动的瓶颈路段交通流控制方法,其特征在于,步骤二所述不同拥堵等级的具体划分如下:当满足o
a
>30%且v
a
<80km/h时为一级拥堵;当满足o
a
>30%且v
a
<70km/h时为二级拥堵;其中,o
a
为高速公路各路段实时交通流占有率,v
a
为检测到的高速公路各路段实时速度。3.根据权利要求2所述一种融合多模型与数据驱动的瓶颈路段交通流控制方法,其特征在于,步骤二所述改进粒子群算法中动态惯性权重w
d
设置为;式中,T
now
是当前迭代次数,T
max
是最大迭...

【专利技术属性】
技术研发人员:李志斌李戈阳黎萌秦思行
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1