【技术实现步骤摘要】
一种基于边缘计算的高速公路异质交通流可变限速控制方法
[0001]本专利技术属于智能交通控制
,具体涉及基于边缘计算的高速公路异质交通流可变限速控制。
技术介绍
[0002]随着人工智能技术的兴起,智能网联车辆(Connected and Autonomous Vehicle,CAV)应运而生,由人工车辆(Manual Vehicle,MV)和CAV组成的异质交通流将长期共存,由此引发了一系列高速公路交通拥堵问题。目前,采用可变限速控制技术来提高交通效率已成为智能交通领域研究的热点。通过在道路上游设置可变限速控制区域,统一控制异质交通流的速度,可以有效减少瓶颈处的交通拥堵。但现有的可变限速控制方法主要是将数据上传至云平台进行计算和存储,随着高速公路上CAV和基础设施的增加,大量的交通流信息加剧了数据中心的计算负荷和带宽消耗,这就减慢了可变限速控制的实时疏堵作用,使影响高速行驶安全的不确定因素大大增加。因此,需要一种基于边缘计算的高速公路异质交通流可变限速控制方法,有效缓解高速公路的瓶颈拥堵。
技术实现思路
/>[0003]本专本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于边缘计算的高速公路异质交通流可变限速控制方法,其特征在于,所述方法包括:步骤一、基于多目标优化,利用阈值法对平均延误和平均排队长度指标进行标准化处理,并设置为可变限速控制方法的奖励函数;步骤二、部署由RSU和可变限速控制代理集成边缘计算节点,提取高速公路异质交通流信息(辆数量和平均速度),作为EDQN算法的状态空间;步骤三、使用卷积神经网络(CNN)对异质交通流的状态空间进行特征降维;步骤四、将CNN网络输出的结果导入到全连接层,执行动作并输出当前时间步的Q值;步骤五、在Priorized replay Buffer存储样本,利用KL散度作为训练样本的优先级进行排序,从而最小化损失函数,有效提高可变限速控制效果;步骤六、判断贪婪算法是否收敛,若收敛,根据异质交通流状态选取最优速度控制策略并发布。2.根据权利要求1所述的一种基于边缘计算的高速公路异质交通流可变限速控制方法,其特征在于,步骤1:基于多目标优化的可变限速方法奖励函数在高速公路上游路段设置可变限速控制区域,在每个控制时段步长t,可变限速控制方法都会计算当前异质交通流状态的奖励r
t
∈R,并从状态S
t
∈S选择动作a
t
∈A,交通流接执行变换速度为a
t
并将状态更改为新状态S
t+1
,得到奖励r
t+1
。基于多目标优化,本发明将平均延误d和平均排队长度q
m
作为EDQN的奖励函数,可以有效地提高交通效率并减少合并区域的拥堵。考虑到奖励函数指标量纲不同的特性,本发明采用阈值法进行数值的规范化处理,阈值法是用指标实际值和阈值相比得到指标值的无量纲化方法。令指标d,q
m
的最大值分别为a
y
,b
y
,最小值为a
y
,b
y
,则标准化后的可变限速控制方法平均延误D和平均排队长度Q
m
指标分别为:奖励函数计算公式如下:步骤2:基于边缘计算的异质交通流状态提取本发明根据RSU的通信范围,在高速公路段上每隔一定的路段长度设置一个边缘计算节点。在边缘计算环境的每个控制周期中,当车辆进入观察区域时,借助于高可靠性和低延迟的V2V通信技术,RSU将自动与车辆建立无线通信连接,进行实时信息交互,获取车辆位置和速度信息,作为可变限速控制方法的状态空间。状态空间定义为由观察区内的车辆数量和平均速度组成的矩阵,高速公路的整个观察区均等分为边长Δy的小方格。网格i在时间t的交通状态可以表示为state
i
(k)=[N
i
(t),v
i
(t)],其中,其中,N
i
(t)代表时刻t网格i中的车辆数量。如果大多数车辆在网格中,则认为它们在网格中。v
j
(t)代表时间t处每辆车j的速度,v
i
(t)代表网格中车辆的平均速度。步骤3:卷积神经网络特征降维本发明使用卷积神经网络(CNN)进行异质交通流状态的特征降维。CNN分别由具有32个8*8、64个4*4和64个3*3卷积核的卷积层组成。不同的滤波器具有不同的权重,以提取不同
的特征作为输出到下一层。每层卷积层都具有滤波器和激活函数,使用Relu函数作为激活函数以激活神经网络单元。步骤4:执行动作输出Q值本发明使用Dueling DQN和Distributional DQN改进了原始DQN的神经网络结构,Dueling DQN使用具有两个流的完全连接层,分别输出当前价值流v
η
(f
ξ
(s
t
))和状态相关的动作优势流a
ψ
(f<...
【专利技术属性】
技术研发人员:于海洋,林源,任毅龙,
申请(专利权)人:吉林省高速公路管理局,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。