单点交通信号控制方法技术

技术编号:39900124 阅读:6 留言:0更新日期:2023-12-30 13:14
本申请公开了一种单点交通信号控制方法,包括:根据获取的单点交叉口各个相位里的历史车道数据,确定下个信号周期中各个相位的预测相位状态信息;对所述各个相位的预测相位状态信息进行合并处理,得到预测交叉口状态信息;将预测交叉口状态信息输入预先训练好的强化学习模型,经过所述强化学习模型的处理后输出与所述预测交叉口状态信息对应的下个信号周期的周期时长;根据所述下个信号周期的周期时长,为所述下个信号周期的各个相位分配相位时长

【技术实现步骤摘要】
单点交通信号控制方法、装置、存储介质和电子设备


[0001]本申请涉及交通信号控制技术,特别涉及一种单点交通信号控制方法

装置

存储介质和电子设备


技术介绍

[0002]随着城市化的不断发展,城市中的交通流量越来越大,交通信号控制技术得到了广泛的应用

[0003]在交通信号控制中,单点交通信号控制主要是完成单点路口的信号配时

目前主要是通过解析式的算法或基于数据驱动的周期式单点信号配时算法确定单点路口的信号配时

但是这两种方式都有各自的问题

[0004]其中,解析式的算法的缺点是数学建模方法仅能针对非饱和的情况进行建模,在饱和情况下,由于交通的非线性

复杂时变性等问题造成模型困难,因此解析方法在这类情况下通常不可用

而基于数据驱动的周期式单点信号配时算法虽然能在仿真中经过多轮的训练得到较好的结果,但是会有难以泛化

落地困难等缺点,即在某一场景训练的结果很难对所有的场景都会有效,而且信控现场也很难支持在线的训练


技术实现思路

[0005]本申请提供一种单点交通信号控制方法

装置

存储介质和电子设备,能够适用于道路饱和情况,且方案泛化性好

[0006]为实现上述目的,本申请采用如下技术方案:
[0007]一种单点交通信号控制方法,包括:<br/>[0008]根据获取的单点交叉口各个相位里的历史车道数据,确定交通信号的下个信号周期中所述各个相位的预测相位状态信息;
[0009]对所述各个相位的预测相位状态信息进行合并处理,得到预测交叉口状态信息;其中,所述预测交叉口状态信息用于衡量交叉口包括各个相位在内的整体拥堵程度;
[0010]将所述预测交叉口状态信息输入预先训练好的强化学习模型,经过所述强化学习模型的处理后输出与所述预测交叉口状态信息对应的下个信号周期的周期时长;
[0011]根据所述下个信号周期的周期时长,为所述下个信号周期的各个相位分配相位时长

[0012]较佳地,所述根据所述下个信号周期的周期时长,为所述下个信号周期的各个相位分配相位时长,包括:
[0013]根据所述各个相位的预测相位状态信息,确定各个相位的时长比例;
[0014]将所述下个信号周期的周期时长,按照所述各个相位的时长比例,分配给各个相位,得到各个相位的相位时长

[0015]较佳地,所述各个相位的时长比例与对应相位的拥堵程度呈正相关

[0016]较佳地,所述预测交叉口状态信息作为所述强化学习模型的状态,选择所述下个
信号周期的周期时长作为所述强化学习模型的动作;
[0017]以所述下个信号周期的可选周期时长随所述预测交叉口状态信息的增大而变长,作为所述强化学习模型的训练约束

[0018]较佳地,在训练所述强化学习模型时,将所述下个信号周期的周期时长范围设定为
[C
base

d,C
base
+d],在所述周期时长范围内选择所述下个信号周期的周期时长;其中,所述
C
base
为与所述预测交叉口状态信息正相关的基准周期时长,
d
为预设的常量

[0019]较佳地,利用
Webster
单点算法根据设定的关键车道流率比之和计算得到
C
w
,将所述
C
w
作为所述
C
base

[0020]若所述关键车道流率比之和小于设定的高饱和阈值时,则所述下个信号周期的周期时长范围设定为
[C
w

d,C
w
+d];
[0021]若所述关键车道流率比之和大于或等于所述高饱和阈值,将所述下个信号周期的周期时长范围设定为
[C

w

C
max
];其中,所述
C

w
为所述关键车道流率比之和等于所述高饱和阈值时计算得到的基准周期时长,所述
C
max
为允许的最大周期时长

[0022]较佳地,所述强化学习模型的奖励为:绿灯启亮时刻排队长度

绿灯启亮时刻排队车辆数

红灯启亮时刻排队长度

红灯启亮时刻排队车辆数

车均延误

车均停车次数

设定时间内的流量中的至少一种的加权和;其中,计算所述加权和时各个权值大于或等于
0。
[0023]较佳地,所述对所述各个相位的预测相位状态信息进行合并处理包括:对所述各个相位的预测相位状态信息求加权和

[0024]较佳地,所述根据获取的历史车道数据,确定下个信号周期各个相位的预测相位状态信息,包括:
[0025]以信号周期为单位,根据指定历史信号周期中各个相位里的车道数据,确定各所述指定历史信号周期中对应相位的车道状态信息;
[0026]以信号周期为单位,根据各所述指定历史信号周期中各个相位里的车道状态信息,确定各所述指定历史信号周期中对应相位的实际相位状态信息;
[0027]根据所有所述指定历史周期中各个相位的实际相位状态信息,确定所述下个信号周期中对应相位的预测相位状态信息

[0028]较佳地,所述确定各所述指定历史信号周期中对应相位的实际相位状态信息,包括:
[0029]根据指定历史信号周期内对应相位的车道数据,确定各个车道对应相位的绿灯启亮时刻排队长度或排队车辆数,作为相应历史信号周期内对应相位的车道状态信息;
[0030]根据指定历史信号周期内每个相位包含的所有车道中的车道状态信息的最大值,确定相应相位的所述指定历史信号周期的实际相位状态信息

[0031]一种单点交通信号控制装置,包括:交叉口状态预测单元

模型处理单元和周期分配单元;
[0032]所述交叉口状态预测单元,用于根据获取的单点交叉口各个相位里的历史车道数据,确定交通信号的下个信号周期中所述各个相位的预测相位状态信息;还用于对所述各个相位的预测相位状态信息进行合并处理,得到预测交叉口状态信息;其中,所述预测交叉口状态信息用于衡量交叉口包括各个相位在内的整体拥堵程度;
[0033]所述模型处理单元,用于将所述预测交叉口状态信息输入预先训练好的强化学习
模型,经过所述强化学习模型的处理后输出与所述预测交叉口状态信息对应的下个信号周期的周期时长;
[0034]所述周期分配单元,用于根据所述下个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种单点交通信号控制方法,其特征在于,包括:根据获取的单点交叉口各个相位里的历史车道数据,确定交通信号的下个信号周期中所述各个相位的预测相位状态信息;对所述各个相位的预测相位状态信息进行合并处理,得到预测交叉口状态信息;其中,所述预测交叉口状态信息用于衡量交叉口包括各个相位在内的整体拥堵程度;将所述预测交叉口状态信息输入预先训练好的强化学习模型,经过所述强化学习模型的处理后输出与所述预测交叉口状态信息对应的下个信号周期的周期时长;根据所述下个信号周期的周期时长,为所述下个信号周期的各个相位分配相位时长
。2.
根据权利要求1所述的方法,其特征在于,所述根据所述下个信号周期的周期时长,为所述下个信号周期的各个相位分配相位时长,包括:根据所述各个相位的预测相位状态信息,确定各个相位的时长比例;将所述下个信号周期的周期时长,按照所述各个相位的时长比例,分配给各个相位,得到各个相位的相位时长
。3.
根据权利要求2所述的方法,其特征在于,所述各个相位的时长比例与对应相位的拥堵程度呈正相关
。4.
根据权利要求1所述的方法,其特征在于,所述预测交叉口状态信息作为所述强化学习模型的状态,选择所述下个信号周期的周期时长作为所述强化学习模型的动作;以所述下个信号周期的可选周期时长随所述预测交叉口状态信息的增大而变长,作为所述强化学习模型的训练约束
。5.
根据权利要求4所述的方法,其特征在于,在训练所述强化学习模型时,将所述下个信号周期的周期时长范围设定为
[C
base

d

C
base
+d]
,在所述周期时长范围内选择所述下个信号周期的周期时长;其中,所述
C
base
为与所述预测交叉口状态信息正相关的基准周期时长,
d
为预设的常量
。6.
根据权利要求5所述的方法,其特征在于,利用
Webster
单点算法根据设定的关键车道流率比之和计算得到
C
w
,将所述
C
w
作为所述
C
base
;若所述关键车道流率比之和小于设定的高饱和阈值时,则所述下个信号周期的周期时长范围设定为
[C
w

d

C
w
+d]
;若所述关键车道流率比之和大于或等于所述高饱和阈值,将所述下个信号周期的周期时长范围设定为
[C

w

C
max
]
;其中,所述
C

w
为所述关键车道流率比之和等于所述高饱和阈值时计算得到的基准周期时长,所述
C
max
为允许的最大周期时长<...

【专利技术属性】
技术研发人员:郭旭曹政燕丽敬
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1