一种用于信号灯控制的通用模型系统及信号灯控制方法技术方案

技术编号：37258312 阅读：13 留言：0更新日期：2023-04-20 23:33

为减少模型训练的时间，使提高信号灯控制的大规模部署落地的可能性，本发明专利技术提供一种用于信号灯控制的通用模型系统，包括特征提取模块以及动作预测模块。其中特征提取模块用于将交叉路口的交通流信息转换为路口信息特征向量，其中交通流信息包括各个交通流信号下的平均交通流量、K秒内的车道最大占用率、平均占用率、运动方向、包含车道数量、运动的持续时间、持续时间是否是最小绿灯时间、以及当前信号是否为绿灯。动作预测模块用于根据路口信息特征向量预测交叉路口的当前信号灯状态的持续时间。采用“设置当前相位持续时间”作为动作，不仅保留了交通周期的概念，也保障了驾驶员，行人等交通参与者的安全。人等交通参与者的安全。人等交通参与者的安全。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于信号灯控制的通用模型系统及信号灯控制方法

[0001]本专利技术涉及交通控制
，特别涉及一种用于信号灯控制的通用模型系统及信号灯控制方法。

技术介绍

[0002]交通信号灯的合理控制可以有效地减少路网中的拥塞。然而传统的固定模式的信号灯控制已难以解决日趋复杂的路网状况。随着深度强化学习(DRL)在不同领域的成功，为了能够根据实时路网状况，及时调整信号灯状态，对交通信号灯进行控制，已开始有研究使用DRL方法来控制交通灯，采用这种方法可以显著的减少车辆的平均等待时间。其中，一部分研究使用了基于价值的方法，而一些其他的研究则使用了基于策略的方法。这些研究的动作设计各不相同，诸如包括“选择下一阶段相位”、“保持或切换下一相位”等。
[0003]虽然现有的基于强化学习的方法在信号灯控制领域取得了巨大的进步，但是它们仍需要对具有不同结构的新路口训练新的模型。具体而言，当面对不同结构的路口时，例如不同的形状的路口(十字路口、丁字路口)、不同的车道数和有不同的信号灯相位结构，模型均需要重新设计和从头开始训练。如这就使得需要为大规模城市路网中的每个信号灯进行训练并得到最优策略，进而需要消耗很多时间和计算资源。针对这一问题，目前已有研究工作对训练交通信号灯控制的通用模型进行了一些尝试。例如，陈等人采用了基于FRAP的参数共享方法以适应新的场景，这一方法在数千个红绿灯的规模上表现出了较好的性能。但是，这一方法仍采用“选择下一阶段相位”作为智能体的动作设计，当智能体选择一个动作后，信号相位可以从所有非冲突的组合中选择，...

【技术保护点】

【技术特征摘要】
1.一种用于信号灯控制的通用模型系统，其特征在于，包括：特征提取模块，其被配置为将交叉路口的交通流信息转换为路口信息特征向量，其中所述交通流信息包括各个交通流信号下的平均交通流量、K秒内的车道最大占用率、平均占用率、车道功能、包含车道数量、运动的持续时间、持续时间是否是最小绿灯时间、以及当前信号是否为绿灯；以及动作预测模块，其被配置为根据所述路口信息特征向量预测交叉路口的当前信号灯状态的持续时间。2.如权利要求1所述的通用模型系统，其特征在于，还包括状态价值预测模块，其被配置为根据所述路口信息特征向量预测每个状态至仿真结束总共获得的奖励，其中所述奖励包括负排队长度。3.如权利要求1所述的通用模型系统，其特征在于，所述交通流信号包括：北行、北行左转、东行、东行左转、西行、西行左转、南行、以及南行左转。4.如权利要求3所述的通用模型系统，其特征在于，若交叉路口的实际交通流信号少于八个，则将缺少的交通流信号对应的交通流信息记为0。5.如权利要求1所述的通用模型系统，其特征在于，所述特征提取模块包括多层结构：交通流信息提取层，其被配置为提取各个交通流的信息；以及路口信息提取层，其被配置为基于所述交通流的信息提取路口信息。6.如权利要求5所述的通用模型系统，其特征在于，所述交通流信息提取层及路口信息提取层均采用一维卷积层，以及所述特征提取模块还包括展平层以及至少一个全连接层。7.如权利要求1所述的通用模型系统...

【专利技术属性】
技术研发人员：阚宇衡，王茂南，潘文安，徐承成，林懿伦，
申请(专利权)人：上海人工智能创新中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人