一种基于元胞推演多步决策的交叉口自适应信号控制方法技术

技术编号:43873261 阅读:41 留言:0更新日期:2024-12-31 18:57
本发明专利技术公开了一种基于元胞推演多步决策的交叉口自适应信号控制方法,涉及交通信号灯控制技术领域,本发明专利技术基于元胞传输模型建立信号连续控制模型,模型利用元胞推演模拟交叉口交通流的运行和转化,实现交叉口的状态转移;同时将元胞推演获得的状态经特征提取后与道路当前相位方案、上一周期车道级车辆到达率及驶离率进行拼接作为模型的状态空间输入,以提高智能体决策的准确性;采用多步决策机制完成周期内所有相位的预决策后,将元胞环境下输出的离散动作序列整合为一个完整周期的信号配时方案并输送至信号灯进行连续控制;保留离散动作灵活多变优势的同时解决了基于离散状态的深度强化学习交叉口信号控制模型难以实现连续动作输出的问题。

【技术实现步骤摘要】

本专利技术涉及交通信号灯控制,特别涉及一种基于元胞推演多步决策的交叉口自适应信号控制方法


技术介绍

1、交通拥堵问题对经济、环境和社会效益造成了极大的负面影响,交叉口作为路网的关键节点,提高交叉口通行效率是解决交通拥堵问题的关键;其中,优化信号配时方案是提高交叉口通行效率最快、最有效且成本最低的方式;目前广泛应用的交通信号控制方法主要为固定信号配时与感应式信号控制;前者按照预先设定的周期循环控制交叉口信号,虽然实施成本较低,但面对复杂多变的动态交通流缺乏足够的适用性;后者通过预先埋设的线圈检测器检测交叉口车辆到达情况即时做出信号调整,虽然可以有效减少绿灯空放,但仅仅考虑了瞬时的交通状态,模型设置较为简单,无法保证复杂交通场景下的控制效益。

2、近年来,随着传感技术的发展,道路交通流的状态信息获取更加便捷;强化学习(reinforcement learning,rl)采用马尔可夫决策过程,可以通过与环境的不断交互寻找最优的策略,适用于面向序列决策的交通信号控制问题,在交通信号控制研究领域展现出了卓越的应用前景,但大多强化学习采用手工提取特征的方本文档来自技高网...

【技术保护点】

1.一种基于元胞推演多步决策的交叉口自适应信号控制方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于元胞推演多步决策的交叉口自适应信号控制方法,其特征在于,所述获得离散网格,包括:

3.根据权利要求1所述的一种基于元胞推演多步决策的交叉口自适应信号控制方法,其特征在于,所述对元胞环境进行初始化,包括:

4.根据权利要求1所述的一种基于元胞推演多步决策的交叉口自适应信号控制方法,其特征在于,所述将状态矩阵通过元胞传输模型CTM的输出层进行特征提取,包括:

5.根据权利要求1所述的一种基于元胞推演多步决策的交叉口自适应信号控制方...

【技术特征摘要】

1.一种基于元胞推演多步决策的交叉口自适应信号控制方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于元胞推演多步决策的交叉口自适应信号控制方法,其特征在于,所述获得离散网格,包括:

3.根据权利要求1所述的一种基于元胞推演多步决策的交叉口自适应信号控制方法,其特征在于,所述对元胞环境进行初始化,包括:

4.根据权利要求1所述的一种基于元胞推演多步决策的交叉口自适应信号控制方法,其特征在于,所述将状态矩阵通过元胞传输模型ctm的输出...

【专利技术属性】
技术研发人员:赵红星王钰捷聂江龙梁瑞艳何瑞春
申请(专利权)人:兰州交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1