交通信号调节方法、系统及介质技术方案

技术编号:24096764 阅读:93 留言:0更新日期:2020-05-09 10:45
本发明专利技术提供了一种交通信号调节方法,包括:初始化步骤:初始化设置基本要素;智能体状态函数构造步骤:构造智能体的状态计算;智能体行为函数构造步骤:构造智能体的行为计算;智能体奖励函数构造步骤:构造智能体的奖励计算;网络结构构造步骤:构造算法的网络结构;行为更新步骤:更新行为策略;预测结果计算步骤:得到交通信号的预测结果。本发明专利技术对多交叉路口情况进行研究,更为精准;利于缓解交通压力。

Traffic signal regulation method, system and medium

【技术实现步骤摘要】
交通信号调节方法、系统及介质
本专利技术涉及计算机软件和交通领域,具体地,涉及一种交通信号调节方法、系统及介质。尤其地,涉及一种基于强化学习和最大交通压力控制理论的交通信号调节方法。
技术介绍
道路交叉路口的信号灯协调控制是影响道路交通效率的重要因素之一,所以一个高效的道路交叉路口信号灯控制算法是至关重要的。近期,越来越多的研究者们开始研究用强化学习算法来实现交通信号灯的控制。已有相关研究成果表明,在交通信号控制方面,经过高级设计的强化学习方法的表现要优于传统方法。强化学习方法最大的优势是,它是直接通过之前行为策略在环境下的反馈来学习如何采取下一步行为。目前,对于应用强化学习算法来实现交通信号控制,存在的一个主要问题是,其算法过程往往是启发式的,并且缺乏合适的交通控制方面的理论依据。这往往导致其表现非常敏感,而且学习过程非常耗时。对于这个问题,本专利技术主要从强化学习中智能体的奖励和状态的构造上来实现其优化。首先,目前有多种方法可以实现智能体奖励的构造,其难点在于,通行时间是比较难直接优化的目标。通行时间是一个基于一序列本文档来自技高网...

【技术保护点】
1.一种交通信号调节方法,其特征在于,包括:/n初始化步骤:初始化设置基本要素;/n智能体状态函数构造步骤:构造智能体的状态计算;/n智能体行为函数构造步骤:构造智能体的行为计算;/n智能体奖励函数构造步骤:构造智能体的奖励计算;/n网络结构构造步骤:构造算法的网络结构;/n行为更新步骤:更新行为策略;/n预测结果计算步骤:得到交通信号的预测结果并运用到交通中。/n

【技术特征摘要】
1.一种交通信号调节方法,其特征在于,包括:
初始化步骤:初始化设置基本要素;
智能体状态函数构造步骤:构造智能体的状态计算;
智能体行为函数构造步骤:构造智能体的行为计算;
智能体奖励函数构造步骤:构造智能体的奖励计算;
网络结构构造步骤:构造算法的网络结构;
行为更新步骤:更新行为策略;
预测结果计算步骤:得到交通信号的预测结果并运用到交通中。


2.根据权利要求1所述的交通信号调节方法,其特征在于,所述初始化步骤包括:
对城市交叉路口进口、出口车道进行构造,包括:
进口车道,构造为车辆从交叉路口驶入的车道,表示为Lin;
出口车道,构造为车辆从交叉路口驶出的车道,表示为Lout;
对车辆运动行为进行构造,包括:构造为车辆驶入进口车道到驶出出口车道的过程,表示为(l,m),即从l进口到m出口;
对车辆运动信号和阶段进行构造,包括:
车辆运动信号是构造在车辆运动行为基础上的,绿灯表示相应的车辆运动行为被运行,红灯表示相应的车辆运动行为被禁止;
运动信号被表示为a(l,m),当a(l,m)=1时表示为绿灯,当a(l,m)=0时表示为红灯;
车辆运动阶段是车辆运动信号的组合,阶段表示为p={(l,m)|a(l,m)=1}其中,l∈Lin,m∈Lout;
对车辆运动压力和交叉路口压力进行构造,包括:
一条道路上的车辆密度公式如下:x(l)/xmax(l);
其中,x(l)是车道上的车辆数目,xmax(l)是车道上能容纳的最大车辆数目;
车辆运动压力表示为:
交叉路口压力表示为:Pi=|∑(l,m)∈iw(l,m)|。


3.根据权利要求1所述的交通信号调节方法,其特征在于,所述智能体状态函数构造步骤包括:
当前阶段p,每一条出口道路的车辆数目x(m)(m∈Lout),各个分段入口道路的车辆数目...

【专利技术属性】
技术研发人员:薛贵荣徐凯
申请(专利权)人:上海天壤智能科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1