一种具有位置感知的路口交通信号灯调控方法技术

技术编号：27658888 阅读：73 留言：0更新日期：2021-03-12 14:24

本发明专利技术公开了一种具有位置感知的路口交通信号灯调控方法，步骤1、利用强化学习网络模型进行交通信号控制问题的数学建模，包括将交通网络建模为图的形式以及根据交通信号控制问题定义了状态空间、动作空间、奖励；步骤2、进行智能体原始观测值o

全部详细技术资料下载

【技术实现步骤摘要】
一种具有位置感知的路口交通信号灯调控方法
本专利技术涉及垃圾分类
，特别是涉及一种智能垃圾分类系统及方法。
技术介绍
传统的交通信号灯控制是根据收集到的历史交通数据事先制定控制方案，比如：SCATS交通信号控制系统根据交通检测器的检测数据计算十字路口的类饱和度与流量两个指标，为十字路口从事先制定的方案中选择合适的信号灯控制方案。SMOOTH交通信号控制系统根据采集到的交通数据，采取“短期预测”的策略得到十字路口当前所处的状态，然后根据状态选择对应的策略方案。SCATS和SMOOTH交通信号控制系统事先都要考虑十字路口的多种交通状况，并提出应对策略，这样的解决方案需要人工干预，无法很好地适应动态的交通流量。随着科技的不断进步，交通系统的研究更加趋向于智能化。人们将人工智能和交通系统结合，其中研究者们开始探索深度强化学习方法在交通信号控制系统中的应用。现有技术中，为每个路口设置一个深度强化学习模型，每个模型根据各自观察到的状态进行决策学习，从而实现多个路口的交通信号灯调控。该方法中，每个路口都有一个独立的模型，无法用在大规模的交通网络中，并且独立学习的模型忽略了相邻路口之间相互影响的事实，无法实现对路口之间的协调控制。考虑到每个路口的决策还受其他路口的影响，对于每个路口，将相邻路口的交通状况与自身拼接，作为该路口的交通状况信息。并且所有路口共享网络模型的参数。但是，在大多数情况下，拼接路口信息可能不是融合来自相邻路口的信息的合理方法，其很难确定相邻路口的拼接顺序。此外，还有采用长短期记忆网络(LSTM，Lo...

【技术保护点】
1.一种具有位置感知的路口交通信号灯调控方法，其特征在于，该方法包括以下具体实现过程：/n步骤1、利用强化学习网络模型进行交通信号控制问题的数学建模：/n将交通网络建模为图的形式并记为G：G＝(V,E)，V为路口的集合，E为连接两路口的边的集合；将每个路口看为一个智能体，共有N个路口；/n根据交通信号控制问题定义了状态空间、动作空间、奖励如下：/n状态空间记为S：s

【技术特征摘要】
1.一种具有位置感知的路口交通信号灯调控方法，其特征在于，该方法包括以下具体实现过程：
步骤1、利用强化学习网络模型进行交通信号控制问题的数学建模：
将交通网络建模为图的形式并记为G：G＝(V,E)，V为路口的集合，E为连接两路口的边的集合；将每个路口看为一个智能体，共有N个路口；
根据交通信号控制问题定义了状态空间、动作空间、奖励如下：
状态空间记为S：st∈S为t时刻的系统状态，由交通信号网络中所有路口的交通状况信息组成；
观测空间记为O：为智能体i在t时刻的观测值；由两部分组成：(1)路口当前时刻所处的相位；(2)与路口相连的进入车道上车辆的数量；
动作空间记为A：为所有智能体在t时刻的联合动作ai,t的集合；
奖励记为R：每个时刻rit为每个智能体在t时刻的奖励；具体为智能体i所表示路口的进入车道中车辆总数的负值，即为t时刻在进入车道l中的车辆数量；
步骤2、进行智能体原始观测值oi的预处理：
在t时刻，每个智能体的原始局部观测值为每个车道上的车辆数量和交通信号当前所处的相位的拼接向量，通过多层感知机将智能体i的k维原始观测值映射到m维的隐空间中，输出的隐状态hi,t∈Rm表示第i个路口在t时刻的交通状况，m为维度，公式如下：

其中，k为的特征信息维度，Wo∈Rk×m、bo∈Rm分别为多层感知机隐藏层中的权重矩阵和偏置，σ为ReLU激活函数；
步骤3、获取智能体之间具有位置感知的边特征：
选择目标路口i的k维以内的全部路口作为邻居节点集N(i)，然后计算目标路口i与相邻路口j∈N(i)的欧式距离d(i,j)；基于坐标计算路口i和j之间的欧式距离d(i,j)计算公式如下：
d(i,j)＝f距离(i,j；Gw)
将d(i,j)映射到在[0，1]范围内的数值pi,j来表示路口之间的相对位置关系，公式如下：

最终得到边特征ei,j＝(pi,j,-si,j)表示相邻路口j与目标路口i的相对位置和结构信息；
步骤4、实现智能体之间的Pos-Light消息传递模型，进行交通信息的融合，分为以下两个阶段：
1)边的特征信息与相邻...

【专利技术属性】
技术研发人员：郭健，李克秋，郝建业，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人