一种基于近端策略优化的小型路网交通信号优化方法技术

技术编号：27033772 阅读：64 留言：0更新日期：2021-01-12 11:17

一种基于近端策略优化的小型路网交通信号控制方法，包括如下步骤：1)通过与SUMO的交互，实时获取路网中车辆的位置信息和信号灯的相位信息；2)数据预处理，获取整个路网在当前时刻的排队长度‑相位编号数据集；3)根据上一步整理的数据集，训练PPO网络直到达到最大迭代次数；4)损失函数达到精度要求后，即可得到该路网下基于近端策略优化的交通信号优化配时方案。与现有技术相比，本发明专利技术通过近端策略优化的方法，提高了小型路网的交通运行效率，更好地缓解了城市中小型连通区域的交通拥堵问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于近端策略优化的小型路网交通信号优化方法
本专利技术涉及智能交通、人工智能应用领域，具体涉及近端策略优化(ProximalPolicyOptimization)算法和小型路网交通信号优化方法。
技术介绍
随着大众生活水平的普遍提高，汽车已成为人们出行最常用的交通工具，但由于道路资源的有限，交通管理协调机制的不科学以及交通决策存在的失误性等因素，城市路网，特别是交叉口处会造成严重的交通拥堵问题。对于某一个具体的交叉口，宽敞的道路和智能交通设备的存在使得该路口不会产生严重的拥堵；而对于多个交叉口连接而成的小型路网，拥堵问题仍然存在，并且是影响区域通行效率的最大因素。
技术实现思路
为了优化小型路网的交通信号配时方案，改善区域路网的交通拥堵现象，基于实时获取的交通数据，本专利技术提出一种基于近端策略优化的小型路网交通信号控制方法，对于小型路网提出的基于近端策略优化的交通信号优化配时方案可以有效提高交通通行效率，而且可以增加区域内不同交叉口之间的协作，应对交通的动态性变化。本专利技术解决其技术问题所采用的技术方案是：一种基于近端策略优化的小型路网交通信号控制方法，包括以下步骤：1)利用路网交叉口处的交通数据信号传感器，实时获取小型路网中(井字型四交叉口)的交通数据，为车辆的相对坐标信息和信号灯在对应时刻所处的相位信息，确定处于排队状态的车辆，保存在原始数据集中；2)原始数据预处理，删去离谱的数据并用前一时刻的数据填补缺失的数据，获取具体交叉口处的排队长度-相位编号集合{Qi,...

【技术保护点】
1.一种基于近端策略优化的小型路网交通信号控制方法，其特征在于，所述方法包括以下步骤：/n1)利用路网交叉口处的交通数据信号传感器，实时获取小型路网中的交通数据，为车辆的相对坐标信息和信号灯在对应时刻所处的相位信息，确定处于排队状态的车辆，保存在原始数据集中；/n2)原始数据预处理，删去离谱的数据并用前一时刻的数据填补缺失的数据，获取具体交叉口处的排队长度-相位编号集合{Q

【技术特征摘要】
1.一种基于近端策略优化的小型路网交通信号控制方法，其特征在于，所述方法包括以下步骤：
1)利用路网交叉口处的交通数据信号传感器，实时获取小型路网中的交通数据，为车辆的相对坐标信息和信号灯在对应时刻所处的相位信息，确定处于排队状态的车辆，保存在原始数据集中；
2)原始数据预处理，删去离谱的数据并用前一时刻的数据填补缺失的数据，获取具体交叉口处的排队长度-相位编号集合{Qi,j,Pi}，其中，Qi,j表示当前时刻第i交叉口第j车道处的车辆排队长度，Pi代表当前时刻第i交叉口处的信号灯灯态，在该发明中，i＝1,2,3,4，j＝1,2,...,7,8；按照路网中交叉口的排列顺序，将集合{Qi,j,Pi}整合得到整个路网在当前时刻的排队长度-相位编号数据集St，t为当前的时刻；
3)利用路网的排队长度-相位编号集St，初始化神经网络权重，利用近端策略优化方法PPO更新网络参数，寻找当前交通环境下的最优信号灯配时方案；
4)保存最终收敛的神经网络训练参数，得到该路网下基于近端策略优化的交通信号优化配时方案，在不同交通状态st下，该路网需切换至的交通相位由以下状态-动作对所决定：
Pnext＝argmax(Q(snow,anow,θ))
其中Pnext表示路网需切换至的相位，snow为当前路网交通状态，anow为当前路网可执行的相位，θ表示神经网络的参数，Q(snow,anow,θ)表示由当前路网状态，当前路网可执行相位，神经网络参数决定的Q值函数，argmax(Q(snow,a...

【专利技术属性】
技术研发人员：徐云，应丹红，王喆冰，袁传军，柴子辉，冯远静，李永强，
申请(专利权)人：航天科工广信智能技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人