基于深度增强网络的路网信号控制方法及装置制造方法及图纸

技术编号：17305546 阅读：65 留言：0更新日期：2018-02-19 00:38

本发明专利技术公开了一种基于深度增强网络的路网信号控制方法及装置，其中，方法包括：建立包含流量通道和智能体通道的深度神经网络模型；在流量通道输入路网流量状态信息；在智能体通道输入当前路口的信号灯相位设置信息，以及距离当前路口预设跳数范围内的相邻路口的信号灯相位设置信息；深度神经网络模型以预设频率输出当前路口信号的切换动作，并以路网运行车辆的平均延误作为回报，与交通仿真软件实时在线交互，以迭代方式逼近动作‑值函数，实现优化控制策略。该方法通过迭代方式逼近动作‑值函数，实现优化控制策略，以对路网信号全局优化控制，提高路网吞吐量，缩短用户出行的平均时间，节约控制成本，实现城市路网交通组织的智能化升级。

Road network signal control method and device based on depth enhancement network

全部详细技术资料下载

【技术实现步骤摘要】
基于深度增强网络的路网信号控制方法及装置
本专利技术涉及智能交通
，特别涉及一种基于深度增强网络的路网信号控制方法及装置。
技术介绍
城市化进程快速发展，人口激增，交通需求急剧膨胀，对城市交通系统和服务提出前所未有的挑战。城市交通拥堵问题日趋严峻。一旦发生拥堵将使道路通行能力下降、车速降低、通行延误增大、而且随着油耗的增加，还会进一步造成严重的空气污染。交通拥塞己成为困扰全球主要发达城市的焦点问题，能否采取措施对交通拥塞问题进行有效治理，密切关系着经济和社会的发展。在固有路网条件下，对信号的优化控制是缓解拥堵、提高交通效率、确保交通安全的有效手段。通过控制城市交通路口的交通信号状态,对交通信号重新配时并协调城市各个路口的交通信号,可以大幅度减少出行延误,节省能源,有效提高交通通行效率。随着物联网与计算机控制技术的发展，信号控制系统经历了由孤立的单一路口控制向主干线路口控制、区域控制正在向大规模网络控制的方向发展、控制方式的设计也从固定配时、自适应、集中控制演化为分散式协同、智能化控制。最初信号控制器针对的是单路口的固定配时，即将信号变换的时间间隔信息预先输入给控制器，但这种方式过于单一固化，不适用于各种大量随机因素汇集的动态路网，一种改进的方案是多时段信号控制，即根据早晚高峰交流变化的不同时段对信号控制器设置不同的相位、绿信比等参数。另外，还出现了感应式信号控制，该方式利用检测器数据结合一些算法对相位的信号时间进行预测，后来又发展出了自适应的信号控制方法改善了感应式控制在路口流量饱和状态下延误过大的问题，但这些方法割裂了路口间的时空关系，时常出现在一...
基于深度增强网络的路网信号控制方法及装置

【技术保护点】
一种基于深度增强网络的路网信号控制方法，其特征在于，包括以下步骤：建立包含流量通道和智能体通道的深度神经网络模型，其中，所述流量通道包括三模式张量模型，所述三模式张量模型中包含空间维度模式、时间维度模式和流量及速度维度模式；在所述流量通道输入路网流量状态信息；在所述智能体通道输入当前路口的信号灯相位设置信息，以及距离所述当前路口预设跳数范围内的相邻路口的信号灯相位设置信息；以及控制所述深度神经网络模型以预设频率输出所述当前路口的信号灯的相位设置，并以路网运行车辆的平均延误作为回报，通过与交通仿真软件实时在线交互，以迭代的方式逼近Q函数以实现优化控制策略，其中，所述Q函数为动作‑值函数。

【技术特征摘要】
1.一种基于深度增强网络的路网信号控制方法，其特征在于，包括以下步骤：建立包含流量通道和智能体通道的深度神经网络模型，其中，所述流量通道包括三模式张量模型，所述三模式张量模型中包含空间维度模式、时间维度模式和流量及速度维度模式；在所述流量通道输入路网流量状态信息；在所述智能体通道输入当前路口的信号灯相位设置信息，以及距离所述当前路口预设跳数范围内的相邻路口的信号灯相位设置信息；以及控制所述深度神经网络模型以预设频率输出所述当前路口的信号灯的相位设置，并以路网运行车辆的平均延误作为回报，通过与交通仿真软件实时在线交互，以迭代的方式逼近Q函数以实现优化控制策略，其中，所述Q函数为动作-值函数。2.根据权利要求1所述的基于深度增强网络的路网信号控制方法，其特征在于，所述以路网运行车辆的平均延误作为回报，通过与交通仿真软件实时在线交互，以迭代的方式逼近Q函数以实现优化控制策略，包括：利用交通仿真软件Flowsim对待控的路网区域进行建模；控制所述深度神经网络模型与所述Flowsim进行交互实现策略预学习，以根据学习结果将所述深度神经网络模型收敛；根据所述路段状态信息对路网中各路口的信号灯进行相位设置；读取路网中路段延误信息；根据所述路段延误信息优化所述控制策略。3.根据权利要求1所述的基于深度增强网络的路网信号控制方法，其特征在于，所述以迭代的方式逼近Q函数以实现优化控制策略包括：通过公式(1)获取所述深度神经网络模型的Q值函数预测值和目标Q值函数的误差值：其中，所述公式(1)包括：其中，s'和a'为下一个时刻的状态和动作，s和a为当前时刻的状态和动作，r为当前动作的回报，为目标Q值函数，Q(s,a,θ)为Q值函数预测值；根据公式(2)得到的样例值更新所述Q值函数，其中，所述公式(2)包括：4.根据权利要求3所述的基于深度增强网络的路网信号控制方法，其特征在于，还包括：通过公式(3)获取当前时刻t的当前动作的回报r：其中，ci为路口i的设计通行能力，li为流量大小，为路口排队长度额定值，di为路口实际排队长度，τ、β和η为常数。5.根据权利要求1所述的基于深度增强网络的路网信号控制方法，其特征在于，所述模型应用在智能体中，每个智能体由一个所述深度神经网络模型构成，其中，路网的每一个路口设置有所述智能体，包括：向所述智能体输入所述路网的交通流状态信息；输入路网中每个路口的信号灯相位设置信息；通过所述深度神经网络模型的前馈计算结果设置信息控制路网信号。6.一种基于深度增强网络的路网信号控制装置...

【专利技术属性】
技术研发人员：吴建平，许明，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人