多路口协同控制方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24581732 阅读:45 留言:0更新日期:2020-06-21 01:12
本公开实施例公开了一种面向网联自动驾驶的多路口协同控制方法、装置、电子设备及存储介质,方法包括:获取目标路口的当前时刻的状态信息,状态信息包括目标路口的实时交通信息、往目标路口行驶的目标车辆的车辆状态和目标路口的占用信息;根据状态信息确定目标车辆的最大通行速度;利用深度Q学习网络确定在状态信息下目标车辆通过目标路口的目标行驶顺序;根据最大通行速度规划多个目标车辆按照目标行驶顺序通过目标路口的目标速度;目标速度为目标车辆在不超过最大通行速度、且不与其他车辆发生碰撞的情况下通过目标路口的速度;将目标速度发送至目标车辆,以控制目标车辆按照目标速度行驶。

Method, device, electronic equipment and storage medium of multi intersection cooperative control

【技术实现步骤摘要】
多路口协同控制方法、装置、电子设备及存储介质
本公开涉及无线通信及自动驾驶
,具体涉及一种面向网联自动驾驶的多路口协同控制方法、装置、电子设备及存储介质。
技术介绍
交通路口路况复杂,是交通事故多发地区。据交通统计结果显示,发生在路口的交通事故占到了所有交通事故的40%左右。同时,每年城镇地区交通拥堵造成的时间浪费总计达到69亿小时。红绿灯的专利技术已有一百多年的历史了。在过去的一个世纪里,交通信号灯时路口交通流控制管理的最有效方案。近年来,也涌现出一大批种类繁多的红绿灯相位控制方法,但其道路安全和交通效率的性能仍然还不能令人满意。协同智能驾驶技术在提高路口控制性能方面显示出巨大的潜力。随着计算机技术、5G通信技术和传感器技术等多种技术的发展,加以国家政策的大力支持,未来,网联自动驾驶车辆的发展将成为大趋势。在未来的网联自动驾驶的场景下,现有的红绿灯路口控制方案存在极大的优化空间。通过安装的路侧设施(包括路侧摄像头、路侧雷达)及自动驾驶车辆,可以获得详细的实时交通信息和车辆状态。通过通信网络的配合,车与车、车与基站之间实现信息交互本文档来自技高网...

【技术保护点】
1.一种面向网联自动驾驶的多路口协同控制方法,其中,包括:/n获取目标路口的当前时刻的状态信息,所述状态信息包括所述目标路口的实时交通信息、往所述目标路口行驶的目标车辆的车辆状态和目标路口的占用信息;所述实时交通信息包括所述目标车辆的位置信息;所述车辆状态包括所述目标车辆的速度信息;所述目标路口的占用信息包括驶出所述目标路口的目标车辆的车辆轨迹与驶出相邻路口的其它车辆的车辆轨迹的相交情况;/n根据所述状态信息确定目标车辆的最大通行速度;/n利用深度Q学习网络确定在所述状态信息下所述目标车辆通过所述目标路口的目标行驶顺序;/n根据所述最大通行速度规划多个所述目标车辆按照所述目标行驶顺序通过所述目...

【技术特征摘要】
1.一种面向网联自动驾驶的多路口协同控制方法,其中,包括:
获取目标路口的当前时刻的状态信息,所述状态信息包括所述目标路口的实时交通信息、往所述目标路口行驶的目标车辆的车辆状态和目标路口的占用信息;所述实时交通信息包括所述目标车辆的位置信息;所述车辆状态包括所述目标车辆的速度信息;所述目标路口的占用信息包括驶出所述目标路口的目标车辆的车辆轨迹与驶出相邻路口的其它车辆的车辆轨迹的相交情况;
根据所述状态信息确定目标车辆的最大通行速度;
利用深度Q学习网络确定在所述状态信息下所述目标车辆通过所述目标路口的目标行驶顺序;
根据所述最大通行速度规划多个所述目标车辆按照所述目标行驶顺序通过所述目标路口的目标速度;所述目标速度为所述目标车辆在不超过所述最大通行速度、且不与其他车辆发生碰撞的情况下通过所述目标路口的速度;
将所述目标速度发送至所述目标车辆,以控制所述目标车辆按照所述目标速度行驶。


2.根据权利要求1所述的方法,其中,还包括:
将所述状态信息添加到所述深度Q学习网络的记忆库中,在所述记忆库长度存满的情况下,通过覆盖所述记忆库中最早一条记录的方式存储所述状态信息。


3.根据权利要求1或2所述的方法,其中,利用深度Q学习网络确定在所述状态信息下所述目标车辆通过所述目标路口的行驶顺序,包括:
利用所述深度Q学习网络预测多个所述目标车辆在不同的候选行驶顺序对应的Q值;
将所述Q值最大的所述候选行驶速度确定为所述目标行驶顺序。


4.根据权利要求1或2所述的方法,其中,所述深度Q学习网络采用卷积神经网络,还包括:
获取所述目标路口对应的一个或多个相邻路口在上一时刻的对应的目标Q值,以及利用所述深度Q学习网络得到所述目标行驶顺序得到的回报值;
根据所述目标Q值以及所述回报值对所述卷积神经网络的神经元参数进行更新。


5.根据权利要求4所述的方法,其中,通过如下Q值更新公式对所述神经元参数进行更新:



其中,θi为卷积神经网络的神经元参数,α(t)和γ为预设的衰减因子,θ′i为更新后的卷积神经网络的神经元参数,J为所有相邻路口的集合,ωi,j为相邻路口j的Q值对目标路口i的Q值的转换系数,Ω为惩罚函数。


6.根据权利要求1-2、5任一项所述的方法,其中,根据所述状态信息确定多个所述目标车辆的最大通行速度,包括:
在第一时间早于第二时间时,调整第一速度,使得所述第一时间晚于所述第二时间;所述第一时间所述第一时间为当前的所述目标车辆按照所述状态信息下的所述第...

【专利技术属性】
技术研发人员:王鲁晗张宇恒温向明路兆铭
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1