基于深度强化学习的车辆匝道入口合流控制方法技术

技术编号：37802337 阅读：24 留言：0更新日期：2023-06-09 09:32

一种基于深度强化学习的车辆匝道入口合流控制方法，其特征在于利用SUMO构建匝道合流仿真环境并获取相关状态信息，设计状态空间、动作空间以及奖励函数，基于近端策略优化算法构建Actor网络和Critic网络，并对网络进行迭代训练，直至收敛，最后通过TraCI接口与SUMO交互，完成匝道入口合流行为；加入了效率、舒适度等其他奖励标准，可以有效提升瓶颈路段的通行效率；采用actor

全部详细技术资料下载

【技术实现步骤摘要】
基于深度强化学习的车辆匝道入口合流控制方法

[0001]本专利技术涉及一种车辆匝道入口合流控制方法，尤其涉及一种基于深度强化学习的车辆匝道入口合流控制方法。属于深度学习
，也属于车辆人工智能控制

技术介绍

[0002]匝道合流是造成城市高架道路和高速公路交通拥堵的主要原因之一。对于车辆来说，在匝道合流入口必须综合考虑周围环境各类因素，等待合适的合流机会，同时根据对安全间距和主干道车辆速度的判断以确定加速的程度和时间。驾驶员操作不慎就极易引发交通事故，从而产生严峻的交通拥堵，降低交通效率，增加碰撞风险，增加出行时间，给乘客带来不适。即使车辆顺利完成匝道入口合流，在实际过程也不一定是全局最优的，安全性、效率和舒适性难以兼顾和保证。因此，车辆匝道入口合流控制方法具有较强的实际意义和研究价值。
[0003]随着人工智能的不断发展，智慧交通受到了国内外学者广泛关注。发展智慧交通是构建“安全可靠、便捷高效、绿色智能、开放共享”的现代化综合交通系统的重要手段，是主动顺应新兴信息技术和互联网发展的新趋势。现有的基于机...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习的车辆匝道入口合流控制方法，其特征在于：利用SUMO构建匝道合流仿真环境并获取相关状态信息，设计状态空间、动作空间以及奖励函数，基于近端策略优化算法构建Actor网络和Critic网络，并对网络进行迭代训练，直至收敛，最后通过TraCI接口与SUMO交互，完成匝道入口合流行为，包括以下步骤：步骤一、利用SUMO交通仿真软件搭建高速公路匝道合流路段并获取道路环境、自车及周围环境车辆的状态信息，状态信息包括车辆ID、横向位置、纵向位置、横向速度、纵向速度、加速度；步骤二、利用车辆的状态信息，设计状态空间、动作空间以及奖励函数：1、状态空间S由自车和主车道前、后车辆的连续状态组成S＝{x
e
,x
f
,x
r
}，其中x
e
代表自车状态，x
e
＝[p
x
,p
y
,sp
x
,sp
y
,a]，其中p
x
,p
y
分别表示自车的横、纵向位置，sp
x
,sp
y
分别表示自车的横、纵向速度，a表示自车加速度，而x
f
,x
r
分别为主车道前后车辆状态，x
i
＝[d
rd
,p
x
,sp
y
,a
i
]，i∈{f,r}，其中d
rd
表示该车道车辆与自车的相对距离，p
x
,sp
y
,a
i
分别为该车的横向位置、纵向速度及该车的加速度；2、动作空间A由车辆动作集合a构成，a＝{1,2}，1表示立即进行匝道合流，2表示暂停合流；3、奖励函数R由舒适度子奖励、效率子奖励、安全子奖励构成，表达式为：R＝μ
c
R
c
(t)+μ
e
R
eff
(t)+μ
u
R
unsafety
，其中R
c
(t)、R
eff
(t)、R
unsafety
分别代表舒适度子奖励、效率子奖励、安全子奖励，μ
c
,μ
e
,μ
...

【专利技术属性】
技术研发人员：佟宁，李凤岐，王坤瑞，
申请(专利权)人：大连交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人