【技术实现步骤摘要】
基于深度强化学习的车辆匝道入口合流控制方法
[0001]本专利技术涉及一种车辆匝道入口合流控制方法,尤其涉及一种基于深度强化学习的车辆匝道入口合流控制方法。属于深度学习
,也属于车辆人工智能控制
技术介绍
[0002]匝道合流是造成城市高架道路和高速公路交通拥堵的主要原因之一。对于车辆来说,在匝道合流入口必须综合考虑周围环境各类因素,等待合适的合流机会,同时根据对安全间距和主干道车辆速度的判断以确定加速的程度和时间。驾驶员操作不慎就极易引发交通事故,从而产生严峻的交通拥堵,降低交通效率,增加碰撞风险,增加出行时间,给乘客带来不适。即使车辆顺利完成匝道入口合流,在实际过程也不一定是全局最优的,安全性、效率和舒适性难以兼顾和保证。因此,车辆匝道入口合流控制方法具有较强的实际意义和研究价值。
[0003]随着人工智能的不断发展,智慧交通受到了国内外学者广泛关注。发展智慧交通是构建“安全可靠、便捷高效、绿色智能、开放共享”的现代化综合交通系统的重要手段,是主动顺应新兴信息技术和互联网发展的新趋势。现有的基于机器学习的合流控制方法主要以模型预测控制为主。一般要先从实际交通数据中提取特征变量,再建立交通流模型。由于实际交通状况具有高度随机性,难以建立精确的交通预测模型,因此较难在复杂场景中取得良好的建模效果导致匝道合流控制准确度下降。而深度强化学习是通过智能体待合流车辆与动态、复杂环境中的其他车辆不断交互,并根据环境信息的反馈学习最优的控制策略,可灵活应用于驾驶车辆入匝道合流控制,从而解决道路拥堵、交通事 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度强化学习的车辆匝道入口合流控制方法,其特征在于:利用SUMO构建匝道合流仿真环境并获取相关状态信息,设计状态空间、动作空间以及奖励函数,基于近端策略优化算法构建Actor网络和Critic网络,并对网络进行迭代训练,直至收敛,最后通过TraCI接口与SUMO交互,完成匝道入口合流行为,包括以下步骤:步骤一、利用SUMO交通仿真软件搭建高速公路匝道合流路段并获取道路环境、自车及周围环境车辆的状态信息,状态信息包括车辆ID、横向位置、纵向位置、横向速度、纵向速度、加速度;步骤二、利用车辆的状态信息,设计状态空间、动作空间以及奖励函数:1、状态空间S由自车和主车道前、后车辆的连续状态组成S={x
e
,x
f
,x
r
},其中x
e
代表自车状态,x
e
=[p
x
,p
y
,sp
x
,sp
y
,a],其中p
x
,p
y
分别表示自车的横、纵向位置,sp
x
,sp
y
分别表示自车的横、纵向速度,a表示自车加速度,而x
f
,x
r
分别为主车道前后车辆状态,x
i
=[d
rd
,p
x
,sp
y
,a
i
],i∈{f,r},其中d
rd
表示该车道车辆与自车的相对距离,p
x
,sp
y
,a
i
分别为该车的横向位置、纵向速度及该车的加速度;2、动作空间A由车辆动作集合a构成,a={1,2},1表示立即进行匝道合流,2表示暂停合流;3、奖励函数R由舒适度子奖励、效率子奖励、安全子奖励构成,表达式为:R=μ
c
R
c
(t)+μ
e
R
eff
(t)+μ
u
R
unsafety
,其中R
c
(t)、R
eff
(t)、R
unsafety
分别代表舒适度子奖励、效率子奖励、安全子奖励,μ
c
,μ
e
,μ
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。