基于混合策略博弈的驾驶人换道意图识别方法及系统技术方案

技术编号:26491364 阅读:28 留言:0更新日期:2020-11-27 15:16
本发明专利技术提供了一种基于混合策略博弈的驾驶人换道意图识别方法及系统,包括:步骤1:建立城市道路单向三车道场景;步骤2:获取当前车道和第一、第二期望车道上的车辆的运行状态,并判断是否为特殊情况;步骤3:根据判断建立换道车辆纯策略集合;步骤4:选定目标车道中的滞后于换道车辆的滞后车辆,建立滞后车辆纯策略集合;步骤5:根据换道车辆纯策略集合、滞后车辆纯策略集合和混合博弈策略,判断换道的收益以及驾驶人的驾驶风格,进而判断驾驶人的换道意图。本发明专利技术以城市道路场景为基础,对城市道路场景下可能出现的路况进行了分析讨论,解决了特殊场景下的车辆换道问题,保证了行驶的安全性和合法性,且贴近生活。

【技术实现步骤摘要】
基于混合策略博弈的驾驶人换道意图识别方法及系统
本专利技术涉及智能驾驶
,具体地,涉及一种基于混合策略博弈的驾驶人换道意图识别方法及系统。尤其地,涉及一种城市场景下基于混合策略博弈的驾驶人换道意图识别方法。
技术介绍
随着人工智能的热度升高,智能驾驶作为一种人工智能的应用领域也受到了越来越多的关注,并取得了良好的发展。自动驾驶对于人们的生活方式上是一个革新,让人们从驾驶中解放出来,从而提高人力资源的利用率。自动驾驶的应用场景之一就是在城市道路场景下进行自动驾驶,而其中驾驶人的意图的识别是自动驾驶中十分重要的一环,这直接关系到车辆行驶的轨迹规划和控制。而在行驶过程中,换道是一个很常见的驾驶行为,尤其是在城市道路场景中,交通情况复杂,有着红绿灯、限速、左转右转道等多种限制,驾驶人会出现多种驾驶意图,这无疑为自动驾驶的意图识别提供了难度。如何正确识别驾驶人的换道意图,使车辆能够在城市道路场景下正常行驶,保证换道的正确性、安全性以及必要性,是目前智能驾驶走向实际生活应用的一个关键点。专利文献CN110298131A(申请号:201910603412.7)公开了一种混合驾驶环境下自动驾驶换道决策模型建立方法,建立混合驾驶环境下自动驾驶车辆LV与人类驾驶车辆RV的多步动态博弈换道模型,并为自动驾驶车辆设计了一套嵌套博弈算法。本专利技术首先建立了多步动态博弈框架,双方车辆都会根据对方策略选择来决定接下来的行动,并定义换道车辆和目标车道后车的潜在冲突点,并根据车辆初始信息、策略和博弈步数来制定博弈的起止条件准则,然后两辆车使用各自的策略和加速度选择方法进行动态博弈,直至满足换道终止条件为止。
技术实现思路
针对现有技术中的缺陷,本专利技术的目的是提供一种基于混合策略博弈的驾驶人换道意图识别方法及系统。根据本专利技术提供的基于混合策略博弈的驾驶人换道意图识别方法,包括:步骤1:建立城市道路单向三车道场景,包括当前车道、第一期望车道、第二期望车道以及三车道上行驶的车辆;步骤2:获取当前车道和第一、第二期望车道上的车辆的运行状态,并判断是否为特殊情况;步骤3:根据判断建立换道车辆纯策略集合;步骤4:选定目标车道中的滞后于换道车辆的滞后车辆,建立滞后车辆纯策略集合;步骤5:根据换道车辆纯策略集合、滞后车辆纯策略集合和混合博弈策略,判断换道的收益以及驾驶人的驾驶风格,进而判断驾驶人的换道意图。优选的,所述特殊情况包括城市道路场景下的道路速度限制、红绿灯路况和存在转弯路况。优选的,定义安全距离Ls,设定在换道前同车道各个车辆间的距离均大于或等于安全距离,且在换道后,同车道各车辆间的距离仍然均大于或等于安全距离;为换道车辆Va建立两种纯策略:换道、不换道,策略对应的概率分别为p,1-p;为滞后车辆Vb建立三种纯策略:加速、减速、换道,对应的概率分别为q1,q2,1-q1-q2;设定当滞后车辆加速时,换道车辆无法进行换道,Va和Vb的收益由Pij,Qij表示,得到收益的矩阵以及Va,Vb的混合概率期望收益Ea,Eb;根据混合博弈策略,最大化收益Ea,Eb,取得最优解,根据纳什均衡,取最优的混合概率为则有:收益函数为:P(orQ)=α×A+β×B,其中α+β=1;P(orQ)表示收益函数;A表示换道车辆与前方车辆的距离与它们相对速度的比值;B表示换道车辆与后方车辆的空间距离与它们相对速度的比值;α,β是权重系数,初始值为0.5,根据驾驶人的驾驶习惯权重进行调整;表示当滞后车辆取最优策略,但换道车辆不采取最优策略时的期望;表示当换道车辆取最优策略,但滞后车辆不采取最优策略时的期望。优选的,对于换道车辆Va,当Va选择不换道时,根据公式得到收益函数为:P11=αA11+βB11P12=αA11+βB12P13=αA11+βB13P21=P22=P23=A12其中:A11表示Va与Vb之间的空间距离与Va换道后它们的相对速度的比值;A12表示Va与Vb之间的空间距离与它们的相对速度的比值;B11表示Va与Vc之间的空间距离与Va换道后、Vc加速后它们的相对速度的比值;B12表示Va与Vc之间的空间距离与Va换道后、Vc减速后它们的相对速度的比值;B13表示Va与Vd之间的空间距离与Va换道后它们的相对速度的比值;p11、p12、p13、p21分别表示各情况下的换道车辆的收益函数;Vd表示期望车道上在换道车辆后方的车辆。优选的,当换道车辆选择换道行时,前导车辆为Vc,根据换道车辆纯策略集合,得到收益函数为:Q11=αA21+βB21Q12=αA22+βB22Q21=αA23+βB21Q22=αA24+βB22Q13=Q23=αA25+βB23其中:A21表示Vc与Va之间的空间距离与Vc加速后它们的相对速度的比值;A22表示Vc与Va之间的空间距离与Vc减速后它们的相对速度的比值;A23表示Vc与Vb之间的空间距离与Vc加速后它们的相对速度的比值;A24表示Vc与Vb之间的空间距离与Vc减速后它们的相对速度的比值;A25表示Vc与Vf之间的空间距离与Vc换道后它们的相对速度的比值;B21表示Vc与Vd之间的空间距离与Vc加速后它们的相对速度的比值;B22表示Vc与Vd之间的空间距离与Vc减速后它们的相对速度的比值;B23表示Vc与Ve之间的空间距离与Vc换道后它们的相对速度的比值;Q11、Q12、Q21、Q22、Q13、Q23分别表示各情况下的滞后车辆的收益函数;根据纳什均衡求解得到最优解,选取收益最大的策略。优选的,博弈终止的条件包括:换道车辆的博弈次数达到设定次数时,或者换道过程中换道车辆与当前车道车辆的跟驰距离不满足安全距离时。优选的,当道路速度限制时,设限速为SL,换道车辆速度为Sa,当VL-Va的差值大于换道车辆预设加速范围时,滞后车辆的策略正常选择;当换道车辆Va的速度Sa与限速SL的差值低于预设阈值时,滞后车辆若选择加速,则速度必须超过VL。优选的,在红绿灯路况中,当换道车辆距离红绿灯大于设定距离时,换道车辆与滞后车辆的选择不受影响;当换道车辆距离红绿灯低于设定距离时,换道车辆选择大幅度减速,若目标车道上有位置比换道车辆靠前的车辆,换道车辆选择放弃换道;若目标车道上只有位置滞后于换道车辆的车辆,则换道车辆换道选择为正常换道策略。优选的,当存在转弯路况时,换道车辆临近道路口,在直行或右转道路行驶,需要进行左转弯时;或者换道车辆在直行或左转道路上行驶,需要进行右转弯时;或者换道车辆在左转或右转道路上行驶,需要直行时,正常换道策略中的权重α,β大幅度变化,换道车辆将强制进行换道,此时策略为换道;当存在转弯路况时,换道车辆临近道路口,在行驶的方向上的道路行驶,换道车辆不进行换道选择,此时策略为不换道。根据本专利技术提供的基于混合策略博弈的驾驶人换道意图识别本文档来自技高网
...

【技术保护点】
1.一种基于混合策略博弈的驾驶人换道意图识别方法,其特征在于,包括:/n步骤1:建立城市道路单向三车道场景,包括当前车道、第一期望车道、第二期望车道以及三车道上行驶的车辆;/n步骤2:获取当前车道和第一、第二期望车道上的车辆的运行状态,并判断是否为特殊情况;/n步骤3:根据判断建立换道车辆纯策略集合;/n步骤4:选定目标车道中的滞后于换道车辆的滞后车辆,建立滞后车辆纯策略集合;/n步骤5:根据换道车辆纯策略集合、滞后车辆纯策略集合和混合博弈策略,判断换道的收益以及驾驶人的驾驶风格,进而判断驾驶人的换道意图。/n

【技术特征摘要】
1.一种基于混合策略博弈的驾驶人换道意图识别方法,其特征在于,包括:
步骤1:建立城市道路单向三车道场景,包括当前车道、第一期望车道、第二期望车道以及三车道上行驶的车辆;
步骤2:获取当前车道和第一、第二期望车道上的车辆的运行状态,并判断是否为特殊情况;
步骤3:根据判断建立换道车辆纯策略集合;
步骤4:选定目标车道中的滞后于换道车辆的滞后车辆,建立滞后车辆纯策略集合;
步骤5:根据换道车辆纯策略集合、滞后车辆纯策略集合和混合博弈策略,判断换道的收益以及驾驶人的驾驶风格,进而判断驾驶人的换道意图。


2.根据权利要求1所述的基于混合策略博弈的驾驶人换道意图识别方法,其特征在于,所述特殊情况包括城市道路场景下的道路速度限制、红绿灯路况和存在转弯路况。


3.根据权利要求1所述的基于混合策略博弈的驾驶人换道意图识别方法,其特征在于,定义安全距离Ls,设定在换道前同车道各个车辆间的距离均大于或等于安全距离,且在换道后,同车道各车辆间的距离仍然均大于或等于安全距离;
为换道车辆Va建立两种纯策略:换道、不换道,策略对应的概率分别为p,1-p;
为滞后车辆Vb建立三种纯策略:加速、减速、换道,对应的概率分别为q1,q2,1-q1-q2;
设定当滞后车辆加速时,换道车辆无法进行换道,Va和Vb的收益由Pij,Qij表示,得到收益的矩阵以及Va,Vb的混合概率期望收益Ea,Eb;
根据混合博弈策略,最大化收益Ea,Eb,取得最优解,根据纳什均衡,取最优的混合概率为则有:






收益函数为:P(orQ)=α×A+β×B,其中α+β=1;P(orQ)表示收益函数;A表示换道车辆与前方车辆的距离与它们相对速度的比值;B表示换道车辆与后方车辆的空间距离与它们相对速度的比值;α,β是权重系数,初始值为0.5,根据驾驶人的驾驶习惯权重进行调整;表示当滞后车辆取最优策略,但换道车辆不采取最优策略时的期望;表示当换道车辆取最优策略,但滞后车辆不采取最优策略时的期望。


4.根据权利要求3所述的基于混合策略博弈的驾驶人换道意图识别方法,其特征在于,对于换道车辆Va,当Va选择不换道时,根据公式得到收益函数为:
P11=αA11+βB11
P12=αA11+βB12
P13=αA11+βB13
P21=P22=P23=A12
其中:A11表示Va与Vb之间的空间距离与Va换道后它们的相对速度的比值;A12表示Va与Vb之间的空间距离与它们的相对速度的比值;B11表示Va与Vc之间的空间距离与Va换道后、Vc加速后它们的相对速度的比值;B12表示Va与Vc之间的空间距离与Va换道后、Vc减速后它们的相对速度的比值;B13表示Va与Vd之间的空间距离与Va换道后它们的相对速度的比值;
p11、p12、p13、p21分别表示各情况下的换道车辆的收益函数;Vd表示期望车道上在换道车辆后方的车辆。


5.根据权利要求3所述的基于混合策略博弈的驾驶人换道意图识别方法,其特征在于,当换道车辆选择换道行时,前导车辆为Vc,根据换道车辆纯策略集合,得到收益函数为:
Q11=αA21+βB21
...

【专利技术属性】
技术研发人员:高洪波郝正源李智军朱菊萍何希
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1