【技术实现步骤摘要】
基于混合策略博弈的驾驶人换道意图识别方法及系统
本专利技术涉及智能驾驶
,具体地,涉及一种基于混合策略博弈的驾驶人换道意图识别方法及系统。尤其地,涉及一种城市场景下基于混合策略博弈的驾驶人换道意图识别方法。
技术介绍
随着人工智能的热度升高,智能驾驶作为一种人工智能的应用领域也受到了越来越多的关注,并取得了良好的发展。自动驾驶对于人们的生活方式上是一个革新,让人们从驾驶中解放出来,从而提高人力资源的利用率。自动驾驶的应用场景之一就是在城市道路场景下进行自动驾驶,而其中驾驶人的意图的识别是自动驾驶中十分重要的一环,这直接关系到车辆行驶的轨迹规划和控制。而在行驶过程中,换道是一个很常见的驾驶行为,尤其是在城市道路场景中,交通情况复杂,有着红绿灯、限速、左转右转道等多种限制,驾驶人会出现多种驾驶意图,这无疑为自动驾驶的意图识别提供了难度。如何正确识别驾驶人的换道意图,使车辆能够在城市道路场景下正常行驶,保证换道的正确性、安全性以及必要性,是目前智能驾驶走向实际生活应用的一个关键点。专利文献CN110298131A(申请号:201910603412.7)公开了一种混合驾驶环境下自动驾驶换道决策模型建立方法,建立混合驾驶环境下自动驾驶车辆LV与人类驾驶车辆RV的多步动态博弈换道模型,并为自动驾驶车辆设计了一套嵌套博弈算法。本专利技术首先建立了多步动态博弈框架,双方车辆都会根据对方策略选择来决定接下来的行动,并定义换道车辆和目标车道后车的潜在冲突点,并根据车辆初始信息、策略和博弈步数来制定博弈的起止条件准则 ...
【技术保护点】
1.一种基于混合策略博弈的驾驶人换道意图识别方法,其特征在于,包括:/n步骤1:建立城市道路单向三车道场景,包括当前车道、第一期望车道、第二期望车道以及三车道上行驶的车辆;/n步骤2:获取当前车道和第一、第二期望车道上的车辆的运行状态,并判断是否为特殊情况;/n步骤3:根据判断建立换道车辆纯策略集合;/n步骤4:选定目标车道中的滞后于换道车辆的滞后车辆,建立滞后车辆纯策略集合;/n步骤5:根据换道车辆纯策略集合、滞后车辆纯策略集合和混合博弈策略,判断换道的收益以及驾驶人的驾驶风格,进而判断驾驶人的换道意图。/n
【技术特征摘要】
1.一种基于混合策略博弈的驾驶人换道意图识别方法,其特征在于,包括:
步骤1:建立城市道路单向三车道场景,包括当前车道、第一期望车道、第二期望车道以及三车道上行驶的车辆;
步骤2:获取当前车道和第一、第二期望车道上的车辆的运行状态,并判断是否为特殊情况;
步骤3:根据判断建立换道车辆纯策略集合;
步骤4:选定目标车道中的滞后于换道车辆的滞后车辆,建立滞后车辆纯策略集合;
步骤5:根据换道车辆纯策略集合、滞后车辆纯策略集合和混合博弈策略,判断换道的收益以及驾驶人的驾驶风格,进而判断驾驶人的换道意图。
2.根据权利要求1所述的基于混合策略博弈的驾驶人换道意图识别方法,其特征在于,所述特殊情况包括城市道路场景下的道路速度限制、红绿灯路况和存在转弯路况。
3.根据权利要求1所述的基于混合策略博弈的驾驶人换道意图识别方法,其特征在于,定义安全距离Ls,设定在换道前同车道各个车辆间的距离均大于或等于安全距离,且在换道后,同车道各车辆间的距离仍然均大于或等于安全距离;
为换道车辆Va建立两种纯策略:换道、不换道,策略对应的概率分别为p,1-p;
为滞后车辆Vb建立三种纯策略:加速、减速、换道,对应的概率分别为q1,q2,1-q1-q2;
设定当滞后车辆加速时,换道车辆无法进行换道,Va和Vb的收益由Pij,Qij表示,得到收益的矩阵以及Va,Vb的混合概率期望收益Ea,Eb;
根据混合博弈策略,最大化收益Ea,Eb,取得最优解,根据纳什均衡,取最优的混合概率为则有:
收益函数为:P(orQ)=α×A+β×B,其中α+β=1;P(orQ)表示收益函数;A表示换道车辆与前方车辆的距离与它们相对速度的比值;B表示换道车辆与后方车辆的空间距离与它们相对速度的比值;α,β是权重系数,初始值为0.5,根据驾驶人的驾驶习惯权重进行调整;表示当滞后车辆取最优策略,但换道车辆不采取最优策略时的期望;表示当换道车辆取最优策略,但滞后车辆不采取最优策略时的期望。
4.根据权利要求3所述的基于混合策略博弈的驾驶人换道意图识别方法,其特征在于,对于换道车辆Va,当Va选择不换道时,根据公式得到收益函数为:
P11=αA11+βB11
P12=αA11+βB12
P13=αA11+βB13
P21=P22=P23=A12
其中:A11表示Va与Vb之间的空间距离与Va换道后它们的相对速度的比值;A12表示Va与Vb之间的空间距离与它们的相对速度的比值;B11表示Va与Vc之间的空间距离与Va换道后、Vc加速后它们的相对速度的比值;B12表示Va与Vc之间的空间距离与Va换道后、Vc减速后它们的相对速度的比值;B13表示Va与Vd之间的空间距离与Va换道后它们的相对速度的比值;
p11、p12、p13、p21分别表示各情况下的换道车辆的收益函数;Vd表示期望车道上在换道车辆后方的车辆。
5.根据权利要求3所述的基于混合策略博弈的驾驶人换道意图识别方法,其特征在于,当换道车辆选择换道行时,前导车辆为Vc,根据换道车辆纯策略集合,得到收益函数为:
Q11=αA21+βB21
...
【专利技术属性】
技术研发人员:高洪波,郝正源,李智军,朱菊萍,何希,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。