基于混合策略博弈的驾驶人换道意图识别方法及系统技术方案

技术编号：26491364 阅读：28 留言：0更新日期：2020-11-27 15:16

本发明专利技术提供了一种基于混合策略博弈的驾驶人换道意图识别方法及系统，包括：步骤1：建立城市道路单向三车道场景；步骤2：获取当前车道和第一、第二期望车道上的车辆的运行状态，并判断是否为特殊情况；步骤3：根据判断建立换道车辆纯策略集合；步骤4：选定目标车道中的滞后于换道车辆的滞后车辆，建立滞后车辆纯策略集合；步骤5：根据换道车辆纯策略集合、滞后车辆纯策略集合和混合博弈策略，判断换道的收益以及驾驶人的驾驶风格，进而判断驾驶人的换道意图。本发明专利技术以城市道路场景为基础，对城市道路场景下可能出现的路况进行了分析讨论，解决了特殊场景下的车辆换道问题，保证了行驶的安全性和合法性，且贴近生活。

全部详细技术资料下载

【技术实现步骤摘要】
基于混合策略博弈的驾驶人换道意图识别方法及系统
本专利技术涉及智能驾驶
，具体地，涉及一种基于混合策略博弈的驾驶人换道意图识别方法及系统。尤其地，涉及一种城市场景下基于混合策略博弈的驾驶人换道意图识别方法。
技术介绍
随着人工智能的热度升高，智能驾驶作为一种人工智能的应用领域也受到了越来越多的关注，并取得了良好的发展。自动驾驶对于人们的生活方式上是一个革新，让人们从驾驶中解放出来，从而提高人力资源的利用率。自动驾驶的应用场景之一就是在城市道路场景下进行自动驾驶，而其中驾驶人的意图的识别是自动驾驶中十分重要的一环，这直接关系到车辆行驶的轨迹规划和控制。而在行驶过程中，换道是一个很常见的驾驶行为，尤其是在城市道路场景中，交通情况复杂，有着红绿灯、限速、左转右转道等多种限制，驾驶人会出现多种驾驶意图，这无疑为自动驾驶的意图识别提供了难度。如何正确识别驾驶人的换道意图，使车辆能够在城市道路场景下正常行驶，保证换道的正确性、安全性以及必要性，是目前智能驾驶走向实际生活应用的一个关键点。专利文献CN110298131A(申请号：201910603412.7)公开了一种混合驾驶环境下自动驾驶换道决策模型建立方法，建立混合驾驶环境下自动驾驶车辆LV与人类驾驶车辆RV的多步动态博弈换道模型，并为自动驾驶车辆设计了一套嵌套博弈算法。本专利技术首先建立了多步动态博弈框架，双方车辆都会根据对方策略选择来决定接下来的行动，并定义换道车辆和目标车道后车的潜在冲突点，并根据车辆初始信息、策略和博弈步数来制定博弈的起止条件准则...

【技术保护点】
1.一种基于混合策略博弈的驾驶人换道意图识别方法，其特征在于，包括：/n步骤1：建立城市道路单向三车道场景，包括当前车道、第一期望车道、第二期望车道以及三车道上行驶的车辆；/n步骤2：获取当前车道和第一、第二期望车道上的车辆的运行状态，并判断是否为特殊情况；/n步骤3：根据判断建立换道车辆纯策略集合；/n步骤4：选定目标车道中的滞后于换道车辆的滞后车辆，建立滞后车辆纯策略集合；/n步骤5：根据换道车辆纯策略集合、滞后车辆纯策略集合和混合博弈策略，判断换道的收益以及驾驶人的驾驶风格，进而判断驾驶人的换道意图。/n

【技术特征摘要】
1.一种基于混合策略博弈的驾驶人换道意图识别方法，其特征在于，包括：
步骤1：建立城市道路单向三车道场景，包括当前车道、第一期望车道、第二期望车道以及三车道上行驶的车辆；
步骤2：获取当前车道和第一、第二期望车道上的车辆的运行状态，并判断是否为特殊情况；
步骤3：根据判断建立换道车辆纯策略集合；
步骤4：选定目标车道中的滞后于换道车辆的滞后车辆，建立滞后车辆纯策略集合；
步骤5：根据换道车辆纯策略集合、滞后车辆纯策略集合和混合博弈策略，判断换道的收益以及驾驶人的驾驶风格，进而判断驾驶人的换道意图。

2.根据权利要求1所述的基于混合策略博弈的驾驶人换道意图识别方法，其特征在于，所述特殊情况包括城市道路场景下的道路速度限制、红绿灯路况和存在转弯路况。

3.根据权利要求1所述的基于混合策略博弈的驾驶人换道意图识别方法，其特征在于，定义安全距离Ls，设定在换道前同车道各个车辆间的距离均大于或等于安全距离，且在换道后，同车道各车辆间的距离仍然均大于或等于安全距离；
为换道车辆Va建立两种纯策略：换道、不换道，策略对应的概率分别为p,1-p；
为滞后车辆Vb建立三种纯策略：加速、减速、换道，对应的概率分别为q1,q2,1-q1-q2；
设定当滞后车辆加速时，换道车辆无法进行换道，Va和Vb的收益由Pij,Qij表示，得到收益的矩阵以及Va,Vb的混合概率期望收益Ea,Eb；
根据混合博弈策略，最大化收益Ea,Eb，取得最优解，根据纳什均衡，取最优的混合概率为则有：

收益函数为：P(orQ)＝α×A+β×B，其中α+β＝1；P(orQ)表示收益函数；A表示换道车辆与前方车辆的距离与它们相对速度的比值；B表示换道车辆与后方车辆的空间距离与它们相对速度的比值；α,β是权重系数，初始值为0.5，根据驾驶人的驾驶习惯权重进行调整；表示当滞后车辆取最优策略，但换道车辆不采取最优策略时的期望；表示当换道车辆取最优策略，但滞后车辆不采取最优策略时的期望。

4.根据权利要求3所述的基于混合策略博弈的驾驶人换道意图识别方法，其特征在于，对于换道车辆Va，当Va选择不换道时，根据公式得到收益函数为：
P11＝αA11+βB11
P12＝αA11+βB12
P13＝αA11+βB13
P21＝P22＝P23＝A12
其中：A11表示Va与Vb之间的空间距离与Va换道后它们的相对速度的比值；A12表示Va与Vb之间的空间距离与它们的相对速度的比值；B11表示Va与Vc之间的空间距离与Va换道后、Vc加速后它们的相对速度的比值；B12表示Va与Vc之间的空间距离与Va换道后、Vc减速后它们的相对速度的比值；B13表示Va与Vd之间的空间距离与Va换道后它们的相对速度的比值；
p11、p12、p13、p21分别表示各情况下的换道车辆的收益函数；Vd表示期望车道上在换道车辆后方的车辆。

5.根据权利要求3所述的基于混合策略博弈的驾驶人换道意图识别方法，其特征在于，当换道车辆选择换道行时，前导车辆为Vc，根据换道车辆纯策略集合，得到收益函数为：
Q11＝αA21+βB21
...

【专利技术属性】
技术研发人员：高洪波，郝正源，李智军，朱菊萍，何希，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人