一种智能驾驶决策方法、决策装置以及车辆制造方法及图纸

技术编号:36086363 阅读:50 留言:0更新日期:2022-12-24 11:02
本申请公开了一种智能驾驶决策方法、决策装置以及车辆,可应用智能驾驶领域,包括:识别意图不确定物体(即博弈对象)及其拥有的n条道路拓扑,并确定博弈对象沿每条道路拓扑行驶的意图概率(共n个),构建包括m个博弈策略的采样博弈空间,计算m个博弈策略在每条道路拓扑的策略代价(共n组),确定满足预设条件的n个目标策略代价,并根据目标博弈策略(m个中的一个)确定自车决策结果。本申请在物体意图不确定的情况下,利用观测到的信息推理意图不明确物体的意图概率,基于此进行不确定性交互博弈决策,以求解出自车最佳动作,使得自车可以合理响应动态物体意图的跳变,减少不合理的点刹和误抢行,提高自车的乘车舒适性、安全性和通过性。性。性。

【技术实现步骤摘要】
一种智能驾驶决策方法、决策装置以及车辆


[0001]本申请涉及智能驾驶领域,尤其涉及一种智能驾驶决策方法、决策装置以及车辆。

技术介绍

[0002]随着智能驾驶的到来,车辆的智能驾驶成为当前热门的研究方向。智能驾驶包括辅助驾驶和自动驾驶,其实现的关键技术有:地图及定位、环境感知、融合预测、决策规划以及底层控制。
[0003]在传统决策层面上,各厂商也提出了应用于不同场景的决策规划方法,主要分为高层的语义决策(如换道决策/车道保持决策等)和针对物体的障碍物决策(如避让/跟车、抢行/让行等)。其中,物体决策模块为障碍物标注行为标签,为运动规划模块提供合理输入,保证自动驾驶车辆对周围障碍物进行合理响应。业界的交互决策基于环境物体的较危险意图/行为进行最优博弈求解,虽然可以严格的保证安全性,但由于是对某一个假设不会变化的确定意图进行交互博弈推理。
[0004]上述这种决策方式会带来两个严重问题:一是因为现有决策系统一般对较危险的确定性单一意图进行交互博弈求解,只考虑物体最坏的意图,所以决策结果往往保守、不类人,导致在复杂环境下自车的通过本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种智能驾驶决策方法,其特征在于,包括:确定博弈对象,并获取所述博弈对象的实时状态信息,其中,所述博弈对象为自车识别出拥有n条道路拓扑归属的障碍物,n≥2;根据所述博弈对象的实时状态信息,确定所述博弈对象沿每条所述道路拓扑行驶的意图概率,得到n个意图概率;根据所述自车的实时状态信息以及所述博弈对象的实时状态信息,对所述博弈对象构建采样博弈空间,所述采样博弈空间包括m个博弈策略,m≥1;计算所述m个博弈策略在每条所述道路拓扑下的策略代价,得到n组策略代价,其中,每组策略代价包括与所述m个博弈策略一一对应的m个策略代价;根据所述n个意图概率以及所述n组策略代价,确定总代价满足预设条件的n个目标策略代价,所述n个目标策略代价为目标博弈策略在每条所述道路拓扑下的策略代价,所述目标博弈策略为所述m个博弈策略中的一个;根据所述目标博弈策略确定所述自车的决策结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述博弈对象的实时状态信息,确定所述博弈对象沿每条所述道路拓扑行驶的意图概率包括:获取所述博弈对象在每条所述道路拓扑的特征参考信息,所述特征参考信息用于描述所述博弈对象在当前交通环境状态下沿每条所述道路拓扑行驶的意图的基准状态;根据所述博弈对象的实时状态信息以及所述特征参考信息,确定所述博弈对象沿每条所述道路拓扑行驶的意图概率。3.根据权利要求2所述的方法,其特征在于,所述根据所述博弈对象的实时状态信息以及所述特征参考信息,确定所述博弈对象沿每条所述道路拓扑行驶的意图概率包括:根据所述博弈对象的实时状态信息以及所述特征参考信息,得到目标特征向量;根据事先构建的概率密度分布数据集,确定所述目标特征向量的似然概率,所述概率密度分布数据集包括在不同特征向量取值下,所述特征向量的概率密度的分布情况;根据所述似然概率确定所述博弈对象沿每条所述道路拓扑行驶的意图概率。4.根据权利要求3所述的方法,其特征在于,所述概率密度分布数据集包括:非线性概率密度分布数据集,所述非线性概率密度分布数据集包括不同速度取值、不同特征向量取值下,所述特征向量的概率密度的分布情况。5.根据权利要求3

4中任一项所述的方法,其特征在于,所述根据所述似然概率确定所述博弈对象沿每条所述道路拓扑行驶的意图概率包括:获取障碍物沿每条所述道路拓扑行驶的先验意图概率;根据所述似然概率以及所述先验意图概率,利用贝叶斯推理算法,计算所述博弈对象沿每条所述道路拓扑行驶的意图概率。6.根据权利要求2

5中任一项所述的方法,其特征在于,所述特征参考信息基于每条所述道路拓扑上的目标路点得到;或,所述特征参考信息基于道路拥挤程度和/或所述博弈对象驾驶风格的激进程度得到。7.根据权利要求2

6中任一项所述的方法,其特征在于,所述博弈对象的实时状态信息至少包括如下任意一个或多个:
所述博弈对象的实时位置信息、所述博弈对象的实时朝向角、所述博弈对象的实时速度、所述博弈对象的实时加速度;所述特征参考信息至少包括如下任意一个或多个:所述博弈对象的参考位置信息、所述博弈对象的参考朝向角、所述博弈对象的参考速度、所述博弈对象的参考加速度。8.根据权利要求7所述的方法,其特征在于,在所述博弈对象周围除所述自车外没有其他障碍物存在的情况下,所述博弈对象的参考速度的取值基于所述博弈对象的运动学约束和/或所述博弈对象的环境交通约束计算得到。9.根据权利要求8所述的方法,其特征在于,所述运动学约束至少包括如下任意一项或多项:车道拓扑曲率限速、起步加速约束、红灯减速约束;所述环境交通约束至少包括如下任意一项或多项:所述博弈对象所处车道的道路限速、所述博弈对象所处车道上的前车速度约束、除所述博弈对象所处车道外其他车道的障碍物的速度约束。10.根据权利要求7所述的方法,其特征在于,在所述n个道路拓扑上存在至少一个位于所述博弈对象前面的第一目标障碍物,且所述博弈对象与所述第一目标障碍物之间的距离小于预设安全距离的情况下,所述博弈对象的参考速度基于所述第一目标障碍物的速度得到。11.根据权利要求7所述的方法,其特征在于,在所述博弈对象同向行驶方向上存在至少一个第二目标障碍物,且所述至少一个第二目标障碍物所拥有的道路拓扑归属不属于所述n个道路拓扑的情况下,所述博弈对象的参考速度基于所述至少一个第二目标障碍物的基准速度得到,所述基准速度基于预设方法得到。12.根据权利要求7所述的方法,其特征在于,在所述博弈对象的横穿行驶方向上存在至少一个第三目标障碍物,且所述博弈对象与所述至少一个第三目标障碍物到达预测碰撞点的时间差大于预设阈值,则所述博弈对象的参考速度为所述博弈对象的实时速度。13.根据权利要求7所述的方法,其特征在于,在所述博弈对象的横穿行驶方向上存在至少一个第三目标障碍物,且所述博弈对象与所述至少一个第三目标障碍物到达预测碰撞点的时间差小于或等于预设阈值,则所述博弈对象的参考速度基于所述博弈对象的实时速度得到,所述参考速度小于所述博弈对象的实时速度。14.根据权利要求1

13中任一项所述的方法,其特征在于,根据所述n个意图概率以及所述n组策略代价,确定总代价满足预设条件的n个目标策略代价包括:将所述n个意图概率分别作为所述n条道路拓扑各自的权重,计算所述n组策略代价中每个博弈策略对应的策略代价加权,得到m个总代价;从所述m个总代价中确定取值最小的总代价;确定与所述取值最小的总代价对应的n个目标策略代价。15.根据权利要求1

14中任一项所述的方法,其特征在于,所述计算所述m个博弈策略在每条所述道路拓扑下的策略代价包括:确定所述m个博弈策略在每条所述道路拓扑下的策略代价的各个因素,所述策略代价的各个因素包括安全性、舒适性、通过性、路权、横向偏移、风险区域、帧间关联中的至少一
个;计算每一个策略代价中的每一个因素的因素代价;将所述每一个策略代价中的每一个因素的因素代价进行加权,得到所述m个博弈策略在每条所述道路拓扑下的策略代价。16.根据权利要求1

15中任一项所述的方法,其特征在于,所述根据自车的实时状态信息以及所述博弈对象的实时状态信息,对所述博弈对象构建采样博弈空间包括:根据所述自车的实时状态信息以及所述博弈对象的实时状态信息,确定所述自车和所述博弈对象的决策上限和决策下限;按照预设规则,在所述决策上限和所述决策下限中,获取所述自车的决策策略与所述博弈对象的决策策略;将所述自车的决策策略与所述博弈对象的决策策略组合,得到所述自车与所述博弈对象的m个博弈策略,所述m个博弈策略属于所述采样博弈空间。17.根据权利要求1

16中任一项所述的方法,其特征在于,所述确定博弈对象包括:获取自车周围预设区域范围内的所有道路拓扑;获取所述自车周围至少一个障碍物的障碍物信息,并根据所述障碍物信息以及所述所有道路拓扑计算所述至少一个障碍物的道路拓扑归属;从所述至少一个障碍物中确定拥有n条道路拓扑归属的障碍物为所述博弈对象。18.一种决策装置,其特征在于,包括:获取模块,用于确定博弈对象,并获取所述博弈对象的实时状态信息,其中,所述博弈对象为自车识别出拥有n条道路拓扑归属的障碍物,n≥2;意图推理模块,用于根据所述博弈对象的实时状态信息,确定所述博弈对象沿每条所述道路拓扑行驶的意图概率,得到n个意图概率;构建模块,用于根据所述自车的实时状态信息以及所述博弈对象的实时状态信息,对所述博弈对象构建采样博弈空间,所述采样博弈空间包括m个博弈策略,m≥1;计算模块,用于计算所述m个博弈策略在每条所述道路拓扑下的策略代价,得到n组策略代价,其中,每组策略代价包括与所述m个博弈策略一一对应的m个策略代价;确定模块,用于根据所述n个意图概率以及所述n组策略代价,确定总代价满足预设条件的n个目标策略代价,所述n个目标策略代价为目标博弈策略在每条所述道路拓...

【专利技术属性】
技术研发人员:郝东浩张钟舜杨绍宇程思源张洪波
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1