一种决策方法、装置和车辆制造方法及图纸

技术编号:35360947 阅读:30 留言:0更新日期:2022-10-29 17:58
本申请提供了一种决策方法、装置和车辆,涉及智能驾驶技术领域。其中,所述方法包括通过获取自车和自车周围的各个障碍的预测运动轨迹,通过判断预测运动轨迹是否相交或两车之间的距离是否小于设定阈值,确定出博弈对象;然后构建自车与各个障碍物之间的采样博弈空间,并计算各个采样博弈空间中的各个博弈策略的策略代价;通过求解各个障碍物采样博弈空间中的共有博弈策略,选择相同博弈策略中策略代价最小的博弈策略作为博弈结果,由于该方案不依赖场景,所以可以适应于所有场景。同时,在博弈过程中,面对多个博弈对象时,通过求解各个采样博弈空间中的共有博弈策略的方式,实现自车可以与多个博弈对象同时进行博弈。车可以与多个博弈对象同时进行博弈。车可以与多个博弈对象同时进行博弈。

【技术实现步骤摘要】
一种决策方法、装置和车辆


[0001]本专利技术涉及智能驾驶
,尤其涉及一种决策方法、装置和车辆。

技术介绍

[0002]随着智能化的发展和普及,车辆的智能驾驶成为当前比较热门的研究方向。智能驾驶系统根据功能需求,可分为定位、环境感知、路径规划和决策控制四个关键功能模块。其中,在决策控制模块中,各厂商提出了应用于不同场景的决策规划方法。主要分为高层的语义决策(如换道决策、车道保持决策等)和对物体的障碍物决策(如避让决策、跟车决策、抢行决策、让行决策等)。
[0003]对于物体的障碍物决策过程中,现有的通过检测障碍物类型为车辆规划驾驶路线的决策方式只能处理特定场景,这些方式通常对希望处理的特定场景进行定量描述,然后再提取关键障碍物的关键信息来进行决策。因此,交通场景泛化能力差,无法在其它场景下对障碍物环境进行处理。

技术实现思路

[0004]为了解决上述的问题,本申请的实施例提供了一种决策方法、装置和车辆。
[0005]第一方面,本申请提供一种决策方法,包括:获取自车和自车周围各个障碍物的预测运动轨迹;确定博弈对象,该博弈对象为该自车周围各个障碍物中与该自车的预测运动轨迹相交或与自车之间的距离小于设定阈值的障碍物;根据传感器系统采集的自车的车辆信息、该博弈对象的障碍物信息和路况信息,分别对每个该博弈对象构建一个采样博弈空间,每一个采样博弈空间均包括至少一个博弈策略;计算每一个博弈策略的策略代价,该策略代价为将策略代价的各个因素权重进行加权得到的数值;确定自车的决策结果,该决策结果为共有采样博弈空间中策略代价最小的博弈策略,该共有采样博弈空间包括至少一个博弈策略,该每一个采样博弈空间中均包括该共有采样博弈空间中的博弈策略。
[0006]在该实施方式中,通过获取自车和自车周围的各个障碍的预测运动轨迹,通过判断预测运动轨迹是否相交或两车之间的距离是否小于设定阈值,确定出博弈对象;然后构建自车与各个障碍物之间的采样博弈空间,并计算各个采样博弈空间中的各个博弈策略的策略代价;通过求解各个采样博弈空间中的相同博弈策略,选择相同博弈策略中策略代价最小的博弈策略作为博弈结果,由于该方案不依赖场景,所以可以适应于所有场景。同时,在博弈过程中,面对多个博弈对象时,通过求解各个采样博弈空间中的相同博弈策略的方式,实现自车可以与多个博弈对象同时进行博弈。
[0007]在一种实施方式中,该确定自车的决策结果,包括:构建每一个采样博弈空间的可行域,该每一个采样博弈空间的可行域为符合设定要求的策略代价对应的至少一个博弈策略;在所有采样博弈空间的可行域交集中,确定出相同博弈策略中策略代价最小的博弈策略。
[0008]在该实施方式中,区别于现有技术直接从得到最优博弈策略的结果,本申请通过
将满足要求的各个博弈策略输出,构建自车和各个障碍物之间的可行域,以便本申请基于可行域实现对多个博弈对象之间的冲突进行判决,使输出的博弈结果更加合理。
[0009]在一种实施方式中,该方法还包括:确定非博弈对象,该非博弈对象为该自车周围各个障碍物中与该自车的预测运动轨迹不相交或与自车之间的距离不小于设定阈值的障碍物;根据传感器系统采集的自车的车辆信息、该非博弈对象的障碍物信息和路况信息,构建自车的可行域,该自车的可行域为自车在不碰撞该非博弈对象情况下采取不同决策的至少一个策略;检测到该自车的决策结果在该自车的可行域内,输出该自车的决策结果。
[0010]在该实施方式中,通过构建自车与非博弈对象的可行域,将自车与各个博弈对象之间的可行域和自车与非博弈对象的可行域求交集,从交集中选择出博弈代价最小的博弈策略作为决策结果,从而保证选择出来的决策结果可以适用于包括博弈对象和非博弈对象的场景下。
[0011]在一种实施方式中,根据传感器系统采集的自车的车辆信息、该博弈对象的障碍物信息和路况信息,分别对每个该博弈对象构建一个采样博弈空间,包括:根据该自车的车辆信息、该博弈对象的障碍物信息和路况信息,确定自车和该博弈对象中每一个障碍物的决策上限和决策下限;按照设定规则,在该自车和该博弈对象中每一个障碍物的决策上限和决策下限中,获取该自车和该博弈对象中每一个障碍物的决策策略;将该自车的决策策略与该博弈对象中每一个障碍物的决策策略组合,得到自车和该博弈对象中每一个障碍物的至少一个博弈策略。
[0012]在该实施方式中,通过确定自车和各个博弈对象的博弈策略选取范围和选取方式,得到自车和各个博弈对象的博弈策略,然后将自车的博弈策略与各个博弈对象的博弈策略组合,得到自车和各个博弈对象的博弈策略的集合,从而保证每个采样博弈空间中的博弈策略的合理性。
[0013]在一种实施方式中,该方法还包括:根据自车和该博弈对象与冲突点之间的距离、该自车和该博弈对象中每一个障碍物的所述至少一个博弈策略,确定每一个博弈策略的行为标签,该冲突点为自车与障碍物的预测运动轨迹相交的位置或自车与障碍物之间的距离小于设定阈值的位置,该行为标签包括自车让行、自车抢行、自车和障碍物均让行中的至少一个。
[0014]在该实施方式中,通过对每个博弈策略标注标签,以便后续选择出博弈结果后,可以直接将博弈策略的标签发送给下一层的执行单元,不需要再根据博弈策略中双方采取的博弈方式,分析出自车在此次博弈过程中该采取的自车让行、自车抢行或自车和障碍物均让行,从而大大减少决策时间,提高用户体验。
[0015]在一种实施方式中,该计算每一个博弈策略的策略代价,包括:确定策略代价的各个因素,该策略代价的各个因素包括安全性、舒适性、通过效率、路权、障碍物的先验概率和历史决策关联性中至少一个;计算每一个策略代价中的每一个因素的因素代价;将该每一个策略代价中的每一个因素的因素代价进行加权,得到该每一个博弈策略的策略代价。
[0016]在该实施方式中,在计算各个博弈策略的策略代价时,可以通过计算各个因素的代价,再将各个因素的代价进行加权计算,得到每种博弈策略代价,以便确定每个博弈策略的合理程度。
[0017]在一种实施方式中,在该计算每一个博弈策略的策略代价之后,还包括:比较策略
代价中的每一个因素是否在设定范围内;删除包括任意一个不在设定范围内的因素的策略代价对应的博弈策略。
[0018]在该实施方式中,通过将不合理的博弈策略删除,避免后续因选择出的策略结果为不合理的博弈策略,导致决策结果不能执行或错误,从而降低决策方法的可靠性。
[0019]在一种实施方式中,该方法还包括:检测到该自车的决策结果不在该自车的可行域内,输出自车让行的决策结果。
[0020]在该实施方式中,如果输出的决策结果不在自车的可行域内,表明此次决策结果均不符合条件,自车将不输出决策结果,这种情况等同于自车没有进行博弈过程,存在严重的缺陷,所以在无法确定决策结果时,按照“安全性”的原则,选择“自车让行”作为决策结果,从而保证自车选择出来的决策结果可以让自车在行驶过程中是安全的。
[0021]第二方面,本申请提供一种决策装置,包括:收发单元本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种决策方法,其特征在于,包括:获取自车和自车周围各个障碍物的预测运动轨迹;确定博弈对象,所述博弈对象为所述自车周围各个障碍物中与所述自车的预测运动轨迹相交或与自车之间的距离小于设定阈值的障碍物;根据传感器系统采集的自车的车辆信息、所述博弈对象的障碍物信息和路况信息,分别对每个所述博弈对象构建一个采样博弈空间,每一个采样博弈空间均包括至少一个博弈策略;计算每一个博弈策略的策略代价,所述策略代价为将策略代价的各个因素权重进行加权得到的数值;确定自车的决策结果,所述决策结果为共有采样博弈空间中策略代价最小的博弈策略,所述共有采样博弈空间包括至少一个博弈策略,所述每一个采样博弈空间中均包括所述共有采样博弈空间中的博弈策略。2.根据权利要求1所述的方法,其特征在于,所述确定自车的决策结果,包括:构建所述每一个采样博弈空间的可行域,所述每一个采样博弈空间的可行域为符合设定要求的策略代价对应的至少一个博弈策略;在所有采样博弈空间的可行域交集中,确定出相同博弈策略中策略代价最小的博弈策略。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:确定非博弈对象,所述非博弈对象为所述自车周围各个障碍物中与所述自车的预测运动轨迹不相交或与自车之间的距离不小于设定阈值的障碍物;根据传感器系统采集的所述自车的车辆信息、所述非博弈对象的障碍物信息和所述路况信息,构建所述自车的可行域,所述自车的可行域为所述自车在不碰撞所述非博弈对象情况下采取不同决策的至少一个策略;检测到所述自车的决策结果在所述自车的可行域内,输出所述自车的决策结果。4.根据权利要求1

3任意一项所述的方法,其特征在于,所述根据传感器系统采集的自车的车辆信息、所述博弈对象的障碍物信息和路况信息,分别对每个所述博弈对象构建一个采样博弈空间,包括:根据所述自车的车辆信息、所述博弈对象的障碍物信息和所述路况信息,确定所述自车和所述博弈对象中每一个障碍物的决策上限和决策下限;按照设定规则,在所述自车和所述博弈对象中每一个障碍物的决策上限和决策下限中,获取所述自车和所述博弈对象中每一个障碍物的决策策略;将所述自车的决策策略与所述博弈对象中每一个障碍物的决策策略组合,得到自车和所述博弈对象中每一个障碍物的所述至少一个博弈策略。5.根据权利要求1

4任意一项所述的方法,其特征在于,所述方法还包括:根据自车和所述博弈对象与冲突点之间的距离、所述自车和所述博弈对象中每一个障碍物的所述至少一个博弈策略,确定每一个博弈策略的行为标签,所述冲突点为自车与障碍物的预测运动轨迹相交的位置或自车与障碍物之间的距离小于设定阈值的位置,所述行为标签包括自车让行、自车抢行、自车和障碍物均让行中的至少一个。6.根据权利要求1

5任意一项所述的方法,其特征在于,所述计算每一个博弈策略的策
略代价,包括:确定策略代价的各个因素,所述策略代价的各个因素包括安全性、舒适性、通过效率、路权、障碍物的先验概率和历史决策关联性中至少一个;计算每一个策略代价中的每一个因素的因素代价;将所述每一个策略代价中的每一个因素的因素代价进行加权,得到所述每一个博弈策略的策略代价。7.根据权利要求1

6任意一项所述的方法,其特征在于,在所述计算每一个博弈策略的策略代价之后,还包括:比较策略代价中的每一个因素是否在设定范围内;删除包括任意一个不在设定范围内的因素的策略代价对应的博弈策略。8.根据权利要求1

7任意一项所述的方法,其特征在于,所述方法还包括:检测到所述自车的决策结果不在所述自车的可行域内,输出自车让行的决策结果。9.一种决策装置,其特征在于,包括:收发单元,用于获取自车和自车周围各个障碍物的预测运动轨迹;处理单元,用于确定博弈对象,所述博弈对象为所述自车周围各个障碍物中与所述自车的预测运动轨迹相交或与自车之间的距离小于设定阈值的障碍物;根据传感器系统采集的自车的车辆信息、所述博弈对象的障碍物信息和路况信息,分别对每个所述博弈对象构建一个采样博弈空间,每一个采样...

【专利技术属性】
技术研发人员:程思源郝东浩杨绍宇王新宇
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1