智能车行为决策方法、规划方法、系统及存储介质技术方案

技术编号:34629994 阅读:12 留言:0更新日期:2022-08-20 09:42
本申请涉及自动驾驶的技术领域,尤其涉及一种智能车行为决策方法、规划方法、系统及存储介质,决策方法包括:在自车进入交叉口准备左转且存在对向车的情况下,判断所述对向车是否处于预设的风险区域;如果是,则将所述对向车作为自车的博弈对象;利用博弈模型构建所述自车与博弈对象的收益函数;基于元模型的优化算法对所述收益函数进行求解,得到决策结果。为实现智能驾驶车辆与有人驾驶车辆间的交互决策,选取自车和对向直行车作为博弈双方,并构建博弈双方的收益函数,然后将博弈模型转化为双层优化问题进行求解。通过在交互过程中获取对向车的意图,有助于提高智能车辆决策结果的合理性与准确性。的合理性与准确性。的合理性与准确性。

【技术实现步骤摘要】
智能车行为决策方法、规划方法、系统及存储介质


[0001]本申请涉及自动驾驶的
,尤其是涉及一种智能车行为决策方法、规划方法、系统及存储介质。

技术介绍

[0002]随着智能驾驶技术的不断发展,城市场景成为关注的重心,而城市交叉口的通行问题成为制约技术发展的关键因素之一。区别于园区,港口等交通参与者少,路线固定的场景,城市交叉口因其动态与不确定性而难以处理。因此,在园区等环境中有效运行的算法不再适用于城市交叉口,行为决策模块需要更加灵活。
[0003]现有主流的行为决策方法主要有简单易操作的规则模型,针对不确定性的统计模型,以及考虑环境和交互的学习模型,以下将对一些主要模型进行说明:(1)基于规则的行为决策模型,即根据交通规则,驾驶经验,专家知识等构建决策规则库,同时根据不同的交通环境划分不同的行驶状态,车辆按照决策规则进行状态转移和动作选择。此类方法既可用于不同场景间的转移,也可用于某一场景中智能车辆采取不同动作之间的转移,具有简易,逻辑清晰的优点。但该方法的场景构建过于简单,细节表达不清晰;且场景构建有限,难以增量式更新规则。
[0004](2)基于知识和学习的行为决策模型,该模型均需要依靠人类驾驶经验,并将其整理为离散的驾驶属性,模型简单,易于编程。可是,一旦场景复杂,属性增多,状态机和决策树都会变得十分庞大,容易出错,且对环境建模不完善。
[0005](3)基于统计的行为决策模型,该模型能够有效地考虑到实际交通中的不确定性问题,也能够实现与交通环境(包括其它的交通参与者)的交互,场景遍历更深。但是也存在模型复杂,计算求解难度大,“维度灾难”带来的实用性等问题。
[0006]由于现有的行为决策模型大都忽略车辆间交互这一关键特征,导致智能车辆无法做出合理有效的决策。

技术实现思路

[0007]为了在交叉口无保护左转的场景下,提高智能车辆决策结果的合理性,本申请提供一种智能车行为决策方法、规划方法、系统及存储介质。
[0008]第一方面,本申请提供的一种智能车行为决策方法,采用如下的技术方案:一种智能车行为决策方法,包括:在自车进入交叉口准备左转且存在对向车的情况下,判断所述对向车是否处于预设的风险区域;如果是,则将所述对向车作为自车的博弈对象;利用博弈模型构建所述自车与博弈对象的收益函数;基于元模型的优化算法对所述收益函数进行求解,得到决策结果。
[0009]通过采用上述技术方案,为实现智能驾驶车辆与有人驾驶车辆间的交互决策,选取自车和对向直行车作为博弈双方,并构建博弈双方的收益函数,然后将博弈模型转化为
双层优化问题进行求解。通过在交互过程中获取对向车的意图,有助于提高智能车辆决策结果的合理性与准确性。
[0010]可选的,所述构建所述自车与博弈对象的收益函数步骤之前,还包括:根据上游感知和预测信息,获取所述博弈对象的状态变量;其中,所述状态变量包括位置、速度和加速度;基于所述状态变量,得到博弈对象的驾驶风格。
[0011]可选的,所述基于所述状态变量,得到博弈对象的驾驶风格步骤,包括:利用模糊逻辑系统对所述状态变量进行模糊化处理,并根据预设的决策规则,得到初始驾驶风格;基于所述初始驾驶风格,采用自适应神经模糊推理系统对构建的驾驶行为数据集进行训练,得到二次驾驶风格;基于所述二次驾驶风格,利用长短期记忆神经网络对时序性数据进行训练,得到驾驶风格。
[0012]可选的,所述利用博弈模型构建所述自车与博弈对象的收益函数步骤,具体包括:利用博弈模型从安全、效率和舒适三个部分构建收益函数,并将所述博弈对象的驾驶风格转化为权重反映在收益函数中。
[0013]第二方面,本申请提供的一种智能车行为规划方法,采用如下的技术方案:一种智能车行为规划方法,包括:根据所述决策结果得到纵向规划轨迹。
[0014]可选的,所述根据决策结果得到纵向规划轨迹步骤,具体包括:根据自车的纵向位移与速度构建坐标系,并将博弈对象占据的区间反映在坐标系上;对构建的坐标系进行动态规划,得到纵向折线;对所述纵向折线进行平滑处理,得到纵向规划轨迹。
[0015]可选的,所述博弈对象占据的区间为自车与博弈对象存在的冲突区域;其中,所述冲突区域为博弈对象预测轨迹点和自车路径的采样点重叠的区域。
[0016]可选的,所述对构建的坐标系进行动态规划,得到纵向折线步骤,包括:在规划时间范围内每隔预设时间间隔将纵向位移离散化为不均匀的采样点;计算所述采样点的代价值,并选择一条代价值最低的纵向折线。
[0017]第三方面,本申请提出的一种智能车行为决策规划系统,采用如下的技术方案:一种智能车行为决策规划系统,包括:博弈对象判断模块,被配置为在自车进入交叉口准备左转且存在对向车的情况下,判断所述对向车是否处于预设的风险区域;如果是,则将所述对向车作为自车的博弈对象;收益函数构建模块,被配置为构建所述自车与博弈对象的收益函数;模型求解模块,被配置为基于元模型的优化算法对所述收益函数进行求解,得到决策结果;速度规划模块,被配置为根据所述决策结果得到纵向规划轨迹。
[0018]第四方面,本申请提供的一种计算机可读存储介质,采用如下的技术方案:
一种计算机可读存储介质,存储有能够被处理器加载并执行如第一方面所述的计算机程序。
[0019]综上所述,本申请包括以下至少一种有益技术效果:1.首先利用简单的模糊逻辑系统通过对速度和加速度模糊化来判定驾驶风格;其次对驾驶行为数据集使用自适应神经模糊推理系统进行训练以提高判定准确率;最后利用长短期记忆人工神经网络学习时序性数据,以充分考虑驾驶风格的时变特性,有助于提高驾驶风格判断的准确性;2.在考虑对向车驾驶风格的基础上构建博弈模型来推理两车行为间相互影响的过程。首先分析无保护左转场景的特点,筛选博弈对象,并据此构建模型;其次,综合考虑了驾驶安全性,舒适性和和效率三个部分建立模型中各参与者的收益函数,并将预判得到的对向车驾驶风格转化为权重反映在其收益函数中;最后,将此博弈模型转化为双层优化问题进行求解,得到本车的驾驶策略,指导其纵向速度规划得到最终的纵向规划轨迹;本申请从车辆间实际交互过程出发,兼顾安全性和高效性,从而提高了决策结果的合理性。
附图说明
[0020]图1是本申请示出的自动驾驶系统的框图。
[0021]图2是本申请示出的车辆行驶路径将城市交叉口场景图。
[0022]图3是本申请示出的智能车行为决策方法与规划方法的整体流程图。
[0023]图4是本申请其中一实施例示出的智能车行为决策方法的风险区域的结构图。
[0024]图5是本申请其中一实施例示出的智能车行为决策方法中自适应神经模糊推理系统的结构图。
[0025]图6是本申请其中一实施例示出的智能车行为决策方法中轨迹拟合结构图。
[0026]图7是本申请其中一实施例示出的智能车行为决策方法中显示车辆与目标位置距离的结构图。
[0027]图8是本申请其中一实施例示出的智能车行为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能车行为决策方法,其特征在于,包括:在自车进入交叉口准备左转且存在对向车的情况下,判断所述对向车是否处于预设的风险区域;如果是,则将所述对向车作为自车的博弈对象;利用博弈模型构建所述自车与博弈对象的收益函数;基于元模型的优化算法对所述收益函数进行求解,得到决策结果。2.根据权利要求1所述的一种智能车行为决策方法,其特征在于,所述构建所述自车与博弈对象的收益函数步骤之前,还包括:根据上游感知和预测信息,获取所述博弈对象的状态变量;其中,所述状态变量包括位置、速度和加速度;基于所述状态变量,得到博弈对象的驾驶风格。3.根据权利要求2所述的一种智能车行为决策方法,其特征在于,所述基于所述状态变量,得到博弈对象的驾驶风格步骤,包括:利用模糊逻辑系统对所述状态变量进行模糊化处理,并根据预设的决策规则,得到初始驾驶风格;基于所述初始驾驶风格,采用自适应神经模糊推理系统对构建的驾驶行为数据集进行训练,得到二次驾驶风格;基于所述二次驾驶风格,利用长短期记忆神经网络对时序性数据进行训练,得到驾驶风格。4.根据权利要求2或3所述的一种智能车行为决策方法,其特征在于,所述利用博弈模型构建所述自车与博弈对象的收益函数步骤,具体包括:利用博弈模型从安全、效率和舒适三个部分构建收益函数,并将所述博弈对象的驾驶风格转化为权重反映在收益函数中。5.一种智能车行为规划方法,其特征在于,所述方法基于权利要求1

4任一所述的智能车行为决策方法,包括:根据所述决...

【专利技术属性】
技术研发人员:陈雪梅韩欣彤孔令兴杨宏伟姚诚达
申请(专利权)人:山东汇创信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1