当前位置: 首页 > 专利查询>清华大学专利>正文

预测型智能汽车决策控制方法、装置、车辆及存储介质制造方法及图纸

技术编号:32457845 阅读:16 留言:0更新日期:2022-02-26 08:39
本申请涉及涉及一种预测型智能汽车决策控制方法、装置、车辆及存储介质,方法包括:基于地图信息和交通参与者的历史轨迹,对周围交通参与者建立预测模型,并利用有标签的数据集对预测模型进行参数初始化,生成初始周车运动预测模型;以智能汽车的驾驶目标作为优化对象,根据与环境的不断交互数据循环更新初始周车运动预测模型,生成最终周车运动预测模型;将最终周车运动预测模型嵌入智能汽车的决策控制系统,使得决策控制系统根据最终周车运动预测模型预测的周车运动生成对应的决策控制指令,并控制智能汽车执行决策控制指令,从而通过迭代模型驱动的自进化式策略评估与策略提升过程,实现智能车辆预测型最优策略求解方案。案。案。

【技术实现步骤摘要】
预测型智能汽车决策控制方法、装置、车辆及存储介质


[0001]本申请涉及自动驾驶的应用
,特别涉及一种预测型智能汽车决策控制方法、装置、车辆及存储介质。

技术介绍

[0002]交通环境的动态性、复杂性和交通参与者间的交互性给智能汽车的决策控制系统带来了巨大的挑战。其中,交通参与者运动趋势的不确定性(例如:未来可能的轨迹或意图)对于智能汽车的决策控制结果有着不容忽视的影响。因此,准确预测周围交通参与者的运动趋势,对于动态交通环境下智能汽车的决策控制具有重要意义。
[0003]相关技术中,往往将预测过程和决策控制过程分解,构成“预测

决策控制”开环型方案。其次,先前的方法大多通过光栅化地图信息的编码方式,依靠感受野或者记忆力机制捕捉空间或时间维度的信息,获得概率意义下多样的预测结果。
[0004]然而,感受野的局部结构或者记忆模块的长度限制使得捕捉空间或时间上遥远的相互作用具有一定挑战,预测结果存在着脱离实际安全区域的可能,这样的预测结果将无法对智能汽车的决策控制任务产生有效指导。
[0005]申请内容
[0006]本申请提供一种预测型智能汽车决策控制方法、装置、车辆及存储介质,以解决了相关技术中的“预测

决策控制”开环型方案中预测结果缺乏对决策控制过程有效指导的问题,通过迭代模型驱动的自进化式策略评估与策略提升过程,实现智能车辆预测型最优策略求解方案。
[0007]本申请第一方面实施例提供一种预测型智能汽车决策控制方法,包括以下步骤:
[0008]基于地图信息和交通参与者的历史轨迹,对周围交通参与者建立预测模型,并利用有标签的数据集对所述预测模型进行参数初始化,生成初始周车运动预测模型;
[0009]以智能汽车的驾驶目标作为优化对象,根据与环境的不断交互数据循环更新所述初始周车运动预测模型,生成最终周车运动预测模型;以及
[0010]将所述最终周车运动预测模型嵌入所述智能汽车的决策控制系统,使得所述决策控制系统根据所述最终周车运动预测模型预测的周车运动生成对应的决策控制指令,并控制所述智能汽车执行所述决策控制指令。
[0011]可选地,所述基于地图信息和交通参与者的历史轨迹,对周围交通参与者建立预测模型,并利用有标签的数据集对所述预测模型进行参数初始化,生成初始周车运动预测模型,包括:
[0012]对数据集中的所述地图信息和所述历史轨迹进行向量化编码。
[0013]可选地,所述以智能汽车的驾驶目标作为优化对象,根据与环境的不断交互数据循环更新所述初始周车运动预测模型,生成最终周车运动预测模型,包括:
[0014]对输入的节点特征进行基于图神经网络的消息传递聚合更新,并在聚合特征层面进行基于注意力机制的多轴信息传递,得到新聚合特征;
[0015]解码所述新聚合特征,将输出的意图预测概率和预测轨迹与所述数据集中的真值计算最小二次误差,得到更新预测模型的目标函数与梯度,并对所述预测模型的参数进行反向传播更新,得到所述最终周车运动预测模型。
[0016]可选地,所述使得所述决策控制系统根据所述最终周车运动预测模型预测的周车运动生成对应的决策控制指令,包括:
[0017]利用所述最终周车运动预测模型前向递推得到自车感知范围内周车未来有限步的状态,并计算不确定性度量指标;
[0018]根据所述周车未来有限步的状态和不确定性度量指标获取自车未来有限步状态,并基于所述决策控制系统得到价值函数,并计算对应更新的目标函数和梯度;
[0019]根据所述目标函数和梯度更新所述决策控制系统的参数的同时,得到最优控制策略,生成所述决策控制指令。
[0020]可选地,所述使得所述决策控制系统根据所述最终周车运动预测模型预测的周车运动生成对应的决策控制指令,还包括:
[0021]检测所述最优控制策略是否满足安全阈值条件;
[0022]如果满足所述安全阈值条件,则生成所述决策控制指令,否则重新向前递推所述自车感知范围内周车未来有限步的状态,并计算所述不确定性度量指标。本申请第二方面实施例提供一种预测型智能汽车决策控制装置,包括:
[0023]第一生成模块,用于基于地图信息和交通参与者的历史轨迹,对周围交通参与者建立预测模型,并利用有标签的数据集对所述预测模型进行参数初始化,生成初始周车运动预测模型;
[0024]第二生成模块,用于以智能汽车的驾驶目标作为优化对象,根据与环境的不断交互数据循环更新所述初始周车运动预测模型,生成最终周车运动预测模型;以及
[0025]控制模块,用于将所述最终周车运动预测模型嵌入所述智能汽车的决策控制系统,使得所述决策控制系统根据所述最终周车运动预测模型预测的周车运动生成对应的决策控制指令,并控制所述智能汽车执行所述决策控制指令。
[0026]可选地,所述第一生成模块,具体用于:
[0027]对数据集中的所述地图信息和所述历史轨迹进行向量化编码。
[0028]可选地,所述第二生成模块,具体用于:
[0029]对输入的节点特征进行基于图神经网络的消息传递聚合更新,并在聚合特征层面进行基于注意力机制的多轴信息传递,得到新聚合特征;
[0030]解码所述新聚合特征,将输出的意图预测概率和预测轨迹与所述数据集中的真值计算最小二次误差,得到更新预测模型的目标函数与梯度,并对所述预测模型的参数进行反向传播更新,得到所述最终周车运动预测模型。
[0031]可选地,所述控制模块,具体用于:
[0032]利用所述最终周车运动预测模型前向递推得到自车感知范围内周车未来有限步的状态,并计算不确定性度量指标;
[0033]根据所述周车未来有限步的状态和不确定性度量指标获取自车未来有限步状态,并基于所述决策控制系统得到价值函数,并计算对应更新的目标函数和梯度;
[0034]根据所述目标函数和梯度更新所述决策控制系统的参数的同时,得到最优控制策
略,生成所述决策控制指令。
[0035]可选地,所述控制模块,还用于:
[0036]检测所述最优控制策略是否满足安全阈值条件;
[0037]如果满足所述安全阈值条件,则生成所述决策控制指令,否则重新向前递推所述自车感知范围内周车未来有限步的状态,并计算所述不确定性度量指标。
[0038]本申请第三方面实施例提供一种车辆,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的预测型智能汽车决策控制方法。
[0039]本申请第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如上述实施例所述的预测型智能汽车决策控制方法。
[0040]由此,通过对周围交通参与者建立能够描述不确定性的可解释型预测模型,耦合入智能汽车的决策控制过程,解决了相关技术中的“预测

决策控制本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预测型智能汽车决策控制方法,其特征在于,包括以下步骤:基于地图信息和交通参与者的历史轨迹,对周围交通参与者建立预测模型,并利用有标签的数据集对所述预测模型进行参数初始化,生成初始周车运动预测模型;以智能汽车的驾驶目标作为优化对象,根据与环境的不断交互数据循环更新所述初始周车运动预测模型,生成最终周车运动预测模型;以及将所述最终周车运动预测模型嵌入所述智能汽车的决策控制系统,使得所述决策控制系统根据所述最终周车运动预测模型预测的周车运动生成对应的决策控制指令,并控制所述智能汽车执行所述决策控制指令。2.根据权利要求1所述的方法,其特征在于,所述基于地图信息和交通参与者的历史轨迹,对周围交通参与者建立预测模型,并利用有标签的数据集对所述预测模型进行参数初始化,生成初始周车运动预测模型,包括:对数据集中的所述地图信息和所述历史轨迹进行向量化编码。3.根据权利要求1所述的方法,其特征在于,所述以智能汽车的驾驶目标作为优化对象,根据与环境的不断交互数据循环更新所述初始周车运动预测模型,生成最终周车运动预测模型,包括:对输入的节点特征进行基于图神经网络的消息传递聚合更新,并在聚合特征层面进行基于注意力机制的多轴信息传递,得到新聚合特征;解码所述新聚合特征,将输出的意图预测概率和预测轨迹与所述数据集中的真值计算最小二次误差,得到更新预测模型的目标函数与梯度,并对所述预测模型的参数进行反向传播更新,得到所述最终周车运动预测模型。4.根据权利要求1所述的方法,其特征在于,所述使得所述决策控制系统根据所述最终周车运动预测模型预测的周车运动生成对应的决策控制指令,包括:利用所述最终周车运动预测模型前向递推得到自车感知范围内周车未来有限步的状态,并计算不确定性度量指标;根据所述周车未来有限步的状态和不确定性度量指标获取自车未来有限步状态,并基于所述决策控制系统得到价值函数,并计算对应更新的目标函数和梯度;根据所述目标函数和梯度更新所述决策控制系统的参数的同时,得到最优控制策略,生成所述决策控制指令。5.根据权利要求4所述的方法,其特征在于,所述使得所述决策控制系统根据所述最终周车运动预测模型预测的周车运动生成对应的决策控制指令,还包括:检测所述最优控制策略是否满足安全阈值条件;如果满足所述安全阈值条件,则生成所述决策控制指令,否则重新向前递推所述自车感知范围内周车未来有限步的状态,并计算所述不确定性度量指标。6.一种预测型智能汽车决策控制装置,其特征在于,...

【专利技术属性】
技术研发人员:郑四发谷子青马海铜李升波王建强许庆
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1