一种控制参数确定方法、装置、设备、存储介质及车辆制造方法及图纸

技术编号:36340998 阅读:13 留言:0更新日期:2023-01-14 17:54
本申请涉及自动驾驶控制技术领域,尤其涉及一种控制参数确定方法、装置、设备、存储介质及车辆。该方法包括:在驾驶对象辅助控制的情况下,获取车辆在自动驾驶时的状态数据;将状态数据输入到控制参数确定模型,得到控制参数确定模型输出的控制参数;其中,控制参数确定模型为基于更新训练样本数据对初始控制参数确定模型进行迭代训练得到;确定控制参数对应的控制误差数据;在控制误差数据满足预设控制条件的情况下,根据控制参数确定车辆的自动驾驶控制参数。通过强化学习的方法实时在线对自动驾驶控制参数进行自动标定,该方案无需人工在多种场景下进行调参,即可得到满足控制精度要求控制参数。要求控制参数。要求控制参数。

【技术实现步骤摘要】
一种控制参数确定方法、装置、设备、存储介质及车辆


[0001]本申请涉及自动驾驶控制
,尤其涉及一种控制参数确定方法、装置、设备、存储介质及车辆。

技术介绍

[0002]目前,自动驾驶控制领域所采用的控制算法多种多样,例如PID(Proportional Integral Derivative,比例、积分和微分)控制算法、线性二次型调节器(linear quadratic regulator,LQR)、模型预测控制(Model Predictive Control,MPC)算法等。上述控制算法中,其控制参数为标定量。在算法开发阶段需要进行实车调试,以确定一组最优的控制参数并应用于后续的实车运行中。
[0003]通常,控制算法的控制参数标定时,通过在自动驾驶车辆内,手动调整控制参数,每调整一次参数重复行驶一段特定工况道路。当前工况控制效果最优后,进行下一段特定工况的参数标定,通过不断进行参数的优化使控制参数满足大部分的行驶工况。在控制参数标定期间,往往需要大量的重复工作和参数尝试,耗费人力物力。即使如此,通过人工调试的参数也可能始终无法达到理想控制精度。此外,上述控制参数标定后所确定的控制参数,无法完全适配所有车型,对于不同车型仍需要重复进行调参及标定。而且,一旦某类型车辆确定自动驾驶控制算法后,无法再更换新的控制算法,导致车辆的自动驾驶控制可扩展性低下。

技术实现思路

[0004]本申请提供一种自动驾驶控制参数确定方法、装置、设备、存储介质及车辆,通过强化学习的方法实时在线对自动驾驶控制参数进行自动标定,该方案无需人工在多种场景下进行调参,即可得到满足控制精度要求控制参数。
[0005]第一方面,本申请实施例公开了一种自动驾驶控制参数确定方法,该方法包括:
[0006]在驾驶对象辅助控制的情况下,获取车辆在自动驾驶时的状态数据;
[0007]将状态数据输入到控制参数确定模型,得到控制参数确定模型输出的控制参数;其中,控制参数确定模型为基于更新训练样本数据对初始控制参数确定模型进行迭代训练得到;更新训练样本数据为基于样本状态数据、样本状态数据对应的样本控制参数和样本优化控制数据确定得到;样本优化控制数据用于评估车辆在样本预测控制参数下的自动驾驶性能,样本预测控制参数为基于初始控制参数确定模型对更新训练样本数据进行预测得到;
[0008]确定控制参数对应的控制误差数据;
[0009]在控制误差数据满足预设控制条件的情况下,根据控制参数确定车辆的自动驾驶控制参数。
[0010]进一步的,确定控制参数对应的控制误差数据,包括:
[0011]根据控制参数,确定控制车辆的车辆控制数据;
[0012]根据车辆控制数据控制车辆,得到车辆的位置数据;
[0013]获取车辆的期望轨迹数据;
[0014]根据位置数据和期望轨迹数据,确定控制参数对应的控制误差数据。
[0015]进一步的,该方法还包括:
[0016]获取矫正控制数据;矫正控制数据用于对车辆控制数据进行矫正;
[0017]基于矫正控制数据和控制误差数据确定控制参数对应的优化控制数据;
[0018]将状态数据和状态数据对应的控制参数,以及控制参数对应的优化控制数据添加至到初始训练样本数据中,得到更新训练样本数据;
[0019]将更新训练样本数据输入初始控制参数确定模型进行控制参数预测训练,得到样本预测控制参数;
[0020]基于样本预测控制参数和样本控制参数之间的差异信息,调整初始控制参数确定模型的模型参数,直至满足预设训练结束条件,得到控制参数确定模型。
[0021]进一步的,控制误差数据包括当前控制参数对应的当前控制误差数据;当前控制参数对应的时刻为当前时刻;
[0022]在控制误差数据满足预设控制条件的情况下,根据控制参数确定车辆的自动驾驶控制参数,包括:
[0023]在当前控制误差数据满足预设控制条件的情况下,获取自当前时刻至未来预设时间段内的控制参数集合;控制参数集合包括多个控制参数;
[0024]确定每个控制参数各自对应的控制误差数据;
[0025]在每个控制误差数据均满足预设控制条件的情况下,根据控制参数集合中的控制参数确定车辆的自动驾驶控制参数。
[0026]进一步的,在每个控制误差数据均满足预设控制条件的情况下,根据控制参数集合中的控制参数确定车辆的自动驾驶控制参数,包括:
[0027]在每个控制误差数据均满足预设控制条件的情况下,在控制参数集合中,确定控制误差数据小于误差阈值的控制参数;
[0028]将控制误差数据小于误差阈值的控制参数,作为车辆的自动驾驶控制参数。
[0029]进一步的,在每个控制误差数据均满足预设控制条件的情况下,根据控制参数集合中的控制参数确定车辆的自动驾驶控制参数,包括:
[0030]在每个控制误差数据均满足预设控制条件的情况下,确定控制参数集合中的控制参数的离散程度值;
[0031]在离散程度值小于离散程度阈值的情况下,根据控制参数集合中的控制参数确定车辆的自动驾驶控制参数。
[0032]进一步的,在离散程度值小于离散程度阈值的情况下,根据控制参数集合中的控制参数确定车辆的自动驾驶控制参数,包括:
[0033]在离散程度值小于离散程度阈值的情况下,确定控制参数集合中的控制参数的平均值;
[0034]将控制参数的平均值,作为车辆的自动驾驶控制参数。
[0035]第二方面,本申请实施例公开了一种自动驾驶控制参数确定装置,该装置包括:
[0036]状态数据获取模块,用于在驾驶对象辅助控制的情况下,获取车辆在自动驾驶时
的状态数据;
[0037]控制参数确定模块,用于将状态数据输入到控制参数确定模型,得到控制参数确定模型输出的控制参数;其中,控制参数确定模型为基于更新训练样本数据对初始控制参数确定模型进行迭代训练得到;更新训练样本数据为基于样本状态数据、样本状态数据对应的样本控制参数和样本优化控制数据确定得到;样本优化控制数据用于评估车辆在样本预测控制参数下的自动驾驶性能,样本预测控制参数为基于初始控制参数确定模型对更新训练样本数据进行预测得到;
[0038]控制误差数据确定模块,用于确定控制参数对应的控制误差数据;
[0039]自动驾驶控制参数确定模块,用于在控制误差数据满足预设控制条件的情况下,根据控制参数确定车辆的自动驾驶控制参数。
[0040]在一些可选的实施方式中,控制误差数据确定模块包括:
[0041]车辆控制数据确定单元,用于根据控制参数,确定控制车辆的车辆控制数据;
[0042]位置数据确定单元,用于根据车辆控制数据控制车辆,得到车辆的位置数据;
[0043]位置数据获取单元,用于获取车辆的位置数据;
[0044]控制误差数据确定单元,用于根据位置数据和期望轨迹数据,确定控制参数对应的控制误差数据。...

【技术保护点】

【技术特征摘要】
1.一种自动驾驶控制参数确定方法,其特征在于,所述方法包括:在驾驶对象辅助控制的情况下,获取车辆在自动驾驶时的状态数据;将所述状态数据输入到控制参数确定模型,得到所述控制参数确定模型输出的控制参数;其中,所述控制参数确定模型为基于更新训练样本数据对初始控制参数确定模型进行迭代训练得到;所述更新训练样本数据为基于样本状态数据、所述样本状态数据对应的样本控制参数和样本优化控制数据确定得到;所述样本优化控制数据用于评估所述车辆在样本预测控制参数下的自动驾驶性能,所述样本预测控制参数为基于所述初始控制参数确定模型对所述更新训练样本数据进行预测得到;确定所述控制参数对应的控制误差数据;在所述控制误差数据满足预设控制条件的情况下,根据所述控制参数确定所述车辆的自动驾驶控制参数。2.根据权利要求1所述的方法,其特征在于,所述确定所述控制参数对应的控制误差数据,包括:根据所述控制参数,确定控制所述车辆的车辆控制数据;根据所述车辆控制数据控制所述车辆,得到所述车辆的位置数据;获取所述车辆的期望轨迹数据;根据所述位置数据和所述期望轨迹数据,确定所述控制参数对应的控制误差数据。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取矫正控制数据;所述矫正控制数据用于对所述车辆控制数据进行矫正;基于所述矫正控制数据和所述控制误差数据确定所述控制参数对应的优化控制数据;将所述状态数据和所述状态数据对应的所述控制参数,以及所述控制参数对应的所述优化控制数据添加至到初始训练样本数据中,得到更新训练样本数据;将所述更新训练样本数据输入所述初始控制参数确定模型进行控制参数预测训练,得到所述样本预测控制参数;基于所述样本预测控制参数和所述样本控制参数之间的差异信息,调整所述初始控制参数确定模型的模型参数,直至满足预设训练结束条件,得到所述控制参数确定模型。4.根据权利要求1所述的方法,其特征在于,所述控制误差数据包括当前控制参数对应的当前控制误差数据;所述当前控制参数对应的时刻为当前时刻;所述在所述控制误差数据满足预设控制条件的情况下,根据所述控制参数确定所述车辆的自动驾驶控制参数,包括:在所述当前控制误差数据满足预设控制条件的情况下,获取自所述当前时刻至未来预设时间段内的控制参数集合;所述控制参数集合包括多个所述控制参数;确定每个所述控制参数各自对应的所述控制误差数据;在每个所述控制误差数据均满足预设控制条件的情况下,根据所述控制参数集合中的所述控制参数确定所述车辆的自动驾驶控制参数。5.根据权利要求4所述的方法,其特征在于,所述在每个所述控制误差数据均满足预设控制条件的情况下,根据所述控制参数集合中的所述控制参数确定所述车辆的自动驾驶控...

【专利技术属性】
技术研发人员:雷鹏
申请(专利权)人:中汽创智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1