用于调谐机动车辆的轨迹跟踪控制器的系统技术方案

技术编号：40391495 阅读：8 留言：0更新日期：2024-02-20 22:22

提供了用于调谐机动车辆的轨迹跟踪控制器的系统。一种用于调谐车辆的轨迹跟踪控制器的系统包括：轨迹规划器，被配置为生成规划轨迹并输出代表规划轨迹的一个或多个规划轨迹分量；模型预测控制器，包括内部模型和优化器；以及调谐神经网络，被配置为接收一个或多个规划轨迹分量和一个或多个测量轨迹分量并产生成本函数的权重。内部模型被配置为接收来自优化器的预测控制输入以及一个或多个测量轨迹分量，并产生预测输出。优化器利用成本函数，并被配置为接收成本函数的权重和预测误差，并产生预测控制输入，其中预测误差是规划轨迹分量中的所选一个减去预测输出。

全部详细技术资料下载

【技术实现步骤摘要】

本公开总体上涉及用于调谐机动车辆的轨迹跟踪控制器的系统，并且更具体地涉及利用模型预测控制的这样的系统。

技术介绍

1、在自驾驶或辅助驾驶车辆领域中，模型预测控制器(mpc)或其他控制系统可以用于跟踪车辆的建议路线。在车辆上携带的各种传感器的辅助下，控制系统可以基于如已经标识的目的地、检测到的其他车辆的存在、速度和轨迹等这样的因素，通过对油门、制动器和转向系统执行一组正在进行的命令，试图使得车辆遵循建议的路线。该系统可以接收关于车辆的位置、速度和航向以及关于邻近和迎面而来的车辆的位置、速度和航向的正在进行的反馈，以便对建议的路线和发送到油门、制动器和转向系统的命令进行调整和更新。

技术实现思路

1、根据一个实施例，一种用于调谐机动车辆的轨迹跟踪控制器的系统包括轨迹规划器、mpc和调谐神经网络。轨迹规划器被配置为生成规划轨迹并输出代表规划轨迹的一个或多个规划轨迹分量。mpc包括机动车辆的内部模型和优化器。内部模型被配置为接收来自优化器的预测控制输入和来自机动车辆的一个或多个测量轨迹分量，并且还被配置为产生预测输出。优化器利用成本函数，并被配置为接收成本函数的多个权重和预测误差，并产生预测控制输入，其中预测误差是规划轨迹分量中的所选一个减去预测输出的和。调谐神经网络被配置为接收一个或多个规划轨迹分量和一个或多个测量轨迹分量，并产生成本函数的权重。

2、在该实施例中，由优化器产生的预测控制输入可以是机动车辆的转向命令、油门命令和制动器命令中的一个或多个，并且成本函数的权重可以由

3、该系统可以进一步包括被配置为接收一个或多个规划轨迹分量和一个或多个测量轨迹分量的评判神经网络，其中调谐神经网络和评判神经网络彼此协作，以利用寻求最小化成本函数的强化学习优化算法来调谐权重。

4、强化学习优化算法可以是接近策略优化算法、软行动者-评判家(soft actor-critic)算法、深度确定性策略梯度算法和双延迟深度确定性策略梯度算法中的一种。调谐神经网络和评判神经网络可以彼此协作以在训练阶段期间调谐权重。该系统可以进一步包括与优化器操作性地连接的存储权重的多维查找表。在机动车辆正常操作的部署阶段期间，mpc可以从多维查找表中检索存储权重。

5、根据另一个实施例，一种用于调谐机动车辆的轨迹跟踪控制器的系统包括：(i)轨迹规划器，被配置为生成规划轨迹并输出代表规划轨迹的一个或多个规划轨迹分量；(ii)mpc，包括机动车辆的内部模型和优化器，其中内部模型被配置为接收来自优化器的预测控制输入和来自机动车辆的一个或多个测量轨迹分量，并产生预测输出，并且其中优化器利用成本函数并被配置为接收成本函数的多个权重和预测误差，并产生预测控制输入，其中预测误差是规划轨迹分量中的所选一个减去预测输出的和；(iii)调谐神经网络，被配置为接收一个或多个规划轨迹分量和一个或多个测量轨迹分量，并产生成本函数的权重；以及(iv)评判神经网络，被配置为接收一个或多个规划轨迹分量和一个或多个测量轨迹分量。调谐神经网络和评判神经网络彼此协作，以利用寻求最小化成本函数的强化学习优化算法来调谐权重。

6、在该实施例中，由优化器产生的预测控制输入可以是机动车辆的转向命令、油门命令和制动器命令中的一个或多个，并且成本函数的权重可以由调谐神经网络产生的权重矩阵来表示。机动车辆可以在当前时间具有当前位置和当前速度，并且轨迹规划器可以为机动车辆针对作为当前时间之后的预定时间步长的下一时间生成规划下一位置和规划下一速度。在该布置中，一个或多个规划轨迹分量包括规划下一位置的向前分量、规划下一位置的横向分量和规划下一速度的量值中的一个或多个。

7、强化学习优化算法可以是接近策略优化算法、软行动者-评判家算法、深度确定性策略梯度算法和双延迟深度确定性策略梯度算法中的一种。调谐神经网络和评判神经网络可以彼此协作以在训练阶段期间调谐权重。该系统可以进一步包括与优化器操作性地连接的存储权重的多维查找表。在机动车辆正常操作的部署阶段期间，mpc可以从多维查找表中检索存储权重。

8、根据又一实施例，一种用于机动车辆的轨迹跟踪和调谐系统包括轨迹规划器、mpc、调谐神经网络和评判神经网络。轨迹规划器被配置为生成机动车辆的规划轨迹，并输出代表规划轨迹的一个或多个规划轨迹分量。mpc包括机动车辆的内部模型和优化器。内部模型被配置为接收来自优化器的预测控制输入和来自机动车辆的一个或多个测量轨迹分量，并产生预测输出。优化器利用成本函数，并被配置为接收成本函数的多个权重和预测误差，并产生预测控制输入。预测误差是规划轨迹分量中的所选一个减去预测输出的和，并且由优化器产生的预测控制输入是机动车辆的转向命令、油门命令和制动器命令中的一个或多个。

9、调谐神经网络被配置为接收一个或多个规划轨迹分量和一个或多个测量轨迹分量，并产生成本函数的权重。评判神经网络被配置为接收一个或多个规划轨迹分量和一个或多个测量轨迹分量。调谐神经网络和评判神经网络彼此协作，以利用寻求最小化成本函数的强化学习优化算法来调谐权重。

10、在该实施例中，机动车辆可以在当前时间具有当前位置和当前速度，并且轨迹规划器可以为机动车辆针对作为当前时间之后的预定时间步长的下一时间生成规划下一位置和规划下一速度。在该布置中，一个或多个规划轨迹分量包括规划下一位置的向前分量、规划下一位置的横向分量和规划下一速度的量值中的一个或多个。轨迹跟踪和调谐系统可以进一步包括与优化器操作性地连接的存储权重的多维查找表，其中mpc在机动车辆正常操作的部署阶段期间从多维查找表中检索存储权重。

11、当结合附图考虑时，本教导的上述特征和优点以及其他特征和优点从下面对如所附权利要求中限定的用于实行本教导的一些最佳模式和其他实施例的详细描述中是容易清楚的。

本文档来自技高网...

【技术保护点】

1.一种用于调谐机动车辆的轨迹跟踪控制器的系统，包括：

2.根据权利要求1所述的系统，其中由优化器产生的预测控制输入是机动车辆的转向命令、油门命令和制动器命令中的一个或多个。

3.根据权利要求1所述的系统，其中成本函数的权重由调谐神经网络产生的权重矩阵表示。

4.根据权利要求1所述的系统，其中机动车辆在当前时间具有当前位置和当前速度，并且轨迹规划器为机动车辆针对作为当前时间之后的预定时间步长的下一时间生成规划下一位置和规划下一速度，并且其中一个或多个规划轨迹分量包括以下各项中的一个或多个：

5.根据权利要求1所述的系统，进一步包括：

6.根据权利要求5所述的系统，其中强化学习优化算法是以下各项之一：

7.根据权利要求5所述的系统，其中调谐神经网络和评判神经网络彼此协作，以在训练阶段期间调谐权重。

8.根据权利要求1所述的系统，进一步包括：

9.根据权利要求8所述的系统，其中在机动车辆正常操作的部署阶段期间，MPC从多维查找表中检索存储权重。

10.一种用于机动车辆的轨迹跟踪和调谐系统，包括：

...

【技术特征摘要】

1.一种用于调谐机动车辆的轨迹跟踪控制器的系统，包括：

2.根据权利要求1所述的系统，其中由优化器产生的预测控制输入是机动车辆的转向命令、油门命令和制动器命令中的一个或多个。

3.根据权利要求1所述的系统，其中成本函数的权重由调谐神经网络产生的权重矩阵表示。

4.根据权利要求1所述的系统，其中机动车辆在当前时间具有当前位置和当前速度，并且轨迹规划器为机动车辆针对作为当前时间之后的预定时间步长的下一时间生成规划下一位置和规划下一速度，并且其中一个或多个规划轨迹分量包括...

【专利技术属性】
技术研发人员：A·苏萨，V·苏普林，
申请(专利权)人：通用汽车环球科技运作有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人