自动驾驶模型的构建方法、计算机设备及存储介质技术

技术编号：40676404 阅读：3 留言：0更新日期：2024-03-18 19:14

本申请提供了一种自动驾驶模型的构建方法、计算机设备及存储介质，方法通过获取智能体对应的预设仿真环境的环境信息，将环境信息输入至预训练的自动驾驶模型，自动驾驶模型根据环境信息输出预测驾驶信息；将预测驾驶信息输入至仿真模块，仿真模块用于在预设仿真环境中控制智能体执行预测驾驶信息；获取智能体执行预测驾驶信息对应的奖励信息；将奖励信息发送至训练模块，以使训练模块根据奖励信息完成对自动驾驶模型的优化，完成对自动驾驶模型的构建。所提供的方法能够轻松获取自动驾驶数据，并且所构建的自动驾驶模型在多智能体环境下的拟人性大幅提升，并大幅降低了自动驾驶模型的开发复杂度和计算时长。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能的，尤其涉及一种自动驾驶模型的构建方法、计算机设备及存储介质。

技术介绍

1、近年来，随着深度学习的快速发展，在一些控制决策领域，逐渐替代传统的规划和控制方法。而随着汽车电动化的到来，自动驾驶也成为当下的重点攻关技术，深度学习在自动驾驶的应用受到越来越多的关注。但是由于车辆驾驶的危险性，使得真实的自动驾驶数据收集变得极其困难和昂贵，并且在自动驾驶过程中，由于车辆所处的场景难以预测。

2、在自动驾驶这一兼具复杂竞争和合作关系的多智能体的开放环境中，采用传统的htn(hierarchical task network，分层任务网络)、goap(goal oriented actionplanning，目标导向型行动计划)或mcts(monte carlo tree search，蒙特卡罗树搜索)等方法，在多智能体环境下由于引入了更多的随机性，导致存在所控制的智能体拟人性差、长期规划计算耗时、在多智能体的情况下算法设计困难等问题。

技术实现思路

1、本申请提供了一种自动驾驶模型的构建方法、计算机设备及存储介质，旨在解决现有的自动驾驶数据收集变得极其困难和昂贵，并且通过多智能体环境训练自动驾驶模型的过程中由于引入了更多的随机性，导致存在所控制的智能体拟人性差、长期规划计算耗时、在多智能体的情况下算法设计困难等问题。

2、第一方面，本申请提供了一种自动驾驶模型的构建方法，包括：获取智能体对应的预设仿真环境的环境信息，将所述环境信息输入至预训练的自动驾

3、第二方面，本申请提供了一种计算机设备，所述计算机设备包括：存储器和处理器；其中，所述存储器与所述处理器连接，用于存储程序；所述处理器用于通过运行所述存储器中存储的程序，实现本申请任一实施例所提供的自动驾驶模型的构建方法的步骤。

4、第四方面，本申请提供了一种存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现本申请任一实施例所提供的自动驾驶模型的构建方法的步骤。

5、本申请提供了一种自动驾驶模型的构建方法、计算机设备及存储介质，方法通过获取智能体对应的预设仿真环境的环境信息，将环境信息输入至预训练的自动驾驶模型，自动驾驶模型根据环境信息输出预测驾驶信息；将预测驾驶信息输入至仿真模块，仿真模块用于在预设仿真环境中控制智能体执行预测驾驶信息；获取智能体执行预测驾驶信息对应的奖励信息；将奖励信息发送至训练模块，以使训练模块根据奖励信息完成对自动驾驶模型的优化，完成对自动驾驶模型的构建。进而通过动驾驶模型根据智能体对应的预设仿真环境的环境信息输出预测驾驶信息，再通过仿真模块在预设仿真环境中控制智能体执行预测驾驶信息；最终训练模块根据智能体执行预测驾驶信息对应的奖励信息完成对自动驾驶模型的优化，以完成对自动驾驶模型的构建。进而通过预设仿真环境能够轻松获取自动驾驶数据，并且所构建的自动驾驶模型在多智能体环境下的拟人性大幅提升，并大幅降低了自动驾驶模型的开发复杂度和计算时长。

6、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

本文档来自技高网...

【技术保护点】

1.一种自动驾驶模型的构建方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在所述获取所述智能体执行所述预测驾驶信息对应的奖励信息之后，还包括：

3.根据权利要求1所述的方法，其特征在于，所述自动驾驶模型包括特征提取网络、策略网络和价值网络；所述将所述环境信息输入至预训练的自动驾驶模型，所述自动驾驶模型根据所述环境信息输出预测驾驶信息，包括：

4.根据权利要求3所述的方法，其特征在于，所述特征提取网络包括第一全连接层、第二全连接层、残差层和拼接层，所述环境信息包括图像信息、向量信息和障碍物点云信息；所述将所述环境信息输入至预训练的所述特征提取网络，用于在所述环境信息中提取出特征信息，包括：

5.根据权利要求3所述的方法，其特征在于，所述策略网络包括第三全连接层，所述预测策略包括预测方向、预测油门大小和预测刹车力度；所述将所述特征信息输入至策略网络中，所述策略网络输出多个预测策略，包括：

6.根据权利要求1所述的方法，其特征在于，在所述获取智能体对应的预设仿真环境的环境信息之后，还包括：

8.根据权利要求1所述的方法，其特征在于，所述将所述奖励信息发送至训练模块，以使所述训练模块根据所述奖励信息完成对所述自动驾驶模型的优化，包括：

9.一种计算机设备，其特征在于，所述计算机设备包括：

10.一种存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现如权利要求1-6中任一项所述的自动驾驶模型的构建方法的步骤。

...

【技术特征摘要】

1.一种自动驾驶模型的构建方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在所述获取所述智能体执行所述预测驾驶信息对应的奖励信息之后，还包括：

5.根据权利要求3所述的方法，其特征在于，所述策略网络包括第三全连接层，所述预测策略包括预...

【专利技术属性】
技术研发人员：王浩然，王波，周正，
申请(专利权)人：超参数科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人