对抗场景的迭代生成制造技术

技术编号：28203707 阅读：29 留言：0更新日期：2021-04-24 14:28

一种用于使用一个或多个参数集生成对抗场景以及训练自动驾驶车辆的自动驾驶智能体的方法和装置，每个参数集定义了相应的驾驶场景。通过修改所述参数集中一个参数集的一个或多个参数而生成新的参数集来定义新的驾驶场景，并在所述新的驾驶场景下对所述自动驾驶智能体的性能进行评估。重复所述生成和评估操作，直到所述自动驾驶智能体不能满足所述新的驾驶场景的预定义性能阈值为止。修改所述一个或多个参数的每个实例是基于预先评估的所述自动驾驶智能体的性能。使用包括所述新的参数集的至少一个参数集来训练所述自动驾驶智能体以更新所述自动驾驶智能体的学习策略。体以更新所述自动驾驶智能体的学习策略。体以更新所述自动驾驶智能体的学习策略。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】对抗场景的迭代生成
[0001]本申请

[0002]本申请涉及用于生成自动驾驶智能体的场景的系统和方法。

技术介绍

[0003]自动驾驶是近年来备受关注的领域。自动驾驶车辆可以使用不同的传感器来感测其周围环境和车辆运行参数。自动驾驶车辆还可以包括自动驾驶智能体，用于处理感测的环境和车辆运行参数，以确定车辆的状态；根据车辆的状态、自动驾驶智能体的学习策略和目标对象选择动作；将选择的动作输出至车辆控制器。车辆控制器确定与选择动作对应的控制命令，并将控制命令输出至机电系统。机电系统负责执行控制命令，以实现目标对象。当自动驾驶车辆在真实世界环境中使用时，自动驾驶智能体在执行动作时选择使自动驾驶车辆以安全可靠方式操作的动作至关重要，因为不以安全可靠方式操作可能导致致命事故。因此，自动驾驶智能体需要在各种环境条件(白天、夜间、雨天、雪天等)下以不同场景(高速公路驾驶、低交通量城市区域驾驶等)进行测试。然而，生成一组可靠的评估场景，即不会导致自动驾驶智能体不能运行的评估场景，并不是一个简单的任务。
[0004]目前，主要通过两个方向...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于使用一个或多个参数集训练自动驾驶车辆的自动驾驶智能体的方法，其特征在于，每个参数集定义了所述自动驾驶车辆的相应驾驶场景，所述方法包括：通过修改所述参数集中一个参数集的一个或多个参数而生成新的参数集来定义新的驾驶场景，并在所述新的驾驶场景下对所述自动驾驶智能体的性能进行评估；重复所述生成和评估操作，直到所述自动驾驶智能体不能满足所述新的驾驶场景的预定义性能阈值为止，其中修改所述一个或多个参数的每个实例是基于预先评估的所述自动驾驶智能体的性能；使用包括所述新的参数集的至少一个参数集来训练所述自动驾驶智能体以更新所述自动驾驶智能体的学习策略。2.根据权利要求1所述的方法，其特征在于，所述一个或多个参数集存储在数据库中，所述方法还包括：在所述重复操作后，将包括一个或多个修改后参数的所述新的参数集存储在所述数据库中。3.根据权利要求1或2所述的方法，其特征在于，在生成所述新的参数集之前，使用所述一个或多个参数集的样本对所述自动驾驶智能体进行预训练。4.根据权利要求1至3中任一项所述的方法，其特征在于，所述至少一个参数集用作训练数据集，用于训练所述自动驾驶智能体。5.根据权利要求1至4中任一项所述的方法，其特征在于，修改所述一个或多个参数包括：根据一个或多个预定义约束条件修改所述一个或多个参数。6.根据权利要求5所述的方法，其特征在于，使用预定义规则或约束性优化算法应用至少一个所述一个或多个约束条件。7.根据权利要求1至4中任一项所述的方法，其特征在于，修改所述一个或多个参数包括：确定梯度，所述梯度表示给定参数的给定变化如何影响所述自动驾驶智能体的性能；根据所述梯度，按照预计会向所述自动驾驶智能体发起挑战的方向修改所述给定参数。8.根据权利要求1至4中任一项所述的方法，其特征在于，修改所述一个或多个参数包括：使用优化算法修改至少一个参数以向所述自动驾驶智能体发起挑战。9.一种处理单元，其特征在于，包括：处理器；以及存储器，耦合到所述处理器，所述存储器存储用于自动驾驶车辆的自动驾驶智能体的机器可执行指令，所述指令在由所述处理器执行时使所述处理单元执行以下操作：通过修改定义了所述自动驾驶车辆的相应驾驶场景的参数集中的一个或多个参数而生成新的参数集来定义所述自动驾驶...

【专利技术属性】
技术研发人员：弗洛里安，
申请(专利权)人：皇家学习促进研究所麦吉尔大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人