在自动驾驶模拟中通过不同代理管理对车辆的灵活控制的系统和方法技术方案

技术编号：37855952 阅读：9 留言：0更新日期：2023-06-14 22:49

用于控制对象的行为的方法和系统。在第一时间段期间所述对象的行为是通过使用第一代理控制的，所述第一代理应用第一行为策略以将所述第一时间段中关于所述对象和环境的观察结果映射到相应控制动作。在所述第一时间段后的过渡期内，将控制权从所述第一代理过渡到第二代理。在所述过渡期后的第二时间段期间所述对象的行为是通过使用第二代理控制的，所述第二代理应用第二行为策略以将所述第二时间段中关于所述对象和所述环境的观察结果映射到应用于所述对象的相应控制动作。在过渡期间，所述第一代理应用所述第一行为策略控制所述对象，并且所述第二代理应用所述第二行为策略以将关于所述对象和所述环境的观察结果映射到未应用于所述对象的相应控制动作。到未应用于所述对象的相应控制动作。到未应用于所述对象的相应控制动作。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】在自动驾驶模拟中通过不同代理管理对车辆的灵活控制的系统和方法
[0001]本申请要求2020年7月28日提交的专利技术名称为“在自动驾驶模拟中通过不同代理管理对车辆的灵活控制的系统和方法(System and Method for Managing Flexible Control of Vehicles by Diverse Agents in Autonomous Driving Simulation)”的美国专利申请号16/941,505和2020年8月10日提交的题为“在自动驾驶模拟中通过不同代理管理对车辆的灵活控制的系统和方法(System and Method for Managing Flexible Control of Vehicles by Diverse Agents in Autonomous Driving Simulation)”的美国专利申请号16/989,776的优先权，这些申请通过引用并入本文，就像完整地复制一样。

[0002]本专利技术涉及模拟环境中机器人的控制代理。

技术介绍

[0003]自动机器人控制领域的研究与开发(Research and Development，R&D)严重依赖模拟来训练、测试、评估和验证控制车辆的自动驾驶软件代理。一般来说，模拟越真实和多样化，就越有用。模拟的真实性使模拟环境与现实世界保持一致。模拟的多样性，特别是自动机器人(例如，在正在开发的主要自动驾驶软件代理控制下的自车)与不受正在开发的主要自动驾驶软件代理控制的其它交通参与...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于控制对象的行为的计算机实现的方法，其特征在于，包括：通过使用第一代理控制在第一时间段期间所述对象的行为，所述第一代理应用第一行为策略以将所述第一时间段中关于所述对象和环境的观察结果映射到应用于所述对象的相应控制动作；在所述第一时间段后的过渡期内，将所述对象的行为控制权从所述第一代理过渡到第二代理；通过使用第二代理控制在所述过渡期后的第二时间段期间所述对象的行为，所述第二代理应用第二行为策略以将所述第二时间段中关于所述对象和所述环境的观察结果映射到应用于所述对象的相应控制动作；其中，在所述过渡期内，所述第一代理应用所述第一行为策略，以将所述过渡期中关于所述对象和所述环境的观察结果映射到应用于所述对象的相应控制动作，所述第二代理应用所述第二行为策略，以将所述过渡期中关于所述对象和所述环境的观察结果映射到未应用于所述对象的相应控制动作。2.根据权利要求1所述的方法，其特征在于，由所述第一行为策略映射的所述观察结果和由所述第二行为策略映射的所述观察结果各自来自各自不同的观察空间。3.根据权利要求1或2所述的方法，其特征在于，在所述过渡期内，关于所述对象和所述环境的一组观察结果修改为包括所述第二行为策略所需的关于所述对象和所述环境的观察结果。4.根据权利要求1至3中任一项所述的方法，其特征在于，所述第一时间段对应于所述对象出现在由第一时空边界定义的第一区域中的时间，所述第二时间段对应于所述对象出现在由第二时空边界定义的第二区域中的时间，所述过渡期对应于所述对象出现在所述第一区域和所述第二区域之间的过渡区域中的时间，所述方法包括在所述对象出现在所述第一区域中后检测到所述对象出现在所述过渡区域中时执行过渡。5.根据权利要求1至4中任一项所述的方法，其特征在于，还包括：在所述第二时间段后的另一过渡期内，将所述对象的行为控制权从所述第二代理过渡到所述第一代理；其中，在所述另一过渡期内，所述第二代理应用所述第二行为策略，以将第二过渡期中关于所述对象和所述环境的观察结果映射到应用于所述对象的相应控制动作，所述第一代理应用所述第一行为策略，以将在所述另一过渡期中关于所述对象和所述环境的观察结果映射到未应用于所述对象的相应控制动作。6.根据权利要求1至5中任一项所述的方法，其特征在于，所述方法在模拟运行期间应用，所述对象是模拟对象，关于所述对象和所述环境的所述观察结果是关于所述对象和所述环境的模拟观察结果。7.根据权利要求6所述的方法，其特征在于，所述对象是在模拟环境中操作的模拟社会车辆，所述模拟环境还包括在整个所述第一时间段、过渡期和第二时间段中由相应自车代理控制的模拟自车，所述相应自车代理应用自车行为策略，以将进行中的关于所述自车和所述环境的观察结果映射到应用于所述自车的相应自车控制动作。8.根据权利要求7所述的方法，其特征在于，所述第一时间段对应于所述对象出现在由第一时空边界定义的第一区域中的时间，所述第二时间段对应于所述对象出现在由第二时
空边界定义的第二区域中的时间，所述过渡期对应于所述对象出现在第一气泡和第二气泡之间的过渡区域中的时间，所述方法包括在所述对象出现在所述第一区域中后检测到所述对象出现在所述过渡区域中时执行过渡，并且其中所述第二区域和所述过渡区域固定在虚拟位置，所述虚拟位置与所述模拟自车在所述模拟环境内的虚拟位置一起移动。9.根据权利要求7所述的方法，其特征在于，所述第一时间段对应于所述对象出现在由第一时空边界定义的第一区域中的时间，所述第二时间段对应于所述对象出现在由第二时空边界定义的第二区域中的时间，所述过渡期对应于所述对象出现在所述第一区域和所述第二区域之间的过渡区域中的时间，所述方法包括在所述对象出现在所述第一区域中后检测到所述对象出现在所述过渡区域中时执行过渡，并且其中所述第二区域和所述过渡区域固定在虚拟位置，所述虚拟位置相对于所述模拟环境内的虚拟物理位置静止。10.根据权利要求1至9中任一项所述的方法，其特征在于，所述第一行为策略的计算密集度低于所述第二行为策略。11.根据权利要求10所述的方法，其特征在于，所述第二行为策略用于从观察空间映射关于所述对象和所述环境的观察结果，所述观察空间相对于所述第一行为策略用于从中映射观察结果的观察空间更丰富。12.根据权利要求11所述的方法，其特征在于，所述第二行为策略用于从动作空间将关于所述对象和所述环境的观察结果映射到控制动作，所述动作空间相对于所述第一行为策略用于从中将关于所述对象和所述环境的观察结果映射到控制动作的动作空间更丰富。13.一种计算机系统，其特征在于，包括：处理器；耦合到所述处理器的存储器，所述存储器存储指令，所述指令在由所述处理器执行时将所述计算机系统配置成：通过使用第一代理控制在第一时间段期间所述对象的行为，所述第一代理应用第一行为策略以将所述第一时间段中关于所述对象和环境的观察结果映...

【专利技术属性】
技术研发人员：罗军，朱利安，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人