对抗性仿真场景的生成方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37370082 阅读:15 留言:0更新日期:2023-04-27 07:15
本公开提供了一种对抗性仿真场景的生成方法、装置、电子设备和存储介质,涉及人工智能技术领域,尤其涉及自动驾驶技术领域。实现方案为:基于第一对象的初始状态信息和环境信息,利用第一控制模型确定所述第一对象的后继行为,其中,所述环境信息包括至少一个第二对象各自的状态信息;基于所述初始状态信息、所述环境信息和所述后继行为,生成候选仿真场景;基于所述至少一个第二对象对所述后继行为的响应行为,确定所述候选仿真场景的对抗程度;以及响应于所述对抗程度大于阈值,将所述候选仿真场景确定为对抗性仿真场景。候选仿真场景确定为对抗性仿真场景。候选仿真场景确定为对抗性仿真场景。

【技术实现步骤摘要】
对抗性仿真场景的生成方法、装置、电子设备和存储介质


[0001]本公开涉及人工智能
,尤其涉及自动驾驶
,具体涉及一种对抗性仿真场景的生成方法及装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]自动驾驶技术涉及环境感知、行为决策、轨迹规划以及运动控制等多个方面。依赖于传感器、视觉计算系统和定位系统的协同合作,具有自动驾驶功能的车辆可以在无需驾驶员进行操作或仅需驾驶员进行少量操作的情况下自动地运行。
[0003]自动驾驶车辆中部署有用于实现自动驾驶的算法模型。在自动驾驶车辆投入生产或应用之前,需要对算法模型进行测试,以验证其有效性或准确性。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0005]本公开提供了一种对抗性仿真场景的生成方法及装置、电子设备、计算机可读存储介质和计算机程序产品。
[0006]根据本公开的一方面,提供了一种对抗性仿真场景的生成方法,包括:基于第一对象的初始状态信息和环境信息,利用第一控制模型确定所述第一对象的后继行为,其中,所述环境信息包括至少一个第二对象各自的状态信息;基于所述初始状态信息、所述环境信息和所述后继行为,生成候选仿真场景;基于所述至少一个第二对象对所述后继行为的响应行为,确定所述候选仿真场景的对抗程度;以及响应于所述对抗程度大于阈值,将所述候选仿真场景确定为对抗性仿真场景。
[0007]根据本公开的一方面,提供了一种对抗性仿真场景的生成装置,包括:第一确定模块,被配置为基于第一对象的初始状态信息和环境信息,利用第一控制模型确定所述第一对象的后继行为,其中,所述环境信息包括至少一个第二对象各自的状态信息;生成模块,被配置为基于所述初始状态信息、所述环境信息和所述后继行为,生成候选仿真场景;第二确定模块,被配置为基于所述至少一个第二对象对所述后继行为的响应行为,确定所述候选仿真场景的对抗程度;以及第三确定模块,被配置为响应于所述对抗程度大于阈值,将所述候选仿真场景确定为对抗性仿真场景。
[0008]根据本公开的一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述方法。
[0009]根据本公开的一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行上述方法。
[0010]根据本公开的一方面,提供了一种计算机程序产品,包括计算机程序指令,所述计
算机程序指令在被处理器执行时实现上述方法。
[0011]根据本公开的一个或多个实施例,能够提高对抗性仿真场景的生成效率和真实性。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
[0014]图1示出了根据本公开一些实施例的对抗性仿真场景的生成方法的流程图;
[0015]图2A

2D示出了根据本公开一些实施例的候选仿真场景的示意图;
[0016]图3示出了根据本公开一些实施例的对抗性仿真场景的生成过程的示意图;
[0017]图4示出了根据本公开一些实施例的对抗性仿真场景的生成装置的结构框图;以及
[0018]图5示出了能够用于实现本公开实施例的示例性电子设备的结构框图。
具体实施方式
[0019]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0020]在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
[0021]在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
[0022]本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
[0023]在自动驾驶车辆投入生产或应用之前,需要对其进行测试,以验证其中部署的算法模型能否使自动驾驶车辆安全、平稳运行。
[0024]为了提高测试的效率和安全性,针对自动驾驶车辆的大量测试在仿真环境中进行。首先构建仿真场景(即,模拟的交通场景),然后利用构建的仿真场景对自动驾驶车辆进行测试。
[0025]真实的交通场景中存在大量的智能体(Agent),例如机动车辆、自行车、行人等。自动驾驶车辆本身也是一个智能体。智能体指的是具有自主行为能力的实体,其能够响应外
界环境的变化,作出合适的行为。在构建仿真场景时,需要构建智能体并对智能体的行为进行模拟。
[0026]在绝大多数交通场景中,智能体的行为是正常的、安全的。例如,智能体通常会按照交通规则移动,并且避免碰撞其他智能体。在少数交通场景中,智能体的行为是异常的、危险的。在这种情况下,智能体可能与其他智能体发生对抗。例如,机动车智能体(由于车辆故障或驾驶员的失误)可能会突然冲向其他智能体进行抢行,或者与其他智能体发生碰撞。下文中,将智能体的异常行为记为“对抗性行为”,将智能体的异常行为的异常程度记为“对抗程度”,将因智能体的异常行为而导致的智能体之间发生对抗的交通场景记为“对抗性场景”。
[0027]为了保证自动驾驶车辆在对抗性场景中的行驶安全性,需要构建对抗性仿真场景并对自动驾驶车辆进行测试。相关技术中,通常通过人工设置智能体的对抗性行为的方式来生成对抗性仿真场景。该方案的效率低,并且人工设置的对抗性行为是固定的、机械的,无法模拟真实场景中不同智能体的交互情况,导致生成的对抗性仿真场景的真实性、合理性和应用价值较低。
[0028]针对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对抗性仿真场景的生成方法,包括:基于第一对象的初始状态信息和环境信息,利用第一控制模型确定所述第一对象的后继行为,其中,所述环境信息包括至少一个第二对象各自的状态信息;基于所述初始状态信息、所述环境信息和所述后继行为,生成候选仿真场景;基于所述至少一个第二对象对所述后继行为的响应行为,确定所述候选仿真场景的对抗程度;以及响应于所述对抗程度大于阈值,将所述候选仿真场景确定为对抗性仿真场景。2.根据权利要求1所述的方法,其中,所述基于第一对象的初始状态信息和环境信息,利用第一控制模型确定所述第一对象的后继行为包括:将所述初始状态信息和所述环境信息输入所述第一控制模型,以得到所述第一控制模型输出的所述第一对象的目标状态信息;以及基于所述目标状态信息确定所述后继行为。3.根据权利要求2所述的方法,其中,所述目标状态信息包括目标速度,所述基于所述目标状态信息确定后继行为包括:获取所述第一对象的参考轨迹;以及将所述后继行为确定为以所述目标速度沿着所述参考轨迹移动。4.根据权利要求2所述的方法,其中,所述目标状态信息包括目标位置和目标速度,所述基于所述目标状态信息确定后继行为包括:将所述后继行为确定为以所述目标速度移动至所述目标位置。5.根据权利要求1

4中任一项所述的方法,其中,所述基于所述初始状态信息、所述环境信息和所述后继行为,生成候选仿真场景包括:基于路网信息,判断所述第一对象在执行所述后继行为时是否位于道路中;以及响应于所述第一对象在执行所述后继行为时位于道路中,基于所述初始状态信息、所述环境信息和所述后继行为,生成候选仿真场景。6.根据权利要求1

5中任一项所述的方法,其中,所述至少一个第二对象中的每个第二对象对应于一个第二控制模型,所述第二对象对所述后继行为的响应行为是利用所述第二控制模型确定的。7.根据权利要求1

6中任一项所述的方法,其中,所述至少一个第二对象包括自动驾驶车辆,所述基于所述至少一个第二对象对所述后继行为的响应行为,确定所述候选仿真场景的对抗程度包括:基于所述自动驾驶车辆对所述后继行为的响应行为,确定所述候选仿真场景的对抗程度。8.根据权利要求1

7中任一项所述的方法,其中,所述基于所述至少一个第二对象对所述后继行为的响应行为,确定所述候选仿真场景的对抗程度包括:基于以下至少一项确定所述候选仿真场景的对抗程度:所述至少一个第二对象中的任一第二对象与所述第一对象之间的最小距离;或所述第一对象距离所述第二对象最近时的速度,其中,所述对抗程度与所述最小距离负相关,与所述速度正相关。9.根据权利要求7所述的方法,其中,所述至少一个第二对象还包括不同于所述自动驾
驶车辆的第三对象,所述基于所述自动驾驶车辆对所述后继行为的响应行为,确定所述候选仿真场景的对抗程度包括:基于所述自动驾驶车辆对所述后继行为和所述第三对象的行为的响应行为,确定所述候选仿真场景的对抗程度。10.根据权利要求1

9中任一项所述的方法,还包括:利用所述对抗性仿真场景对自动驾驶车辆进行仿真测试。11.根据权利要求1

10中任一项所述的方法,其中,所述初始状态信息包括以下至少一项:初始位置、初始速度或初始朝向。12.根据权利要求1

11中任一项所述的方法,其中,所述环境信息还包括以下至少一项:交通信号灯信息或路网信息。13.根据权利要求1

12中任一项所述的方法,还包括:获取所述第一对象的行为类型;以及基于所述行为类型,确定用于控制所述第一对象的所述第一控制模型。14.一种对抗性仿真场景的生成装置,包括:第一确定模块,被配置为基于第一对象的初始状态信息和环境信息,利用第一控制模型确定所述第一对象的后继行为,其中,所述环境信息包括至少一个第二对象各自的状态信息;生成模块,被配置为基于所述初始状态信息、所述环境信息和所述后继行为,生成候选仿真场景;第二...

【专利技术属性】
技术研发人员:韩仲卿卢帅王静王成法
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1