用于自动化交通工具的文化敏感驾驶的安全的并且可扩展的模型制造技术

技术编号:33847515 阅读:49 留言:0更新日期:2022-06-18 10:32
本申请公开了用于自动化交通工具的文化敏感驾驶的安全的并且可扩展的模型。公开了如下技术:从自然数据中导出本地驾驶行为,然后该本地驾驶行为被作为指导合并到自动交通工具(AV)的行为层中,以适应本地交通。此外,该本地驾驶行为被实现在AV性能验证过程中。该技术通过来自人类所驾驶的交通工具、ADAS交通工具和自动驾驶交通工具、和地图信息的自动众包行为数据聚合,促进这一过程的扩展。所公开的技术也实现空间行为关系数据库的创建,该数据库提供用于高效查询地理范围内的本地驾驶信息的接口,从而实现根据本地规范的自动交通工具驾驶策略的定制,并且实现交通行为分析。并且实现交通行为分析。并且实现交通行为分析。

【技术实现步骤摘要】
用于自动化交通工具的文化敏感驾驶的安全的并且可扩展的模型


[0001]本文所描述的方面总体上涉及实施行为建模的技术,以将文化敏感的行为调整应用于自动驾驶交通工具(AV)实施的驾驶策略。

技术介绍

[0002]安全驾驶是有文化差异的。例如,纽约的人类驾驶员与爱荷华州的人类驾驶员不同地驾驶。除了安全性,自动化交通工具(AV)广泛部署的一个主要挑战是文化接受度。流行观点强烈反对AV的部署,这种不情愿的重要因素是AV驾驶像无脑的机器人,而不像本地的人类驾驶员。换言之,全局地扩展AV的能力与AV以运营AV的区域视为文化上可接受的的方式适应它们的驾驶行为能力密切相关。
附图说明
[0003]结合到本文中并构成本说明书的一部分的附图图示本公开的多个方面,并且与说明书一起,进一步用于解释多个方面的原理,并使相关领域的技术人员能够制造和使用多个方面。
[0004]图1A和图1B说明了创建行为模型的两种最先进的方法。
[0005]图2示出了根据本公开的一个或多个方面的本地行为建模系统的示例概述。
[0006]图3示出了根据本公开的一个或多个方面的示例本地行为建模系统的附加细节。
[0007]图4示出了根据本公开的一个或多个方面的被使用作为本地行为建模系统的部分的示例操纵序列过程。
[0008]图5A

图5B示出了根据本公开的一个或多个方面的示例行为模型输入/输出图。
[0009]图6示出了根据本公开的一个或多个方面的示例操纵分类状态图。
[0010]图7示出了根据本公开的一个和多个方面的地图中具有包括监管要素和被允许的操纵的属性的车道片段元素的示例。
[0011]图8A和图8B示出了根据本公开的一个或多个方面的示例行为模型图数据集的示例视觉表示。
[0012]图9A和图9B示出了根据本公开的一个或多个方面的用于从存储的行为模型图数据集中提取数据的示例API查询过程。
[0013]图10示出了根据本公开的一个或多个方面的集成过程的示例。
[0014]图11示出了根据本公开的一个或多个方面的计算设备的示例。
[0015]图12示出了根据本公开的一个或多个方面的计算设备的另一示例。
[0016]将参照附图描述本公开的示例性方面。其中要素第一次出现的附图通常由对应的附图标记中最左面的(多个)数字指示。
具体实施方式
[0017]在下面的描述中,阐述了众多具体细节以便提供对本公开的多个方面的完全理解。然而,对本领域技术人员将显而易见的是,可以在没有这些具体细节的情况下实施包括结构、系统和方法在内的多个方面。本文的描述和表示是由本领域的经验或技术人员使用来向本领域其他技术人员最有效地传达其工作的实质的通用手段。在其他实例中,未详细地描述公知的方法、过程、组件、和电路,以避免不必要地使本公开的多个方面变得模糊。
[0018]再次重申,当前的AV系统未能以反映不同地区和文化之间的本地驾驶行为的方式充分反映人类行为。取决于在AV决策逻辑的开发中采用的方法,由于超参数调整的指数性质,对文化规范的适应可能从困难(对于参数化/基于规则的系统)到几乎不可能(在数据学习依赖的情况下)。这并不奇怪,因为即使是人类驾驶员,在行驶时适应他们的驾驶风格也是具有挑战性的,因为他们自己的判断必需辨别(并内部化)其他驾驶员做的和被视为“正常的”。
[0019]不同的本地驾驶风格也会影响AV的操作的条件,在每个地理位置引入不同的安全挑战。对不同地区之间驾驶员行为的差异进行建模还可以导致更简化的系统故障率的分析以及更精确的地理特定的性能水平的预测。实现这一目的的传统尝试包括本地化的测试和微调整。此类方法执行测试/试验部署,在此期间,AV开发商对人类驾驶员(以及易受伤害的道路使用者)对AV的反应进行第一手观测,然后对驾驶策略算法进行手动调整,以模仿人类驾驶员的行为,以更好地符合他们测试的特定区域道路上的人类驾驶员。
[0020]然而,此类本地化测试和微调整技术是不可扩展的,因为理解不同位置的差异只能发生在实际部署之后。因此,本地化测试和微调整不能对“更简单”的部署位置执行有效的规划。例如,假设2年后在路上测试的AV现在已经充分优化,能够符合人类驾驶员并且像其他任何人一样在特定区域驾驶。要将该AV部署在其他任何地方(或至少具有足够不同驾驶行为的其他任何地方),必须利用相同的昂贵的AV测试车队和所有的相同的耗时的修改重复训练过程。并且即使该过程可以被优化且只需6个月而不是2年,这仍然需要将AV与安全驾驶员和工程师一起预先部署到新区域,来手动学习新区域内人们的新驾驶方式,这些人可能不会像之前区域的人们一样驾驶。
[0021]执行区域AV模型训练的另一传统尝试包括机器学习技术的使用,诸如强化学习(RL),其中奖励函数被指定,学习目标被确定,和/或AV的行为被动态地调节,以匹配本地行为模式,这具有的想法在于,通过这样做,AV将学习如何根据观察到的行为像本地人一样驾驶。然而,这一过程涉及使用大量观察进行训练,当位置表现出不同的行为分布时,当行为不存在于原始训练数据集中时,或者当情境提示(如标志、道路标记等)与原始数据集中显著不同时,这些大量观察需要被重复。
[0022]此外,基于RL的向人类学习的方法是众所周知有问题的。一方面,RL需要与环境交互以学习特定情况(即地理区域)的策略,因此,需要与代表性的真实人类驾驶员的集合的交互。此外,如果基准驾驶策略与真实人类驾驶员不同,那么与“真实世界”的交互也可能呈现其自身的危险,这可能导致在驾驶策略“学习”得足够以做得更好之前致使事故发生。在一些情况下,通过将人在回路中的仿真添加到RL训练流水线中,使得仿真可以在这方面有所帮助,其中策略是通过人机交互学习的(通过演示学习)。这种方法也称为“关闭策略”RL。然而,这些方法也遭受着与前文所提及的相同的问题,即,策略必须由AV将被部署的每个地
理位置的人群的代表性的部分训练。
[0023]另一方面,当策略随着与环境的每次交互(即按策略RL)而不断更新时,现在的问题变成,策略学习不能以受控的方式进行,并且因此,“教师”(即与环境的交互)确实不能在任何时候都被信任。按策略RL方法的问题在于信任“教师”是利他主义的,并且不会试图与系统博弈。当人类驾驶员知道他们正在与AV打交道时(可能是由于特殊的车牌或视觉标识符),人们可能会试图为了最大的优势而与AV博弈:比起正常人类驾驶员,他们会更多地阻断AV,比起如果是人类所驾驶的车辆,易受伤害的道路使用者会更多地走到AV的前面,等等。
[0024]因此,目前方法的任何一种都不足以实现AV的广泛的全局可扩展性而没有巨大的成本和费用。因此,为了解决这些问题,本文所描述的方面利用技术从自然数据中导出本地驾驶行为,然后将本地驾驶行为作为指导合并到AV的行为层中以适应本地交通此外,本地驾驶行为被实现到AV性能验证过程中。另外,还公开了用于通过来自人类所驾驶的交通工具和地图信息的自动众包行为数据聚合来扩本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算设备,包括:通信接口,所述通信接口被配置为接受与静止地标相关联的静态语义数据和来自道路参与者的动态语义数据,所述静态语义数据和所述动态语义数据每个与将由自主交通工具(AV)导航的环境相关联;以及处理电路,所述处理电路被配置为使用所述静态语义数据和所述动态语义数据生成行为模型的集合,所述行为模型的集合中的每一个与将由AV在对应地理位置执行的操纵相关联,其中,所述通信接口进一步被配置为:从所述AV接收查询,所述查询与所述行为模型的集合中、具有与从所述AV接收的所述查询的地理位置相匹配的对应地理位置的多个行为模型中的至少一个行为模型相关联;以及响应于所述查询而发送与所述行为模型中的所述至少一个行为模型相关联的数据,以使得所述AV根据与所接收的多个行为模型中的至少一个行为模型相关联的所接收数据执行操纵。2.如权利要求1所述的计算设备,其中所述AV具有相关联的驾驶策略,并且其中与所述多个行为模型中的至少一个行为模型相关联的数据由所述AV接收,并且作为输入被提供给所述AV的驾驶策略的行为层以执行所述操纵。3.如权利要求1或2所述的计算设备,其中所述处理电路被配置为根据神经网络生成所述行为模型的集合。4.如权利要求1或2所述的计算设备,其中所述AV利用安全驾驶模型(SDM),所述安全驾驶模型(SDM)定义了所述AV在所述环境内操作时遵循的安全指南,以及其中,所述处理电路被配置为使用以下各项作为输入生成所述行为模型的集合中的行为模型:(i)所述AV的地理位置;(ii)度量的集合,所述度量的集合包括与对所述AV和在相同地理位置的多个其他AV的历史增量观测相关联的时间顺序数据;以及(iii)SDM标签,所述SDM标签将所生成的行为模型的输出行为限制为所述SDM所定义的安全观察行为。5.如权利要求1或2所述的计算设备,其中所述处理电路被配置为将所述行为模型的集合存储在具有图数据集结构的数据库中,以提供行为模型图数据集。6.如权利要求5所述的计算设备,其中所述行为模型图数据集合包括:(i)多个道路节点,所述多个道路节点在所述图数据集中的每个边缘表示中彼此互连,所述多个道路节点中的每一个表示相应的地理位置;以及(ii)多个行为节点,所述多个行为节点中的每一个被连接到所述多个道路节点中的至少一个,其中,所述行为节点中的相应每一个表示与特定操纵相关联的行为模型,所述特定操纵将由所述AV在与相应的连接的道路节点相关联的对应地理位置处执行。7.如权利要求6所述的计算设备,其中所述处理电路进一步被配置为:响应于所述查询,通过将所述查询的所述地理位置匹配到由所述多个道路节点中的相应一个所表示的地理位置,来识别与所述多个行为模型中的至少一个相关联的数据;并且响应于所述查询,根据连接到所述多个道路节点中的所识别的相应一个道路节点的行为节点来确定与所述行为模型中的所述至少一个相关联的数据以用于发送发送。8.如权利要求6所述的计算设备,其中所述查询是对于与所述行为模型图数据集相关联的数据的多节点查询,并且其中,所述处理电路进一步被配置为响应于所述多节点查询,通过执行包括装袋或提
升中的至少一个的集成过程来确定与所述多个行为模型中的至少一个相关联的所述数据以用于发送。9.一种与自主交通工具(AV)相关联的电子控制单元(ECU),所述ECU包括:通信接口,所述通信接口被配置发送来自道路参与者的动态语义数据,所述动态语义数据与将由AV导航的环境相关联;以及处理电路,所述处理电路被配置为生成查询,所述查询与使用与所述环境相关联的、所述动态语义数据和用静止地标识别的静态语义数据所生成的行为模型的集合中的至少一个相关联,所述行为模型的集合中的每一个与将由所述AV在对应地理位置执行的操纵相关联;其中,所述通信接口进一步被配置为:发送所述查询;响应于所发送的查询,接收与所述行为模型的集合中、具有与所述查询所指定的地理位置匹配的对应地理位置的多个行为模型中的至少一个行为模型相关联的数据;并且根据与所述多个行为模型中的至少一个相关联的所接收的数据执行操纵。10.如权利要求9所述的ECU,其中所述AV利用在所述环境中导航的驾驶策略,以及其中,与所述AV所接收的所述行为模型的至少一个相关联的所述数据作为输入被提供给所述驾驶策略的行为层以执行所述操纵。11.如权利要求9或10所述的ECU,其中所述AV利用安全驾驶模型(SDM),所述安全驾驶模型(SDM)定义了所述AV在所述环境中操作时遵循的安全指南,并且其中,使用以下各项作为输入来生成所述行为模型的集合中的行为模型:(i)所述AV的地理位置;(ii)度量的集合,所述度量的集合包括与对于所述AV和在相同地理位置的多个其他AV的历史增量观测相关联的时间顺序数据;以及(iii)SDM标签,所述SDM标签将所生成的行为模型的输出行为限制为所述SDM所定义的安全观察行为。12.如权利要求9或10所述...

【专利技术属性】
技术研发人员:J
申请(专利权)人:移动眼视觉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1