评估自主驾驶规划和控制的方法和系统技术方案

技术编号:38826754 阅读:11 留言:0更新日期:2023-09-15 20:06
本公开提供了评估自主驾驶规划和控制(PNC)的方法和系统。方法包括:通过处理设备生成场景中的自主驾驶车辆(ADV)的控制轨迹,所述控制轨迹由所述ADV可执行以在所述场景中自主驾驶;接收在所述场景中的多个驾驶演示中获得的数据集;识别所获得的数据集的分布模式,所述分布模式指示所述场景中驾驶轨迹的概率;以及通过所述处理设备基于所述控制轨迹与所述多个驾驶演示的分布模式之间的比较计算相似性分数。似性分数。似性分数。

【技术实现步骤摘要】
评估自主驾驶规划和控制的方法和系统


[0001]本公开的实施例一般涉及操作自主驾驶车辆。更具体地说,本公开的实施例涉及评估自主驾驶规划和控制(PNC)的方法和系统。

技术介绍

[0002]以自主模式(例如,无人驾驶)操作的车辆可以减轻乘坐者,尤其是驾驶员的一些驾驶相关责任。当以自主模式操作时,车辆可以使用车载传感器导航到各种位置,从而允许车辆以最小的人机交互或者在没有任何乘客的一些情况下行驶。
[0003]运动规划与控制(PNC)是自主驾驶中的关键操作。然而,常规的运动规划操作主要从曲率和速度来估计完成给定路径的难度,而没有考虑不同类型的车辆的特征差异。对所有类型的车辆都采用相同的运动规划和控制,这在某些情况下可能不准确和流畅。
[0004]需要正确评估PNC计算的方法或标准。例如,在确定性输出的基础上,PNC计算可能需要被优化或改进以符合社会期望。

技术实现思路

[0005]第一方面,提供一种评估自主驾驶规划和控制的计算机实现的方法,包括:
[0006]通过处理设备生成场景中的自主驾驶车辆(ADV)的控制轨迹,所述控制轨迹由所述ADV可执行以在所述场景中自主驾驶;
[0007]接收在所述场景中的多个驾驶演示中获得的数据集;
[0008]识别所获得的数据集的分布模式,所述分布模式指示所述场景中驾驶轨迹的概率;以及
[0009]通过所述处理设备基于所述控制轨迹与所述多个驾驶演示的分布模式之间的比较计算相似性分数。
[0010]第二方面,提供一种非暂时性机器可读介质,存储有指令,当由处理器执行指令时,使所述处理器执行如第一方面所述的方法的操作。
[0011]第三方面,提供一种处理设备,包括:
[0012]处理器;以及
[0013]与所述处理器耦合并存储指令的存储器,当所述指令由所述处理器执行时,使所述处理器执行如第一方面所述的方法的操作。
[0014]第四方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时使得所述处理器执行如第一方面所述的方法的操作。
[0015]本公开提供了与专家演示的可靠和实用的比较,用于优化和微调基于学习的算法,从而改进自主驾驶规划和控制。
附图说明
[0016]本专利技术的实施例通过示例的方式来说明,而不是限制在所附附图的图中,其中相
似的附图标记表示相似的元素。
[0017]图1示出了根据本专利技术的方面的与场景中的专家演示相比的不同计算的控制轨迹。
[0018]图2示出了根据本公开的方面的操作的方法的流程图。
[0019]图3示出了根据本公开的方面的驾驶演示数据的示例分布。
[0020]图4示出了根据本公开的方面的用于由处理设备计算相似性分数的控制轨迹的输出的示例分布。
[0021]图5示出了根据本公开的方面的确定相似性分数的概率密度函数的示例计算。
[0022]图6示出了根据一个实施例的自主驾驶车辆的框图。
[0023]图7示出了根据一个实施例的自主驾驶车辆的示例的框图。
[0024]图8是示出了根据一个实施例的与自主驾驶车辆一起使用的自主驾驶系统的示例的框图。
[0025]图9示出了根据本公开的方面的一些场景。
[0026]图10示出了根据本公开的方面的一些场景。
[0027]图11示出了根据本专利技术的方面的基于相似性分数的机器学习算法的示例框图。
[0028]图12示出了根据本公开的方面,基于专家演示数据和相似性分析器的算法调谐器的示例框图。
[0029]图13示出了根据本公开的方面,在模拟场景上使用相似性分析器的示例框图。
[0030]相似的数字表示相似的元素。
具体实施方式
[0031]将参考以下讨论的细节描述本公开的各个实施例和方面,并且附图将示出各个实施例。以下描述和附图是本公开的说明并且不应被解释为限制本公开。描述了许多具体细节以提供对本公开的各个实施例的全面理解。然而,在某些情况下,为了提供对本公开的实施例的简要讨论,没有描述公知或常规的细节。
[0032]说明书中对“一个实施例”或“实施例”的引用意味着结合该实施例描述的特定特征、结构或特性可包括在本公开的至少一个实施例中。在说明书中的各个地方出现的短语“在一个实施例中”不一定指同一实施例。
[0033]本公开提供了使用基于人类驾驶行为(例如,专家演示)计算的一个或多个度量(例如,相似性分数)来评估和改进自动驾驶规划和控制(PNC)算法的方法和技术。例如,一个或多个指标允许基于人类行为(因此,人类期望)改进PNC,而不是(或除此之外)优化某些过于简化的属性,例如作为目标的最小距离或时间。当在某些场景下驾驶时,例如转弯时,人们可能会以分布概率模式驾驶,而不是以统一的路线驾驶(例如,在同一拐角处的不同速度和不同曲率)。因此,自动驾驶车辆在同一转弯中可以有多于一个“正确”的控制轨迹。安全、舒适、速度和其他标准可能会导致不同的偏好和对控制轨迹计算得如何的判断。如本文所公开的,生成相似性分数以评估由自主算法基于实际人类表现(下面称为专家演示)的观察或测量计算的PNC结果。
[0034]本公开侧重于自主驾驶单元(ADU),特别是PNC在控制、决策、规划和行为预测方面的改进。对于自主驾驶算法,专家演示被用作计算基于学习的算法(例如,机器学习、深度学
习或人工智能/AI)的成本的标准或基本事实。在现有的实践中,专家演示和算法结果之间的相似性比较是困难或不明确的,但至关重要。本公开提供了使与专家演示的有效比较可靠和实用的方法,用于优化和微调基于学习的算法。
[0035]在现有的比较专家演示的方法中,比较专家轨迹和算法模型输出之间的车辆轨迹(距离、速度、加速度)的累积差异。然而,这种差异往往不能准确地评估基于专家演示的算法模型输出。也就是说,当两者都不是专家演示的完美匹配时,这种仅基于差异的方法往往不能区分可接受的驾驶输出和不可接受的驾驶输出。根据本专利技术的方面,使用(一个或多个)概率分布模型来表征、表示或表达专家演示。类似地,生成另一个概率分布表示来映射自主驾驶算法输出。然后,可以比较两个概率分布特征——通过相似性分数来量化自主驾驶算法的表现,并为改进或下一次计算迭代提供基础。
[0036]根据一些实施例,计算机实现的方法可以包括通过处理设备生成自主驾驶车辆(ADV)在场景中的控制轨迹。控制轨迹可由ADV可执行,以在场景中自主驾驶。方法进一步包括接收在场景中的多个驾驶演示中获得的数据集,并识别所获得的数据集的分布模式。分布模式表示场景中驾驶轨迹的概率。处理设备可基于控制轨迹与多个驾驶轨迹的分布模式之间的比较计算相似性分数。
[0037]在某些情况下,方法进一步包括基于相似性分数,在生成场景中ADV的控制轨迹时调整至少一个参数,并生成更新的控制轨迹。更新的控制轨迹对应于高于先前计算的相似性分数的更新的相似性分数。更新的控制轨迹由ADV可执行,以在场本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种评估自主驾驶规划和控制的计算机实现的方法,包括:通过处理设备生成场景中的自主驾驶车辆(ADV)的控制轨迹,所述控制轨迹由所述ADV可执行以在所述场景中自主驾驶;接收在所述场景中的多个驾驶演示中获得的数据集;识别所获得的数据集的分布模式,所述分布模式指示所述场景中驾驶轨迹的概率;以及通过所述处理设备基于所述控制轨迹与所述多个驾驶演示的分布模式之间的比较计算相似性分数。2.如权利要求1中所述的计算机实现的方法,进一步包括:基于所述相似性分数,调整在生成所述场景中所述ADV的控制轨迹时的至少一个参数;以及生成更新的控制轨迹,其中所述更新的控制轨迹对应于高于先前计算的相似性分数的更新的相似性分数,所述更新的控制轨迹由所述ADV可执行以在所述场景中自主驾驶。3.如权利要求1中所述的计算机实现的方法,其中生成所述场景所述ADV的控制轨迹包括:生成服从概率分布模式的多个候选轨迹。4.如权利要求3中所述的计算机实现的方法,其中计算所述相似性分数包括以下中的至少一个:计算Kullback

Leibler散度;计算f散度;计算H散度;确定一个或多个积分概率度量;或评估所述分布模式的概率分布函数的预测值的概率密度。5.如权利要求1中所述的计算机实现的方法,其中所述场景包括:起始位置和初始速度向量;结束位置和最终速度向量;以及静态侧边界、沿静态侧边界的可用宽度、动态侧边界或由动态侧边界引起的宽度变化中的至少一个...

【专利技术属性】
技术研发人员:吴思皓姜舒曹昱林玮曼李昂胡江滔
申请(专利权)人:百度美国有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1