自主车辆的驾驶行为的适配制造技术

技术编号:38878529 阅读:9 留言:0更新日期:2023-09-22 14:10
本发明专利技术涉及一种自主车辆(217)的驾驶行为的适配方法。在该方法中,定义一个交通状况,其包括将由自主车辆(217)执行的行驶操纵。此外,训练用于在所述交通状况下执行行驶操纵的模型。所述模型考虑并评估与所述交通状况相关的交通流。以根据其评估优化交通流的方式对行驶操纵的执行进行训练。在所述交通状况下,由自主车辆(217)根据所述模型取决于交通流执行行驶操纵。驶操纵。驶操纵。

【技术实现步骤摘要】
自主车辆的驾驶行为的适配


[0001]本专利技术涉及一种自主车辆的驾驶行为的适配方法。

技术介绍

[0002]自主车辆在这里是指自动驾驶车辆,即在没有驾驶员干预的情况下独立执行行驶操纵的车辆。独立执行行驶操纵对自主车辆提出了各种要求。特别是,必须检测和评估包括其他道路使用者及其运动在内的交通状况。为此目的,自主车辆具有多种传感器来检测其周围环境,例如相机、激光雷达传感器、雷达传感器和/或超声传感器。这些传感器的传感器信号由自主车辆进行评估和判断,以执行适应交通状况的行驶操纵。由自主车辆执行的行驶操纵不危及其他道路使用者,这一要求在此特别重要。因此,自主车辆通常具有所谓的防御性驾驶风格,其将安全问题放在首位。然而,过度的防御性驾驶风格会导致交通阻碍。此外,过度的防御性驾驶风格会惹恼其他道路使用者,并诱使他们采取危险的行驶操纵,例如危险的超车操纵。
[0003]EP 3598414A1公开了一种预测至少一个道路使用者的轨迹的方法,以避免主体车辆、特别是自主车辆与该道路使用者发生碰撞。在此,确定道路使用者的可能轨迹群,并从中预测道路使用者的至少一条轨迹。基于该至少一个预测轨迹,由主体车辆执行至少一个动作。
[0004]WO 2020/040975 A1公开了一种方法,其中存储通过车辆传感器检测的数据,这些数据描述人工控制的车辆在交通状况下的驾驶行为,并用于例如训练用于控制自主车辆的机器学习模型或支持车辆的驾驶员。为了限制要存储的数据量,只有当驾驶行为具有特殊意义时,例如当驾驶行为明显偏离预测的驾驶行为时,才存储驾驶行为的高分辨率数据。

技术实现思路

[0005]本专利技术基于减少由自主车辆的驾驶行为引起的交通阻碍的目的。
[0006]根据本专利技术,该目的通过一种自主车辆的驾驶行为的适配方法来实现,其中
[0007]‑
定义一个交通状况,其中包括将由自主车辆执行的行驶操纵,
[0008]‑
训练用于在该交通状况下执行行驶操纵的模型,
[0009]‑
其中该模型考虑并评估与该交通状况相关的交通流,并以根据其评估优化交通流的方式对行驶操纵的执行进行训练,
[0010]‑
并且在该交通状况下,由自主车辆根据该模型取决于交通流执行行驶操纵。
[0011]根据本专利技术的方法,依据自主车辆的驾驶行为对交通状况相关的交通流的影响来调整自主车辆在该交通状况下的驾驶行为。在此,为了优化交通流,对自主车辆在交通状况下的驾驶行为的模型进行训练。这将根据本专利技术的方法与例如EP 3598414A1中已知的现有技术区分开来,后者是为了避免主体车辆、特别是自主车辆与其他道路使用者发生碰撞。
[0012]在训练模型时,评估自主车辆的驾驶行为对交通流的影响并根据适当的优化参数进行优化。因此,自主车辆的驾驶行为及其在模型训练期间的影响在交通流的优化方面被
回顾性地考虑和评估。这种对驾驶行为的回顾性考虑和评估是与例如从EP 3598414A1和WO 2020/040975 A1已知的现有技术的进一步区别。
[0013]在本专利技术的一个实施方案中,该模型基于人工神经网络。人工神经网络是人工智能工具,其例如用于模式识别和机器学习。因此,它们也特别适合用于在训练数据的基础上的驾驶行为的机器学习。
[0014]在本专利技术的另一个实施方案中,该模型用现实中记录的数据进行训练。特别是,该模型在此可以通过强化学习(英文Reinforced Learning)来特别奖励在现实中已由非自主车辆执行过的行驶操纵的执行。
[0015]本专利技术的上述实施方案使得自主车辆的驾驶行为适配非自主车辆的驾驶行为成为可能。特别是,由此可以避免自主车辆的过度防御性驾驶行为,过度防御性驾驶行为可能导致自主车辆不必要的行驶延迟和其他车辆的行驶阻碍。
[0016]在本专利技术的另一个实施方案中,交通状况中的交通流用自主车辆的至少一个传感器检测。可以考虑用于检测交通流的传感器为例如相机、激光雷达传感器、雷达传感器和超声传感器。自主车辆通常具有多个这样的传感器。
[0017]在本专利技术的另一个实施方案中,在评估交通流时,自主车辆的行驶延迟和自主车辆的驾驶行为造成的其他车辆的行驶延迟都被考虑在内。例如,在优化交通流时进行帕累托优化,目标是使自主车辆的行驶延迟和自主车辆的驾驶行为造成的其他车辆的行驶延迟最小化。
[0018]帕累托优化,也被称为多目标优化,是指解决具有多个通常相互冲突的目标的优化问题。在这种情况下,这些目标是包括自主车辆本身在内的不同车辆的行驶延迟的最小化。根据本专利技术的上述实施方案,在评估和优化交通流时,自主车辆本身的行驶延迟也被纳入评估。由此也可以避免自主车辆的过度防御性驾驶行为。例如,为了避免自主车辆的过度行驶延迟,可以容忍由自主车辆的行驶操纵引起的其他车辆的轻微行驶延迟。
[0019]在本专利技术的另一个实施方案中,交通状况是到达一个交叉口,自主车辆要执行的行驶操纵是驶过该交叉口,例如在交叉口转弯或在到达交叉口前自主车辆已经使用的车道上穿越交叉口。交叉口在这里是指交通路线的任何交会。例如,一条交通路线结束并与另一条交通路线相遇的路口("T形路口")也称为交叉口。到达交叉口是一个对自主车辆来说、具有潜在挑战的交通状况,因为它可能被来自不同方向的车辆驶入,而且往往有相对复杂的优选权规则需要遵守,特别是如果它不是例如由交通信号灯系统控制的交叉口。因此,根据本专利技术的方法特别针对自主车辆在到达和驶过交叉口时的驾驶行为。
[0020]在本专利技术的上述实施方案中,例如定义了下列变量,并将其用作交通流的衡量标准:
[0021]‑
自主车辆在交叉口前等待的个体等待时间,而它在它所行驶的车道上是在交叉口前等待的第一辆车,
[0022]‑
整体等待时间,表示在自主车辆所行驶的车道上,在个体等待时间期间,在自主车辆后面在交叉口前等待的车辆的总等待时间,以及
[0023]‑
主导交通流,定义为个体等待时间与个体等待时间期间使用自主车辆在驶过交叉口时必须穿过的或自主车辆必须并入的至少一条车道通过交叉口的所有车辆数量的乘积。
[0024]个体等待时间是对自主车辆的行驶延迟的一种衡量。整体等待时间是在个体等待时间期间在自主车辆后面在交叉口等待的其他车辆的等待时间之和。因此,整体等待时间是对所有车辆的行驶延迟的衡量,这些车辆由于在个体等待时间期间自主车辆在交叉口的等待而被阻碍继续使用自主车辆行驶的车道。主导交通流是对所有其他车道的交通流的衡量,在这些车道上,车辆可能被自主车辆的行驶操纵所阻碍。
[0025]在交通状况是到达交叉口的情况下,为了优化交通流,例如将自我交通流比率最小化,其定义为个体等待时间和整体等待时间之和除以主导交通流。根据自我交通流比率的定义,自我交通流比率的最小化旨在优化自主车辆的行驶延迟和由自主车辆的驾驶行为造成的其他车辆的行驶延迟之间的平衡。
[0026]或者,例如在操纵延迟最小的约束条件下将自我交通流本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自主车辆(217)的驾驶行为的适配方法,其中

定义一个交通状况,其包括将由自主车辆(217)执行的行驶操纵,

训练用于在所述交通状况下执行行驶操纵的模型,

其中所述模型考虑并评估与所述交通状况相关的交通流,并以根据其评估优化交通流的方式对行驶操纵的执行进行训练,

并且在所述交通状况下,由自主车辆(217)根据所述模型取决于交通流执行行驶操纵。2.根据权利要求1所述的方法,其中所述模型基于人工神经网络。3.根据权利要求1或2所述的方法,其中所述模型用现实中记录的数据进行训练。4.根据权利要求3所述的方法,其中所述模型通过强化学习来特别奖励在现实中已由非自主车辆执行过的行驶操纵的执行。5.根据前述权利要求中任一项所述的方法,其中所述交通状况中的交通流用自主车辆(217)的至少一个传感器检测。6.根据前述权利要求中任一项所述的方法,其中在评估交通流时,考虑自主车辆(217)的行驶延迟和自主车辆(217)的驾驶行为造成的其他车辆(208至216)的行驶延迟。7.根据权利要求6所述的方法,其中在优化交通流时进行帕累托优化,目标是使自主车辆(217)的行驶延迟和自主车辆(217)的驾驶行为造成的其他车辆(208至216)的行驶延迟最小化。8.根据前述权利要求中任一项所述的方法,其中所述交通状况是到达一个交叉口(201),行驶操纵是驶过所述交叉口(201)。9.根据权利要求8所述的方法,其中定义下列变量,并将其用作交通流的衡量标准:

自主车辆(219)在交叉口(201)前等待的个体等待时间,而它在它所行驶的车道(207)上是在交叉口(201)前等待的第一辆车,

...

【专利技术属性】
技术研发人员:丹尼尔
申请(专利权)人:均联智行有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1