使用强化机器学习来生成激光雷达扫描图案制造技术

技术编号:38482212 阅读:17 留言:0更新日期:2023-08-15 16:59
提出了一种用于确定配备有扫描器的传感器扫描能视域(FOR)所根据的扫描图案的方法。该方法包括由处理硬件获得多个目标函数,目标函数中的每个目标函数指定扫描图案的相应特性的成本,以扫描器的一个或多个操作参数表达。该方法进一步包括由处理硬件将优化方案应用于多个目标函数以生成扫描图案。该方法进一步包括根据所生成的扫描图案扫描FOR。步包括根据所生成的扫描图案扫描FOR。步包括根据所生成的扫描图案扫描FOR。

【技术实现步骤摘要】
【国外来华专利技术】使用强化机器学习来生成激光雷达扫描图案
[0001]相关申请的引用
[0002]本申请要求于2020年12月14日提交的美国专利申请No.17/121,723的优先权,其全部内容通过引用并入本文。


[0003]本公开总地涉及自主载具系统的对象检测能力,且更特别地,涉及在自主载具操作期间准确地检测和预测车道边界位置。

技术介绍

[0004]本文提供的背景描述是为了一般性地呈现本公开的上下文。目前指定的专利技术人的工作,在本背景部分中描述的范围内,以及在提交时可能不符合现有技术的描述的方面,既不明示也不暗示地承认为反对本公开的现有技术。
[0005]当传感器系统能够根据不同的扫描图案扫描FOR时,在一些场景中改变系统扫描FOR的一个或多个维度的速度,改变最大可用FOR内的覆盖,重新扫描某个感兴趣区域,否则基于当前环境调节扫描图案,这可能是有益的。例如,传感器系统可以是在自主载具中操作并配备有扫描器的激光雷达系统,该扫描器以不同角度引导光脉冲以扫描FOR并生成对应的像素。激光雷达系统的FOR可以覆盖通常不包含有用信息的部分天空,以及部分路面(相对稀疏的数据可能足以满足自主载具的控制架构),以及道路上的对象(相对密集的数据可以产生更好的检测结果)。此外,对象可跨越FOR移动,并且控制架构可进一步受益于以更密集的方式扫描一个或多个“感兴趣区域”,从而产生更高的分辨率,和/或受益于重新扫描相同框架内的这些感兴趣区域。

技术实现思路

[0006]一般而言,使用本公开的技术,系统可以确定配备有扫描器的传感器扫描能视域(FOR)所依据的扫描图案。为此,系统寻求优化与扫描图案的各种特性(例如,系统扫描维度的速度、可用FOR内特定区域的覆盖、或重新扫描线或掉降(drop)线的效果)相对应的目标函数。系统可以根据扫描系统的某些约束来确定扫描图案,诸如扫描系统能够达到的最大速度或加速度。此外,系统可以在生成扫描图案时应用强化学习技术来解决更高级别的目标,诸如避免碰撞。
[0007]这些技术的一个示例实施例是一种确定扫描图案的方法,配备有扫描器的传感器根据该扫描图案扫描能视域(FOR),该方法包括由处理硬件获得多个目标函数,目标函数中的每一个目标函数指定扫描图案的相应特性的成本,以扫描器的一个或多个操作参数表达。该方法进一步包括由处理硬件将优化方案应用于多个目标函数以生成扫描图案。该方法进一步包括根据生成的扫描图案扫描FOR。
[0008]这些技术的另一示例性实施例是激光雷达系统,其包括:光源,其被配置为发射光脉冲;扫描器,其被配置为扫描激光雷达系统的能视域(FOR),包括将光脉冲以不同的角度
朝向FOR内的不同点引导;以及控制器,其被配置为驱动扫描器以跨越能视域引导光脉冲,包括:(i)获得多个目标函数,目标函数中的每个目标函数指定扫描图案的相应特性的成本,以扫描器的一个或多个操作参数表达,(ii)将优化方案应用于多个目标函数以生成扫描图案,以及(iii)根据生成的扫描图案扫描FOR。
附图说明
[0009]图1是示例“认知”光检测和测距(激光雷达)的框图,其被配置为优化多个目标函数以生成用于在自主载具中扫描环境的图案。
[0010]图2是可被配置为根据本公开的认知激光雷达逻辑操作的示例激光雷达的框图。
[0011]图3示出图2的激光雷达系统在识别能视域内的目标时可以产生的示例扫描图案。
[0012]图4A示出图2的激光雷达系统可以在其中操作的示例载具。
[0013]图4B示出图2的激光雷达系统可以在其中操作的另一示例载具。
[0014]图5示出实现多目标优化以生成扫描图案的认知激光雷达的示例软件架构。
[0015]图6示出示例场景中作为时间函数的竖直扫描角度的变化,以及在扫描帧开始和扫描帧结束时对应的世界状态。
[0016]图7A示出考虑到速度目标的扫描图案的一部分的示例选择;
[0017]图7B示出考虑到加速度目标的扫描图案的一部分的示例选择;
[0018]图7C示出考虑到覆盖目标的扫描图案的一部分的示例选择;
[0019]图7D示出考虑到重新扫描目标的扫描图案的一部分的示例选择。
[0020]图8是可以在本公开的系统中实现的用于训练认知激光雷达的示例方法的流程图。
[0021]图9是用于在认知激光雷达中实现强化学习的示例方法的流程图,其可以在本公开的系统中实现。
[0022]图10是用于确定扫描图案的示例方法的流程图,本公开的认知激光雷达根据该扫描图案扫描能视域。
具体实施方式
[0023]参考图1,激光雷达系统100实现多目标优化方案以确定用于扫描能视域(FOR)的扫描图案。该示例实施方式中的激光雷达系统100在自动驾驶或“自主”载具104中操作,并将扫描FOR的结果提供给自主载具104的控制架构102,该控制架构102应用根据扫描图案扫描FOR的结果以操纵自主载具104。为了扫描环境110,激光雷达系统100可以根据下面讨论的各种目标和约束生成扫描图案。扫描图案可以覆盖与激光雷达系统100的扫描器支持的最大FOR相对应的最大覆盖区域,或者扫描图案可以覆盖感兴趣区域,诸如与自主载具104前方道路大致对应的区域120B,或者与最近的障碍物(在该情况下,相邻车道中的卡车)大致对应的区域120C。
[0024]通常,激光雷达系统100可以使用多目标函数方法来实现覆盖区域的基于模型的优化和有效的重新扫描。然而,激光雷达系统100不能有效地利用基于模型的技术来同时追求自主载具104的更高级别的目标,诸如自主路径规划的执行或最小化未遂事故。这是因为在控制架构102可以实现的典型自主堆栈中,例如点云形式的激光雷达输出与所谓的感知
层以下的层相关联,控制架构102在该层检测对象、道路边界、道路标记等。换句话说,激光雷达仅向感知层提供传感器数据,然后由感知层解释传感器数据。路径规划和载具控制功能发生在比感知层更高的层。很难经由基于模型的优化向激光雷达层提供更高层的关键目标,至少是因为显式模型不存在并且原则上极难构建。
[0025]为了解决该限制,激光雷达系统100可以实现基于无模型强化学习(RL)框架的分层架构,该分层架构利用认知回路的学习方法,其中较高级别的目标针对较低的认知任务生成奖励信号。激光雷达系统100可以通过例如从自主载具104的整体状态(可以称为世界状态(WS))发送奖励信号来实现这一点,以调节较低级别的优化。更具体地,激光雷达系统100可以使用世界状态的评估来控制基于模型的优化的约束。激光雷达系统100因此可以实现认知架构,并且激光雷达系统100在下文中被称为“认知激光雷达”100。
[0026]如下文更详细讨论的,认知激光雷达100可以使用强化学习技术,基于来自控制架构102的反馈实时调节优化参数。认知激光雷达100应用多目标优化的目标可以包括表达为函数的以下中的两个或更多个:(i)速度目标函数,其指定扫描器在水平和/或竖直维度中扫描FOR的速本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种确定扫描图案的方法,配备有扫描器的传感器根据所述扫描图案扫描能视域(FOR),所述方法包括:由处理硬件获得多个目标函数,所述目标函数中的每一个目标函数指定所述扫描图案的相应特性的成本,以所述扫描器的一个或多个操作参数表达;由所述处理硬件将优化方案应用于所述多个目标函数以生成所述扫描图案;以及根据所生成的扫描图案扫描所述FOR。2.根据权利要求1所述的方法,其中:所述多个目标函数包括速度目标函数,所述速度目标函数指定所述扫描器扫描所述FOR的扫描维度的速度的成本,以及所述速度目标函数针对较高的速度生成较高的成本。3.根据权利要求2所述的方法,其中,所述速度目标函数基于扫描段的斜率和所述扫描段的长度计算所述速度的成本,所述斜率对应于随时间推移沿所述扫描维度的位移。4.根据权利要求3所述的方法,其中,所述速度目标函数根据以下计算所述速度的成本(Cost
v
):Cost
v
=(扫描段的斜率)2*扫描段的长度。5.根据权利要求1所述的方法,其中:所述多个目标函数包括加速度目标函数,所述加速度目标函数指定所述扫描器改变扫描所述FOR的扫描维度的速度的加速度的成本,以及所述加速度目标函数针对较高的加速度生成较高的成本。6.根据权利要求5所述的方法,其中,所述加速度目标函数基于具有共享端点的两个扫描段的斜率之间的差异来计算所述加速度的成本,每个扫描段的斜率对应于沿所述扫描维度的相应位移除以时间。7.根据权利要求1所述的方法,其中:所述多个目标函数包括覆盖目标函数,所述覆盖目标函数指定由所述扫描图案覆盖的区域的覆盖的成本,以及所述覆盖目标函数针对较高的覆盖生成较低的成本。8.根据权利要求6所述的方法,其中,所述覆盖目标函数基于给定覆盖与所述扫描器可用的最大覆盖之间的差异来计算所述覆盖的成本。9.根据权利要求1所述的方法,其中:所述多个目标函数包括重新扫描目标函数,所述重新扫描目标函数指定重新扫描由所述扫描图案覆盖的区域的成本,以及所述重新扫描目标函数针对较大的重新扫描区域生成较低的成本。10.根据权利要求9所述的方法,其中,所述重新扫描目标函数基于所述区域的大小和所述区域的重新扫描之间的时间间隔来计算重新扫描所述区域的成本。11.根据权利要求1所述的方法,其中:所述多个目标函数包括感兴趣区域目标函数,所述感兴趣区域目标函数指定重新扫描由所述扫描图案覆盖的感兴趣区域的成本,以及所述感兴趣区域目标函数针对较大的感兴趣区域生成较低的成本。12.根据权利要求11所述的方法,其中,所述感兴趣区域目标函数基于所述感兴趣区域
的大小相对于所述FOR的总体大小来计算扫描所述感兴趣区域...

【专利技术属性】
技术研发人员:P
申请(专利权)人:卢米诺有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1