【技术实现步骤摘要】
【国外来华专利技术】结构注释
[0001]本公开涉及对图像、点云和其他形式的感知输入中捕获的结构进行注释。这种注释可应用于创建经注释的感知输入以便用于训练机器学习(ML)感知组件。
技术介绍
[0002]结构感知是指一类数据处理算法,能够有意义地解释感知输入中捕获的结构。这种处理可应用于不同形式的感知输入。感知输入一般是指任何结构表示,即在其中捕获结构的任何数据集。结构感知可应用于二维(2D)和三维(3D)空间。将结构感知算法应用于既定结构输入的结果可编码为结构感知输出。
[0003]一种形式的感知输入是二维(2D)图像,即,仅有颜色分量(一个或多个颜色通道)的图像。最基本形式的结构感知是图像分类,即,将图像作为整体相对于一组图像类进行简单分类。更复杂形式的应用于2D空间的结构感知包括2D对象检测和/或定位(例如,2D空间中的定向、位姿和/或距离估计)、2D实例分割等。其他形式的感知输入包括三维(3D)图像,即至少具有深度分量(深度通道)的图像;3D点云,例如使用RADAR或LIDAR捕获或源自3D图像的3D点云;基于体素或网格的结构表示,或任何其他形式的3D结构表示。可应用于3D空间的感知算法例如包括3D对象检测和/或定位(例如,3D空间中的距离、方位或位姿估计)等。单感知输入也可以由多图像形成。例如,可以在一对立体2D图像中捕捉立体深度信息,这对图像可用作3D感知的基础。3D结构感知也可应用于单个2D图像,例如单目深度提取,从单个2D图像中提取深度信息(应当注意,即使无任何深度通道仍可在其一个或多个颜色通道中捕捉一定程度的深 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种创建一个或多个经注释感知输入的计算机实施方法,所述方法包括:在注释计算机系统中:接收多个捕获帧,每一帧均包括3D结构点集,其中捕获公共结构组件的至少一部分;计算多帧中至少一个参考帧内的参考位置;通过基于该帧内的参考位置选择性提取参考帧的3D结构点来生成所述公共结构组件的3D模型;基于所述3D模型与多帧的目标帧中的公共结构组件自动对齐,确定所述目标帧内3D模型的对齐模型位置;及将所述对齐模型位置的注释数据与该目标帧的至少一个感知输入相关联地存储在计算机存储器中,以便注释其中的公共结构组件。2.根据权利要求1所述的方法,其中,所述对齐模型位置的注释数据包括所述对齐模型位置的位置数据,用于注释所述目标帧的至少一个感知输入中公共结构组件的位置。3.根据权利要求2所述的方法,其中,所述位置数据为用于注释所述公共结构组件在3D空间中的位置的3D位置数据。4.根据权利要求2或3所述的方法,其中,所述对齐模型位置的注释数据包括使用所述对齐模型位置从所述3D模型派生的注释数据。5.根据权利要求4所述的方法,其中,从3D模型派生的数据为通过如下方式派生的2D注释数据:基于所述对齐模型位置将所述3D模型投影到图像平面中;或将通过基于所述对齐模型位置从所述目标帧中选择性提取3D结构点而生成的单帧或聚合3D模型投影到图像平面中。6.根据权利要求5所述的方法,其中,所述2D注释数据包括如下至少之一:拟合到所述3D模型或所述单帧或聚合3D模型在图像平面中的投影的2D边界对象;以及用于所述公共结构组件的分割掩膜。7.根据任一项前述权利要求所述的方法,其中,基于用户界面处关于所述参考帧所接收的一个或多个定位输入来计算所述参考帧的参考位置,同时渲染所述参考帧内参考位置的视觉指示,用于手动调整所述参考帧内的参考位置。8.根据任一项前述权利要求所述的方法,其中,所述对齐模型位置的确定是通过初始估计所述目标帧内的模型位置,然后应用自动对齐来调整估计的模型位置。9.根据权利要求8所述的方法,其中,所述模型位置为自动初始估计,或作为手动定义位置,由用户界面处所接收的一个或多个手动位置输入表示。10.根据权利要求9所述的方法,其中,所述模型位置是通过将结构感知组件应用于所述目标帧而自动初始估计。11.根据权利要求9或10所述的方法,其中,多帧为时序帧,所述模型位置是基于所述时序帧的时间间隔内的公共结构组件路径而自动初始估计。12.根据权利要求11所述的方法,其中,基于应用于所述目标帧的自动对齐来更新所述公共结构组件路径。13.根据权利要求12所述的方法,其中,经更新的公共结构组件路径用于计算所述公共结构组件在多帧中除目标帧外的一帧内的位置。
14.根据权利要求13所述的方法,包括如下步骤:存储针对所述一帧所计算的位置的2D或3D注释数据,用于注释该帧的至少一个感知输入中的公共结构组件。15.根据任一项前述权利要求所述的方法,其中,执行自动对齐以优化定义的成本函数,其奖励所述3D模型与所述公共结构组件的匹配,同时惩罚所述公共结构组件的意外行为,如所述公共结构组件的预期行为模型所定义。16.根据权利要求12的从属权利要求15所述的方法,其中,所述定义的成本函数惩罚所述公共结构组件路径的意外变化,如所述预期行为模型所定义。17.根据权利要求11至14或16中任一项所述的方法,其中,所述公共结构组件路径用于计算所述参考帧内的参考位置以生成所述3D模型。18.根据任一项前述权利要求所述的方法,其中,所述对齐模型位置是基于如下组合来半自动确定:(i)自动对齐以初始计算所述模型位置的粗略对齐估计;以及(ii)用户界面处关于所述目标帧所接收的一个或多个手动对齐输入,同时在所述目标帧内渲染所述3D模型以调整粗略对齐模型位置,从而确定所述对齐模型位置。19.根据权利要求1至17中任一项所述的方法,其中,自动确定所述对齐模型位置而无需任何手动对齐输入。20.根据任一项前述权利要求所述的方法,其中,自动或半自动计算所述参考帧内的参考位置以生成所述3D模型。21.根据权利要求20所述的方法,其中,通过将感知组件应用于所述参考帧,自动或半自动计算所述参考位置。22.根据任一项前述权利要求所述的方法,其中,所述自动对齐包括迭代最近点。23.根据任一项前述权利要求所述的方法,其中,所述自动对齐使用如下至少之一:颜色匹配、2D特征匹配和3D特征匹配。24.根据任一项前述权利要求所述的方法,其中,...
【专利技术属性】
技术研发人员:罗伯特,
申请(专利权)人:法弗人工智能有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。