【技术实现步骤摘要】
【国外来华专利技术】结构建模
[0001]本公开涉及3D建模并具有各种应用,包括对图像、点云和其他形式的感知输入中捕获的结构进行注释。这种注释可应用于创建经注释的感知输入以便用于训练机器学习(ML)感知组件。其他应用包括训练数据增强和模拟。
技术介绍
[0002]结构感知是指一类数据处理算法,能够有意义地解释感知输入中捕获的结构。这种处理可应用于不同形式的感知输入。感知输入一般是指任何结构表示,即在其中捕获结构的任何数据集。结构感知可应用于二维(2D)和三维(3D)空间。将结构感知算法应用于既定结构输入的结果可编码为结构感知输出。
[0003]一种形式的感知输入是二维(2D)图像,即,仅有颜色分量(一个或多个颜色通道)的图像。最基本形式的结构感知是图像分类,即,将图像作为整体相对于一组图像类进行简单分类。更复杂形式的应用于2D空间的结构感知包括2D对象检测和/或定位(例如,2D空间中的定向、位姿和/或距离估计)、2D实例分割等。其他形式的感知输入包括三维(3D)图像,即至少具有深度分量(深度通道)的图像;3D点云,例如使用RADAR或LIDAR捕获或源自3D图像的3D点云;基于体素或网格的结构表示,或任何其他形式的3D结构表示。可应用于3D空间的感知算法例如包括3D对象检测和/或定位(例如,3D空间中的距离、方位或位姿估计)等。单感知输入也可以由多图像形成。例如,可以在一对立体2D图像中捕捉立体深度信息,这对图像可用作3D感知的基础。3D结构感知也可应用于单个2D图像,例如单目深度提取,从单个2D图像中提取深度信息(应当注意,即 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种对公共结构组件进行建模的计算机实施方法,所述方法包括:在建模计算机系统中:接收多个捕获帧,每一帧均包括3D结构点集,其中捕获公共结构组件的至少一部分;计算多帧中至少一个第一帧内的第一参考位置;基于针对所述第一帧所计算的第一参考位置来选择性提取所述第一帧的第一3D结构点;计算多帧中第二帧内的第二参考位置;基于针对所述第二帧所计算的第二参考位置来选择性提取所述第二帧的第二3D结构点;聚合所述第一3D结构点和所述第二3D结构点,从而基于所述第一参考位置和所述第二参考位置生成所述公共结构组件的聚合3D模型。2.根据权利要求1所述的方法,其中,所述聚合3D模型用来生成用于注释多帧中一帧的感知输入中公共结构组件的注释数据,所述一帧为多帧中的第一帧、第二帧或第三帧。3.根据权利要求2所述的方法,其中,所述注释数据包括如下至少之一:通过将所述3D模型投影到图像平面中而派生的2D注释数据和3D注释数据。4.根据权利要求2或3所述的方法,其中,所述一帧为第三帧,其中,所述方法包括如下步骤:计算所述第三帧内3D模型的对齐模型位置,所述注释数据为该计算位置的注释数据,其中,所述对齐模型位置是基于如下至少之一:(i)自动对齐过程,其中所述注释计算机系统将所述3D模型与所述第三帧中的公共结构组件相匹配以自动对齐所述3D模型;及(ii)在用户界面处关于所述第三帧所接收的一个或多个手动对齐输入,同时渲染所述3D模型以手动对齐所述3D模型与所述第三帧中的公共结构组件。5.根据任一项前述权利要求所述的方法,其中,通过选择性提取所述第一3D结构点来生成第一3D模型,其中,所述第二参考位置与所述第二帧中的公共结构组件对齐,以基于如下至少之一来生成聚合3D模型:(i)所述第一3D模型与所述第二帧中的公共结构组件的自动对齐;(ii)在用户界面处关于所述第二帧所接收的一个或多个手动对齐输入,同时渲染所述第一3D模型,以手动对齐所述第一3D模型与所述第二帧中的公共结构组件。6.根据权利要求5所述的方法,其中,在多帧中第三帧内捕捉公共结构组件的至少一部分,所述方法包括:将第三参考位置与所述第三帧中的公共结构组件对齐,这是基于如下至少之一:(i)所述3D聚合模型与所述第三帧中的公共结构组件的自动对齐;(ii)用户界面处关于所述第三帧所接收的一个或多个手动对齐输入,同时渲染所述聚合3D模型,以手动对齐所述聚合3D模型与所述第三帧中的公共结构组件;基于所述第三参考位置来选择性提取所述第三帧的第三3D结构点;聚合所述第一3D结构点、所述第二3D结构点和所述第三3D结构点,从而基于所述第一参考位置、所述第二参考位置和所述第三参考位置来生成所述公共结构组件的第二聚合3D模型。7.根据任一项前述权利要求所述的方法,其中,初始估计所述第二帧内的第二参考位
置以生成所述聚合3D模型,并基于所述第二帧和所述第二帧内对齐的第二参考位置来更新所述聚合3D模型。8.根据权利要求7所述的方法,其中,所述聚合3D模型经由用户界面渲染,并随着所述用户界面处关于所述第二帧所接收的一个或多个手动对齐输入来更新和重新渲染以手动对齐所述第二参考位置与所述公共结构组件,从而所述第二参考位置与所述第二帧中的公共结构组件对齐的效果是校正经渲染的聚合3D模型中因所述第二参考位置的初始错位所致的视觉伪影。9.根据权利要求2的从属权利要求5至8中任一项所述的方法,其中,所述一帧为第二帧,所述注释数据为对齐的第二参考位置的注释数据。10.根据权利要求9所述的方法,其中,所述注释数据包括对齐的第二参考位置的位置数据,用于注释所述目标帧的至少一个感知输入中公共结构组件的位置,例如用于注释所述公共结构组件在3D空间中的位置的3D位置数据。11.根据权利要求9或10所述的方法,其中,所述注释数据包括使用对齐的第二参考位置从所述聚合3D模型派生的数据,例如通过基于对齐的第二参考位置将所述3D模型投影到图像平面中而派生的2D注释数据。12.根据任一项前述权利要求所述的方法,其中,所述第一3D结构点是基于所述第一参考位置和一个或多个边界对象尺寸而从用于生成所述3D模型的第一帧中选择性提取;其中,所述第二3D结构点是基于所述第二参考位置以及如下之一而从用于生成所述3D模型的帧中选择性提取:相同的一个或多个边界对象尺寸,用于建模刚性对象;一个或多个边界对象尺寸的变换,用于建模非刚性对象。13.根据权利要求12所述的方法,其中,所述一个或多个边界对象尺寸是如下之一:(i)基于针对所述第一帧和所述第二帧中的至少一帧所接收的一个或多个尺寸输入而手动确定;(ii)通过将感知组件应用于所述第一帧和所述第二帧之中的至少一帧而自动确定;(iii)通过将所述感知组件应用于所述至少一帧并进一步基于针对所述至少一帧所接收的一个或多个尺寸输入而半自动确定;(iv)假设。14.根据权利要求12或13所述的方法,其中,所述第一3D结构点是由所述第一参考位置和所述一个或多个边界对象尺寸所定义的第一3D体积内的点子集;其中,所述第二3D结构点是由所述第二参考位置和相同的一个或多个边界对象尺寸或其变换所定义的第二3D体积内的点子集。15.根据任一项前述权利要求所述的方法,其中,所述聚合3D模型用于借助所述聚合3D模型的模型数据来增强多帧中一帧的数据,从而创建至少一个增强感知输入,包括所述一帧的数据和所述3D模型的模型数据,所述一帧为多帧中的第一帧、第二帧或第三帧。16.根据权利要求15所述的方法,其中,模型数据包括如下至少之一:通过将所述3D模型投影到图像平面中而创建的2D增强数据;及3D模型数据。17.根据权利要求2或15或其任一项从属权利要求所述的方法,包括如下步骤:使用如下至少之一来训练至少一个感知组件:
(i)根据权利要求15所述的增强感知输入,由此在训练期间将所述模型数据和所述一帧的数据的组合作为相同感知输入的一部分提供...
【专利技术属性】
技术研发人员:罗伯特,
申请(专利权)人:法弗人工智能有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。