采用使用神经网络从二维图像预测的三维数据以用于3D建模应用制造技术

技术编号：28388251 阅读：20 留言：0更新日期：2021-05-08 00:18

所公开的主题涉及采用机器学习模型，所述机器学习模型被配置为使用深度学习技术来从2D图像预测3D数据以导出所述2D图像的3D数据。在一些实施例中，描述了一种系统，所述系统包括存储计算机可执行部件的存储器，以及执行存储在所述存储器中的所述计算机可执行部件的处理器。所述计算机可执行部件包括：接收部件，所述接收部件被配置为接收二维图像；以及三维数据导出部件，所述三维数据导出部件被配置为采用一个或多个三维数据自二维数据(3D自2D)神经网络模型以导出所述二维图像的三维数据。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】采用使用神经网络从二维图像预测的三维数据以用于3D建模应用
本申请整体涉及用于采用三维(3D)数据以用于3D建模应用和其他应用的技术，该三维数据是使用神经网络从二维(2D)图像预测的。
技术介绍
交互式、第一人称3D沉浸式环境变得越来越流行。在这些环境中，用户能够在虚拟空间中巡览。这些环境的示例包括第一人称视频游戏和用于可视化地形的3D模型的工具。空中导航工具允许用户从空中视点虚拟地探索三维城市区。全景导航工具(例如，街道视图)允许用户查看环境的多个360度(360°)全景图，并且通过视觉混合插值在这些多个全景图之间导航。此类交互式3D沉浸式环境可基于从真实环境捕获的照片级2D图像，利用相应2D图像的3D深度信息根据真实世界环境生成。虽然针对2D图像捕获3D深度的方法已经存在了十多年，但此类方法传统上昂贵且需要复杂的3D捕获硬件，诸如光检测和测距(LiDAR)设备、激光测距仪设备、渡越时间传感器设备、结构化光传感器设备、光场相机等。此外，当前对准软件在功能和易用性方面仍然受到限制。例如，现有对准方法诸如迭代最近点算法(ICP)要求用户手动输入初始粗略对准。这种手动输入通常超出大多数非技术用户的能力，并抑制已捕获图像的实时对准。因此，高度需要用于使用可负担的、用户友好的设备来生成2D图像的3D数据的技术，以及用于使用该3D数据来准确且有效地对准2D图像以生成沉浸式3D环境的技术。附图说明图1呈现了根据本文描述的各个方面和实施例的示例性系统，该示例性系统促成从2D图像数据导出3D数...

【技术保护点】
1.一种系统，包括：/n存储器，所述存储器存储计算机可执行部件；以及/n处理器，所述处理器执行存储在所述存储器中的所述计算机可执行部件，其中所述计算机可执行部件包括：/n接收部件，所述接收部件被配置为接收二维图像；以及/n三维数据导出部件，所述三维数据导出部件被配置为采用一个或更多个三维数据自二维数据即3D自2D神经网络模型以导出所述二维图像的三维数据。/n

【技术特征摘要】
【国外来华专利技术】20180925 US 16/141,5581.一种系统，包括：
存储器，所述存储器存储计算机可执行部件；以及
处理器，所述处理器执行存储在所述存储器中的所述计算机可执行部件，其中所述计算机可执行部件包括：
接收部件，所述接收部件被配置为接收二维图像；以及
三维数据导出部件，所述三维数据导出部件被配置为采用一个或更多个三维数据自二维数据即3D自2D神经网络模型以导出所述二维图像的三维数据。

2.根据权利要求1所述的系统，其中所述计算机可执行部件还包括：
建模部件，所述建模部件被配置为基于分别与所述二维图像相关联的所述三维数据来确定所述二维图像和公共三维坐标空间之间的对准。

3.根据权利要求2所述的系统，其中所述建模部件被进一步配置为基于所述对准来生成所述二维图像中包括的对象或环境的三维模型。

4.根据权利要求3所述的系统，其中所述计算机可执行部件还包括：
渲染部件，所述渲染部件被配置为促成经由设备的显示器来渲染所述三维模型。

5.根据权利要求3所述的系统，其中所述计算机可执行部件还包括：
导航部件，所述导航部件被配置为促成对如经由设备的显示器渲染的三维模型进行导航。

6.根据权利要求1所述的系统，其中所述计算机可执行部件还包括：
渲染部件，所述渲染部件被配置为促成经由设备的显示器渲染所述二维图像的相应图像的所述三维数据。

7.根据权利要求1所述的系统，其中所述计算机可执行部件还包括：
通信部件，所述通信部件被配置为经由网络将所述二维图像和所述三维数据发送到外部设备，其中基于接收到所述二维图像和所述三维数据，所述外部设备通过基于所述三维数据将所述二维图像彼此对准来生成所述二维图像中包括的对象或环境的三维模型。

8.根据权利要求1所述的系统，其中所述二维图像包括具有超过最小阈值并跨越至360度的视场的宽视场图像。

9.根据权利要求1所述的系统，其中所述计算机可执行部件还包括：
拼接部件，所述拼接部件被配置为组合所述二维图像中的两个或更多个第一图像以生成具有比所述两个或更多个第一图像的相应视场大的视场的第二图像，并且其中所述三维数据导出部件被配置为采用所述一个或更多个3D自2D神经网络模型以从所述第二图像导出所述三维数据中的至少一些。

10.根据权利要求1所述的系统，其中所述接收部件被进一步配置为接收由一个或更多个三维传感器捕获的所述二维图像的一部分的深度数据，并且其中所述三维数据导出部件被进一步配置为将所述深度数据用作所述一个或更多个3D自2D神经网络模型的输入以导出所述二维图像的所述三维数据。

11.根据权利要求10所述的系统，其中所述一个或更多个三维传感器选自由以下组成的组：结构化光传感器、光检测和测距传感器即LiDAR传感器、激光测距仪传感器、渡越时间传感器、光场相机传感器和主动立体传感器。

12.根据权利要求10所述的系统，其中所述二维图像包括具有第一竖直视场的全景彩色图像，其中所述深度数据对应于所述第一竖直视场内的第二竖直视场，并且其中所述第二竖直视场包括比所述第一竖直视场窄的视场。

13.根据权利要求1所述的系统，其中所述二维图像包括具有跨越至360度的水平视场的全景图像对，并且其中从相对于同一竖直轴线的不同竖直位置捕获所述全景图像对中包括的相应图像，其中所述不同竖直位置偏移立体图像对距离。

14.根据权利要求1所述的系统，其中所述系统位于...

【专利技术属性】
技术研发人员：D·A·高斯贝克，M·T·贝尔，W·K·阿卜杜拉，P·K·哈恩，
申请(专利权)人：马特波特公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人