应用深度学习的二维影像转三维影像的系统与方法技术方案

技术编号：31725510 阅读：14 留言：0更新日期：2022-01-05 15:50

本发明专利技术公开一种应用深度学习的二维影像转三维影像的系统，其包括一二维(Two

全部详细技术资料下载

【技术实现步骤摘要】
应用深度学习的二维影像转三维影像的系统与方法

[0001]本专利技术涉及一种二维影像转三维影像的系统与方法，特别是涉及一种应用深度学习的二维影像转三维影像的系统与方法。

技术介绍

[0002]在三维(Three-Dimension，3D)影像中，其所包含的信息(例如影像中物体形状或景深程度等)比二维(Two-Dimension，2D)影像更多，因此，直接从2D影像推测3D影像形状对计算机而言并不是容易的工作。然而，对人类来说，对于生活中常见到的物体，常常可以从单一角度看，就可以推测物体的整个形状(在三维空间中的样子)，人类之所以能做到这样是因为长久经验的累积，因此对于计算机而言，如果能学习足够多的2D影像以及3D形状的信息，理应可以将2D影像成功地转换为3D影像。
[0003]因此，近来有不少应用深度学习的2D影像转3D影像的方法，利用大量的训练数据(例如：影像以及相对应的三维形状)来训练深度学习的神经网络建构的模型，达到由单张或多张2D影像作为输入，推测转换为3D影像。
[0004]然而，采用深度学习方法预测2D影像的景深时，并无法准确模拟还原真实3D影像的景深程度，而且逐帧(frame)景深结果难以将影像的抖动问题消除。另外，影像的景深预测是应用卷积神经网络(Convolutional Neural Network，CNN)模型来做预测，深度学习的模型训练损失函数不可能降到0，误差总存在。以深度影像为基础的绘图(Depth-Image-Based Rendering，DIBR)转换模型需要设定多个...

【技术保护点】

【技术特征摘要】
1.一种应用深度学习的二维影像转三维影像的系统，其包括：一二维(Two-Dimension，2D)影像景深生成模块，包括：一2D影像采集单元，用于接收至少一2D影像；以及一景深计算单元，连接所述2D影像采集单元，用于进行至少一所述2D影像的至少一景深图的建立；一新视角生成模块，连接所述景深计算单元，用于结合至少一所述2D影像与至少一所述景深图，以输出一三维(Three-Dimension，3D)影像；以及一3D影像显示器，连接所述新视角生成模块，用于显示所述3D影像。2.如权利要求1所述的应用深度学习的二维影像转三维影像的系统，其中，所述新视角生成模块包括一3D影像生成模块，所述3D影像生成模块应用3D的(Depth-Image-Based Rendering，DIBR)技术，将至少一所述2D影像与至少一所述景深图结合以输出所述3D影像。3.如权利要求2所述的应用深度学习的二维影像转三维影像的系统，其中，所述新视角生成模块还进一步包括一空洞修复模块，以修复所述3D影像。4.如权利要求1所述的二维影像转三维影像的系统，其中，所述景深计算单元应用卷积神经网络(Convolutional Neural Network，CNN)模型于至少一所述2D影像中，以获得至少一所述景深图。5.如权利要求4所述的应用深度学习的二维影像转三维影像的系统，其中，所述卷积神经网络模型采用联合损失函数，其方程序程序为L＝I
depth
+λI
grad
+μI
normal
，其中，λ与μ为子损失函数的权重系数、I
depth
为全域景深图欧拉损失函数、I
grad
为空间倒数损失函数以及I
normal
为表面法向量点积误差损失函数。6.如权利要求5所述的应用深度学习的二维影像转三维影像的系统，其中，所述全域景深图欧拉损失函数所述景深图空间倒数损失函数所述表面法向量点积误差损失函数其中，设di为影像(pix)的预测景深值，gi为标签景深值，影像误差可表示为e
i
＝||d
...

【专利技术属性】
技术研发人员：郑江红，闫鑫，施清德，
申请(专利权)人：深圳市博浩光电科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人