基于深度学习的单帧图像三维模型表面重建方法技术

技术编号：22221741 阅读：90 留言：0更新日期：2019-09-30 02:56

本发明专利技术提供了一种基于深度学习的单帧图像三维模型表面重建方法，包括步骤：对CAD模型进行采样与渲染，生成模型真实形状点云与不同视点不同距离下的单帧图像；通过卷积神经网络对图像进行特征提取，获得二维图像的高层语义；将获得的高层语义通过全连接神经网络模块转化为三维重建阶段NURBS曲面变化所需要的控制点坐标与权值参数；利用得到的控制点坐标与权值参数对初始化的NURBS模型进行更新，逐步进行三维重建；训练深度学习模型，将训练样本输入深度学习模型自动训练，得到最优模型参数，完成三维重建。本发明专利技术能够简单高效地对单帧图像进行三维重建，重建的三维模型具有细节丰富、表面流畅和整体良好的特点。

Surface Reconstruction of Three-dimensional Model of Single-frame Image Based on Deep Learning

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的单帧图像三维模型表面重建方法
本专利技术涉及计算机视觉领域，尤其涉及一种基于深度学习的单帧图像三维模型表面重建方法。
技术介绍
三维重建是指将真实场景中的三维物体在计算机中建立数学模型的过程，是计算机视觉领域的一个热门研究方向。相比于二维图像，三维模型能够提供物体的整体信息，更加全面的展示物体特性，因而在计算机动画、人机交互、现代医学等多个领域都有着广泛的应用。随着深度学习的快速发展，单帧图像三维重建领域取得了新的突破。研究者利用卷积神经网络对单帧图像进行特征提取，经过特定的特征映射方法，重建特定的表达形式的三维模型。然而不同的表达形式之间存在一定差异，其精确度、鲁棒性和算法复杂度都影响着三维模型的生成效果。目前三维模型的表达形式主要有体素、点云和网格。体素表达形式跟图像的二维像素相似，只不过是从二维的像素点扩展到三维的立方体单元。但是在三维空间中，体素分辨率提升是以立方为单位增加的，这会导致算法复杂度迅速升高。由于目前的计算机的内存限制，高分辨率三维体素模型的重建十分困难。点云表达形式通过直接回归三维空间点坐标的方式来完成三维重建，方法简单，易于实现。但是，由于点与点没有局部连接，点云在表示连续的三维模型时效果不好，容易导致细节丢失，重建的三维模型常常缺乏表面流畅性。网格表达形式通过顶点与边的连接来来重建三维模型。该表达形式能有效避免点与点之间自由度过高的问题，能够形成稳定的，细节丰富的三维模型。但在现有方法中，顶点的接受域较窄，这意味着一个顶点不能有效地接受来自多个边的其他顶点的特征，容易导致顶点陷入局部最优，重建的三维模型整体不够鲁棒。...

【技术保护点】
1.一种基于深度学习的单帧图像三维模型表面重建方法，其特征在于，包括以下步骤：步骤一：对CAD模型进行采样与渲染，生成模型真实形状点云与不同视点不同距离下的单帧图像；步骤二：通过卷积神经网络对图像进行特征提取，获得二维图像的高层语义；步骤三：将获得的高层语义通过全连接神经网络模块转化为三维重建阶段NURBS曲面变化所需要的控制点坐标与权值参数；步骤四：利用得到的控制点坐标与权值参数对初始化的NURBS模型进行更新，逐步进行三维重建；步骤五：训练深度学习模型，将训练样本输入深度学习模型自动训练，得到最优模型参数，完成三维重建。

【技术特征摘要】
1.一种基于深度学习的单帧图像三维模型表面重建方法，其特征在于，包括以下步骤：步骤一：对CAD模型进行采样与渲染，生成模型真实形状点云与不同视点不同距离下的单帧图像；步骤二：通过卷积神经网络对图像进行特征提取，获得二维图像的高层语义；步骤三：将获得的高层语义通过全连接神经网络模块转化为三维重建阶段NURBS曲面变化所需要的控制点坐标与权值参数；步骤四：利用得到的控制点坐标与权值参数对初始化的NURBS模型进行更新，逐步进行三维重建；步骤五：训练深度学习模型，将训练样本输入深度学习模型自动训练，得到最优模型参数，完成三维重建。2.如权利要求1所述的基于深度学习的单帧图像三维模型表面重建方法，其特征在于，在步骤一中，采用OpenGL对CAD模型进行采样与渲染，生成训练样本。3.如权利要求2所述的基于深度学习的单帧图像三维模型表面重建方法，其特征在于，在步骤二中，对每个训练样本的图像都使用相同的VGG16模型进行高层语义提取，即通过下式对每个训练样本的输入图像进行特征提取：式中，N为正整数；表示第n个类别中第i个CAD训练样本中第j张图片所产生的高层语义；ExtractVGG16表示VGG16特征提取网络；表示第n个类别中第i个CAD训练样本中第j张图片。4.如权利要求3所述的基于深度学习的单帧图像三维模型表面重建方法，其特征在于，在步骤二中，ExtractVGG16包括输入层、卷积层、池化层以及输出层，对卷积层输出结果进行非线性修正；卷积层之间或卷积层与输入层之间关系如下式：式中，Conv(i,j)表示第k卷积层中i行j列的数据，Wk-1,k(m,n)表示第k-1卷积层到第k卷积层的卷积核中第m行n列的数据，bk-1,k表示第k-1个隐含层向第k个隐含层的线性...

【专利技术属性】
技术研发人员：杨路，杨经纶，李佑华，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人