【技术实现步骤摘要】
基于二维图像的网格模型重建方法、系统、装置及介质
[0001]本专利技术涉及计算机视觉
,尤其是基于二维图像的网格模型重建方法、系统、装置及介质。
技术介绍
[0002]基于深度学习与表面重建的三维模型重建方法通过训练深度估计神经网络并且求解基于物理的微分方程来达到从图像还原三维模型的目的,在CG(计算机图形学)、3DCV(三维计算机视觉)、AR(增强现实)中有着大量运用。例如,在增强现实中,为了实现AR效果与周围物理场景之间的逼真与沉浸式交互,三维重建需要准确、连贯并且实时地执行。
[0003]在计算机视觉领域中,三维模型通常由网格(Mesh)表示。网格是构成三维对象的顶点,线和面的集合,大型模型通常是由较小的相互连接的平面(通常是三角形或矩形)构建而成的。在多边形网格中,每个顶点都保存着x,y,z坐标信息,每个面中都包含着顶点及顶点间的相互连接关系。对于二维图像来说,由于只存在一个方向与图像各像素的颜色,直接从图像重建三维模型是一个比较具有挑战性的问题。
[0004]相关技术方案中,三维模型重建框架将模型重建的计算流程分为两个步骤,即从彩色图像估计对应的深度贴图和使用估计的深度贴图重建点云模型然后进一步重建表面。深度估计指的是要寻找一种从图像中各像素点的颜色到各自对应的深度的映射。在获取到深度信息之后,可以通过原本生成这张贴图的相机内参数矩阵(Camera Intrinsic Matrix),完成从二维空间到三维点云(Point Cloud)的逆投影变换。但是,在深度估计方面,相关技术方案中 ...
【技术保护点】
【技术特征摘要】
1.基于二维图像的网格模型重建方法,其特征在于,包括以下步骤:获取待重建目标物表面的二维图像;通过训练后的自注意力模型对所述二维图像的图像深度区间进行分箱深度预测,得到深度箱子的线性组合;所述深度箱子用于表征深度值区间;根据所述线性组合描述所述二维图像中像素的深度值,构建得到深度图,并根据所述深度图构建目标物的模型点云;通过截断的带符号距离函数根据所述模型点云构建空间体素,根据所述空间体素与最近的目标物表面的第一距离以及所述空间体素更新的第一权重,对所述二维图像进行帧融合得到有符号的距离场;根据所述有符号的距离场通过等值面提取模型表面,根据所述模型表面还原得到所述目标物的三维网格模型。2.根据权利要求1所述的基于二维图像的网格模型重建方法,其特征在于,所述自注意力模型的训练过程,包括:通过第一训练数据训练得到所述自注意力模型中的编码器;根据特征上采样模块构建得到所述自注意力模型中的解码器;根据所述编码器、所述解码器以及自注意力模块构建得到所述自注意力模型。3.根据权利要求2所述的基于二维图像的网格模型重建方法,其特征在于,通过训练后的自注意力模型对所述二维图像的图像深度区间进行分箱深度预测,得到深度箱子的线性组合,包括:将所述二维图像输入至所述编码器进行编码,将编码结果输入至所述解码器进行解码得到所述二维图像的图像特征;根据所述图像特征进行全局注意力计算确定所述二维图像对应的深度箱子的宽度向量;将所述宽度向量与所述图像特征进行卷积运算得到范围注意力特征图,根据所述范围注意力特征图确定所述深度箱子的线性组合。4.根据权利要求3所述的基于二维图像的网格模型重建方法,其特征在于,所述根据所述图像特征进行全局注意力计算确定所述二维图像对应的深度箱子的宽度向量,包括:将所述图像特征输入至编码卷积模块,根据所述码卷积模块的内核大小、步长以及输出通道数输出得到所述图像特征的第一张量;根据所述自注意力模块的有效序列长度将所述第一张量进行展平得到第二张量;根据所述第二张量通过多层感知机中的激活函数进行激活运算输出得到第一向量,将所述第一向量进行归一化处理得到所述深度箱子的宽度向量。5.根据权利要求3所述的基于二维图像的网格模型重建方法,其特征在于,所述将所述宽度向量与所述图像特征进行卷积运算得到范围注意力特征图,根据所述范围注意力特征图确定所述深度箱子的线性组合,包括:将所述范围注意力特征图输入至卷积核中进行卷积运算,将卷积运算的结果进行分类预测,得到分类预测的分数值;根据所述深度箱子的宽度向量计算深度箱子中心位置的第一概率,根据所述第一概率以及所述分数值确定所述深度箱子的线性组合;所述线性组合用于描述像素的深度值。6.根据权利要求1所述的基于二维图像的网格模型重建方法,其特征在于,所述通过截
断的带符号距离函数根据所述模型点云构建空间体素,根据所述空间体素与...
【专利技术属性】
技术研发人员:柯建生,王兵,戴振军,陈学斌,
申请(专利权)人:广州极点三维信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。