【技术实现步骤摘要】
一种基于深度学习的多视图三维重建方法
[0001]本专利技术属于几何计算机视觉三维重建领域,涉及一种基于深度学习的多视图三维重建方法。
技术介绍
[0002]近年来,随着深度学习的发展计算机视觉问题的解决都得到了较大程度的发展。近期各种二维图像处理的技术逐渐被完善适用于三维问题中,物体三维形状的重建也成为了热点问题之一。以往的许多方法都需要完整的三维模型数据进行监督,然而这样的数据是稀少且获取过程复杂代价昂贵的。由此出现了多视图三维重建方法。与传统的三维重建方法相比,基于深度学习的三维重建方法能够将全局的语义信息引入图像重建之中,从而提升弱光照、弱纹理区域的重建效果。
[0003]目前的深度学习方法在进行深度估计时,大多都采用三维卷积正则化进行代价体归一化以评估得出深度图。此种评估方法在低复杂度场景的环境下能保持较好的重建精度,但重建过程需要消耗大量的显卡内存,并且对于高复杂度场景的重建存在重建精度不足的问题。
技术实现思路
[0004]本方案针对上文提到的问题和需求,提出一种基于深度学习的多视图三维 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的多视图三维重建方法,其特征在于,包括一下步骤:步骤1:构建多尺度特征提取网络,对获取的多张多视角图像进行多尺度的语义特征提取,得到多个尺度的目标关键特征;步骤2:在预设定的深度范围内,在深度倒数空间内进行深度采样得到亚像素级的深度候选假设;步骤3:基于卷积注意力机制与残差网络,结合多尺度特征图对深度候选假设进行像素级深度评估迭代计算获得深度图,并通过可变性卷积网络进行自适应滤波平滑深度图;步骤4:将得到的深度图与参考视图的特征图输入深度优化网络之中,获取深度残差信息进行深度图优化;步骤5:通过光照一致性约束和几何一致性约束对深度图进行过滤,基于可见性的融合算法进行深度图融合,获取三维场景重建结果,输出三维点云。2.如权利要求1所述的基于深度学习的多视图三维重建方法,其特征在于,基于图像特征金字塔结构,使用卷积神经网络对多张多视角图像进行多尺度特征提取得到原始特征图。对低分辨率的原始特征图再施加一个上采样层,与下一个尺度的原始特征图进行融合,获取具有丰富语义信息的目标特征。对相邻两个尺度之间的原始特征图都采用上述的上采样融合处理,获得多种尺度的特征图。3.如权利要求2所述的基于深度学习的多视图三维重建方法,其特征在于,在迭代计算过程中,对于初次迭代,在深度值的倒数空间范围内,给定候选深度假设数量,进行均匀采样并对每个深度候选假设添加随机数得到初始的候选假设。基于可变性卷积网络,获取每个像素点的相似像素点的坐标从而进行深度采样,获得新的候选假设以增强模型的健壮性。4.如权利要求3所述的基于深度学习的多视图三维重建方法,其特征在于,在迭代计算过程中,对于随后的迭代计算,为了纠正之前迭代计算中的错误评估,根据上一次迭代计算生成的深度图,对每个像素的候选深度值添加随机数进行扰动,获得本次迭代计算的初始深度候选假设。同样的,通过可变性卷积网络进行相似像素点深度采样,获取本次迭代的新的深度候选假设。5.如权利要求4所述的基于深度学习的多视图三维重建方法,其特征在于,多视图深度评估计算深度图的过程包括:通过卷积注意力模块获取参考视图I
i
上像素p的权重信息w
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。