The invention discloses a method based on deep learning from a single photo recovery method of scene basic 3D structure, which comprises the following steps: (1) using convolutional neural networks, a series of transform operations on the input image, get the semantic labels for each pixel; (2) using the output image semantic segmentation map. The original belongs to the foreground part removed, a removal of the prospects to be repaired; (3) for all pixels to be repaired, the repair priority, combined with the highest priority is to remove the semantic information of pixels near, from step (2) to find the best matching block in the output graph. The best matching block is copied to the mending position; (4) according to the ground elevation, the intersection of steps (3) the repaired image folding operation, a vertical surface of the ground, vertical output Graph, so as to achieve the recovery of the basic three-dimensional structure of the scene.
【技术实现步骤摘要】
一种基于深度学习从单幅照片恢复出场景基本三维结构的方法
本专利技术属于虚拟现实领域,具体涉及一种基于深度学习从单幅照片恢复出场景基本三维结构的方法,其为通过对单幅图像进行图像语义分割、目标去除、图像修复及图像翻折等一系列操作,实现三维场景重建的方法。
技术介绍
三维场景重建是机器视觉的核心任务之一,也是人工智能研究领域中的一个重要研究方向。随着数字城市、智慧城市的发展,场景重建技术已成为近年来广大学者研究的热点。在本专利技术前,已经有人对场景重建技术做了相关研究。基于图片的三维场景重建方法分为双目视觉三维重建方法和单目视觉三维重建方法。双目视觉三维重建方法使用两台摄像机从两个视点(左右平行或上下平行)观测同一物体,获取在物体不同视角下的感知图像,通过三角测量的方法将匹配点的视差信息转换为深度信息。该种方法大致可以分为图像获取、摄像机标定、特征提取与匹配、摄像机校正、立体匹配和三维建模六个步骤。双目视觉三维重建方法的优点是方法成熟,能够稳定地获得较好的重建结果;不足是运算量很大,且在基线距离较大的情况下重建效果明显降低。鉴于双目视觉三维重建方法的不足,以及时下深度学习突飞猛进的发展,本专利技术将深度学习与单目视觉三维重建方法相结合,提出一种基于单幅图像进行场景重建的方法。目前,基于单幅图像的场景重建最广泛和最实用的方法利用几何投影的原理进行重建。每一幅图像中含有的大量平行线、平行面、垂直线、垂直面、消失点、消失线等多种几何属性的约束,利用图像的这些几何约束进行摄像机标定或平面标定。进而估算出摄像机的内部各种参数、摄像机的焦距;然后通过测量目标的几何形状或计算 ...
【技术保护点】
一种基于深度学习从单幅照片恢复出场景基本三维结构的方法,其特征在于:包括如下步骤:步骤一、利用深度卷积神经网络对图片进行处理,具体步骤为:(ft1)对输入图进行卷积、池化及非线性变换等操作,得到图片的特征图;(ft2)在完成适当次数的步骤(ft1)操作后,对最后一张输出图进行逐像素分类,得到每个像素的类别,并为每个像素打上语义标签;(ft3)对步骤(ft2)的输出进行反卷积等处理,提高其分辨率,从而得到更多细节信息,作为输出结果图,记为M1;步骤二、目标去除是利用图像语义分割的输出结果图,扣除原图中前景的操作,其步骤为:(cm1)将图像语义分割的结果图转化为二值图,二值图中,属于前景部分的像素值为0;(cm2)以原图和步骤(cm1)得到的二值图作为输入,两张图中,坐标值相同的像素进行按位相与操作,得到的结果图即为去除了前景的待修复图,记为G2;步骤三、图像修复是根据目标去除操作的输出结果图中的背景部分,修复输出结果图中被去除部分的操作,其步骤为:(xt1)确定原图中地面、立面交线;(xt2)确定待修补像素的优先级;(xt3)根据待修复像素可能属于的类别,在步骤(cm2)得到的输出结果图 ...
【技术特征摘要】
1.一种基于深度学习从单幅照片恢复出场景基本三维结构的方法,其特征在于:包括如下步骤:步骤一、利用深度卷积神经网络对图片进行处理,具体步骤为:(ft1)对输入图进行卷积、池化及非线性变换等操作,得到图片的特征图;(ft2)在完成适当次数的步骤(ft1)操作后,对最后一张输出图进行逐像素分类,得到每个像素的类别,并为每个像素打上语义标签;(ft3)对步骤(ft2)的输出进行反卷积等处理,提高其分辨率,从而得到更多细节信息,作为输出结果图,记为M1;步骤二、目标去除是利用图像语义分割的输出结果图,扣除原图中前景的操作,其步骤为:(cm1)将图像语义分割的结果图转化为二值图,二值图中,属于前景部分的像素值为0;(cm2)以原图和步骤(cm1)得到的二值图作为输入,两张图中,坐标值相同的像素进行按位相与操作,得到的结果图即为去除了前景的待修复图,记为G2;步骤三、图像修复是根据...
【专利技术属性】
技术研发人员:周忠,李明阳,庚琦川,吴威,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。