一种从单幅照片恢复出场景基本三维结构的方法技术

技术编号：16606243 阅读：340 留言：0更新日期：2017-11-22 16:16

本发明专利技术公开了一种基于深度学习从单幅照片恢复出场景基本三维结构的方法，其步骤为：(1)利用深度卷积神经网路，对输入图片进行一系列变换操作，得到每一个像素的语义标签；(2)利用图像语义分割的输出结果图，将原图中属于前景的部分去掉，得到一张去除了前景的待修复图；(3)对于所有待修复像素，确定其修复优先级，结合当前优先级最高的被去除像素点附近的语义信息，从步骤(2)的输出图中寻找最佳匹配块，将该最佳匹配块复制到待修补位置处；(4)根据地面、立面交线，对步骤(3)得到的修复完毕的图像进行翻折操作，得到一张地面、立面相垂直的输出图，从而实现场景基本三维结构的恢复工作。

A method of recovering the basic 3D structure of a scene from a single photo based on deep learning

The invention discloses a method based on deep learning from a single photo recovery method of scene basic 3D structure, which comprises the following steps: (1) using convolutional neural networks, a series of transform operations on the input image, get the semantic labels for each pixel; (2) using the output image semantic segmentation map. The original belongs to the foreground part removed, a removal of the prospects to be repaired; (3) for all pixels to be repaired, the repair priority, combined with the highest priority is to remove the semantic information of pixels near, from step (2) to find the best matching block in the output graph. The best matching block is copied to the mending position; (4) according to the ground elevation, the intersection of steps (3) the repaired image folding operation, a vertical surface of the ground, vertical output Graph, so as to achieve the recovery of the basic three-dimensional structure of the scene.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习从单幅照片恢复出场景基本三维结构的方法
本专利技术属于虚拟现实领域，具体涉及一种基于深度学习从单幅照片恢复出场景基本三维结构的方法，其为通过对单幅图像进行图像语义分割、目标去除、图像修复及图像翻折等一系列操作，实现三维场景重建的方法。
技术介绍
三维场景重建是机器视觉的核心任务之一，也是人工智能研究领域中的一个重要研究方向。随着数字城市、智慧城市的发展，场景重建技术已成为近年来广大学者研究的热点。在本专利技术前，已经有人对场景重建技术做了相关研究。基于图片的三维场景重建方法分为双目视觉三维重建方法和单目视觉三维重建方法。双目视觉三维重建方法使用两台摄像机从两个视点(左右平行或上下平行)观测同一物体，获取在物体不同视角下的感知图像，通过三角测量的方法将匹配点的视差信息转换为深度信息。该种方法大致可以分为图像获取、摄像机标定、特征提取与匹配、摄像机校正、立体匹配和三维建模六个步骤。双目视觉三维重建方法的优点是方法成熟，能够稳定地获得较好的重建结果；不足是运算量很大，且在基线距离较大的情况下重建效果明显降低。鉴于双目视觉三维重建方法的不足，以及时下深度学...
一种从单幅照片恢复出场景基本三维结构的方法

【技术保护点】
一种基于深度学习从单幅照片恢复出场景基本三维结构的方法，其特征在于：包括如下步骤：步骤一、利用深度卷积神经网络对图片进行处理，具体步骤为：(ft1)对输入图进行卷积、池化及非线性变换等操作，得到图片的特征图；(ft2)在完成适当次数的步骤(ft1)操作后，对最后一张输出图进行逐像素分类，得到每个像素的类别，并为每个像素打上语义标签；(ft3)对步骤(ft2)的输出进行反卷积等处理，提高其分辨率，从而得到更多细节信息，作为输出结果图，记为M1；步骤二、目标去除是利用图像语义分割的输出结果图，扣除原图中前景的操作，其步骤为：(cm1)将图像语义分割的结果图转化为二值图，二值图中，属于前景部分的像素...

【技术特征摘要】
1.一种基于深度学习从单幅照片恢复出场景基本三维结构的方法，其特征在于：包括如下步骤：步骤一、利用深度卷积神经网络对图片进行处理，具体步骤为：(ft1)对输入图进行卷积、池化及非线性变换等操作，得到图片的特征图；(ft2)在完成适当次数的步骤(ft1)操作后，对最后一张输出图进行逐像素分类，得到每个像素的类别，并为每个像素打上语义标签；(ft3)对步骤(ft2)的输出进行反卷积等处理，提高其分辨率，从而得到更多细节信息，作为输出结果图，记为M1；步骤二、目标去除是利用图像语义分割的输出结果图，扣除原图中前景的操作，其步骤为：(cm1)将图像语义分割的结果图转化为二值图，二值图中，属于前景部分的像素值为0；(cm2)以原图和步骤(cm1)得到的二值图作为输入，两张图中，坐标值相同的像素进行按位相与操作，得到的结果图即为去除了前景的待修复图，记为G2；步骤三、图像修复是根据...

【专利技术属性】
技术研发人员：周忠，李明阳，庚琦川，吴威，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人