基于人工神经网络的RGB图像场景三维模型重建方法技术

技术编号：22974964 阅读：17 留言：0更新日期：2019-12-31 23:31

本发明专利技术公开了一种基于人工神经网络的RGB图像场景三维模型重建方法。本发明专利技术使用人工神经网络模型对输入的图像进行处理，识别得到场景的二维拓扑结构和场景中物体的类别和形状，进一步对神经网络输出的特征图进行优化，该优化分为拓扑结构优化和物体识别优化两个模块进行；随后使用该信息迭代计算得到三维模型的参数，包括平面到相机中心距离、平面法向量；使用OpenGL进行三维模型渲染，利用原输入图像中的像素颜色对重建得到的三维平面进行颜色渲染，得到更接近输入图像中场景的三维模。本发明专利技术使用单目的RGB信息还原三维信息，减少硬件成本，使用优化算法求解得到场景中拓扑平面和构成物体平面的法向量和到相机中心距离。

3D model reconstruction of RGB image scene based on artificial neural network

全部详细技术资料下载

【技术实现步骤摘要】
基于人工神经网络的RGB图像场景三维模型重建方法
本专利技术属于计算机视觉、计算机图形学
，特别地，本专利技术涉及一种基于人工神经网络的单张RGB图像场景三维模型重建方法。
技术介绍
RGB图像是目前最广泛应用的媒体数据形式，可以快速捕捉，记录周围三维世界的信息。使用单张RGB图像重建图像中记录场景的三维模型，是计算机视觉与计算机图形学领域中一个重要且基础的问题，在人机交互，虚拟现实及增强现实等领域中有着非常广泛的应用。例如，在增强现实领域中，使用RGB相机拍摄了一张场景的二维图像，重建得到该场景的三维模型，可以方便地对场景三维模型进行编辑修改，通过虚拟的三维模型看到对场景进行改动后整体场景的呈现效果，给人类日常生活和工作的很多方面提供了便利。正是由于根据RGB图像重建三维模型有着良好的应用前景，但目前仍存在较多问题需要克服，该基础课题研究具有较高的科研和应用价值。然而根据RGB图像对重建场景的三维拓扑及场景中对象三维模型具有相当大的挑战性，主要瓶颈限制是缺乏潜在的场景三维信息，具体而言，缺少深度信息使得改变视角或合理地解决物体之间的遮挡遮挡和照明变化具有挑战性，这是对场景中物体进行对象级别操作所必需的，而场景中物体对场景墙面与地面，墙面与墙面，墙面与天花板之间交线存在较多遮挡，也为重建场景的三维拓扑增加了难度。在计算机视觉领域，对复杂室内场景进行较好的布局识别和三维重建一直是一个重要但具有挑战性的问题。因此，本专利技术中的方法利用人工神经网络模型对室内场景进行布局识别和场景物体检测，克服传统方...

【技术保护点】
1.基于人工神经网络的RGB图像场景三维模型重建方法，其特征在于使用人工神经网络模型对输入的图像进行处理，识别得到场景的二维拓扑结构和场景中物体的类别和形状，进一步对神经网络输出的特征图进行优化，该优化分为拓扑结构优化和物体识别优化两个模块进行；随后使用该信息迭代计算得到三维模型的参数，包括平面到相机中心距离、平面法向量；使用OpenGL进行三维模型渲染，利用原输入图像中的像素颜色对重建得到的三维平面进行颜色渲染，得到更接近输入图像中场景的三维模型；/n所述的二维拓扑结构是指地面与墙面、天花板与墙面、墙面与墙面之间的交线三类交线组成的结构。/n

【技术特征摘要】
1.基于人工神经网络的RGB图像场景三维模型重建方法，其特征在于使用人工神经网络模型对输入的图像进行处理，识别得到场景的二维拓扑结构和场景中物体的类别和形状，进一步对神经网络输出的特征图进行优化，该优化分为拓扑结构优化和物体识别优化两个模块进行；随后使用该信息迭代计算得到三维模型的参数，包括平面到相机中心距离、平面法向量；使用OpenGL进行三维模型渲染，利用原输入图像中的像素颜色对重建得到的三维平面进行颜色渲染，得到更接近输入图像中场景的三维模型；
所述的二维拓扑结构是指地面与墙面、天花板与墙面、墙面与墙面之间的交线三类交线组成的结构。

2.根据权利要求1所述的一种基于人工神经网络的RGB图像场景三维模型重建方法，其特征在于包括如下步骤：
步骤1.训练阶段：
用到两个人工神经网络模型，分别实现场景的二维拓扑结构识别和物体检测功能，需要分别进行训练；
二维拓扑结构识别的人工神经网络模型：
首先更改训练数据：原始数据集中对室内场景的三类交线进行标记，groundtruth中包含了地面与墙面、天花板与墙面、墙面与墙面之间的交线三类交线的标记数据，采用墙面与地面交线、墙面与墙面交线、墙面与天花板交线三类交线来定义室内场景的二维拓扑，从而将室内常见的二维拓扑识别看作是回归得到三类交线位置的问题；其中使用的数据集为LSUN；
其次设计神经网络并训练，实现对室内场景的二维拓扑识别；选择卷积残差神经网络作为网络的基本结构，为了使得网络能够输出矩阵，在网络的顶端用卷积层代替一般的全连接层，实现对室内场景的二维拓扑识别，输出为场景中三类交线的位置预测结果
物体检测的人工神经网络模型：
设计网络并训练，实现对室内场景的语义分割，从而检测到场景中物体的分布情况及轮廓；搭建人工神经网络模型，选择卷积残差神经网络和金字塔池化网络作为网络的基本结构，为了使得网络能够输出矩阵，在网络的顶端用卷积层代替一般的全连接层，实现对室内场景的语义分割；输入数据为普通RGB图片，对应的groundtruth为输入图片中的场景人工语义...

【专利技术属性】
技术研发人员：颜成钢，付祖贤，邵碧尧，俞灵慧，孙垚棋，张继勇，张勇东，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人