The invention belongs to the field of three-dimensional vision technology, in particular to a method for reconstructing a three-dimensional mesh model of an object by using a single color image. The method of the invention includes: designing a multi-layer full-convolution feature network for image to extract features at different levels of the image; setting an initial ellipsoid for three-dimensional mesh, representing it by graph neural network, continuously deforming the ellipsoid using image features to approximate the real shape; and designing a projection layer to connect the image end with the three-dimensional mesh end, under this framework. Train an end-to-end neural network, that is, give a color image and output the corresponding three-dimensional mesh model. This method has the advantages of smooth, complete and rich details of three-dimensional modeling results, and the reconstruction accuracy has been effectively improved. It is very suitable for practical applications in virtual reality, animation games, production and manufacturing industries.
【技术实现步骤摘要】
一种利用单张彩色图的三维网格重建方法
本专利技术属于三维视觉
,具体涉及利用单张彩色图重建物体三维网格模型的方法。
技术介绍
三维数据有多种表示形式,包括立体栅格、点云、网格等。立体栅格是一种规则的数据结构,即将物体表示为N*N*N的矩阵,受分辨率和表达能力限制,这种表示方法通常缺乏细节,难以表示复杂形状;三维点云是一种不规则的数据结构,由于点之间没有局部连结关系,点云往往只能表示物体的大概形状,缺乏物体的表面信息;三维网格同样是一种不规则的数据结构,由点、边和面组成,由于其轻量、形状细节丰富等特性,在虚拟现实、动画游戏、生产制造等实际产业中应用越来越广泛。从物体的二维图片推断其三维立体形状是人类的一种基本视觉功能,但是对计算机来说却非常具有挑战。基于多视图几何(MVG)的方法已经较好地研究了三维重建,主要研究方向包括及时定位与地图构建(SLAM)和用于大规模高质量重建的运动结构方法(SfM)。虽然它们在这些场景中非常成功,但它们受到以下因素的限制:1)多个视图可提供的覆盖范围;2)想要重建的对象的外观。前者意味着MVG不能重建物体的不可见部分,因此想要进行较好的重建通常需要获得大量视角的图片;后者意味着MVG不能重建非朗伯(例如反射或透明)或无纹理的物体。这些限制导致近年来越来越多采用基于学习的方法进行三维重建。近年来,基于学习的方法已经在3D重建领域有所突破,但是受限于卷积神经网络的特性,之前的方法都是生成点云或者规则的立体栅格,两种表示方法都缺乏表面细节。文[1]从大型数据集中检索形状组件,将它们组装起来并进行形状分解以适应输入图像。这种方法依 ...
【技术保护点】
1.一种利用单张彩色图的三维网格重建方法,其特征在于,包括:对于图像,设计一个多层的全卷积特征网络,用于提取图片不同层次的特征;对于三维网格,设置一个初始椭球,用图神经网络表示,利用图片特征不断对椭球进行形变,以逼近真实形状;同时,设计投影层连接图像端和三维网格端,在此框架下训练一个端到端的神经网络,即给定一张彩色图,输出对应的三维网格模型。
【技术特征摘要】
1.一种利用单张彩色图的三维网格重建方法,其特征在于,包括:对于图像,设计一个多层的全卷积特征网络,用于提取图片不同层次的特征;对于三维网格,设置一个初始椭球,用图神经网络表示,利用图片特征不断对椭球进行形变,以逼近真实形状;同时,设计投影层连接图像端和三维网格端,在此框架下训练一个端到端的神经网络,即给定一张彩色图,输出对应的三维网格模型。2.根据权利要求1所述的三维网格重建方法,其特征在于,具体步骤为:(1)收集二维图片及其对应的三维标注信息:首先收集大量原始三维CAD模型;对于二维图像,随机初始化一些相机参数,通过渲染CAD模型的方式合成图片;对于三维标签,在原始CAD模型上均匀采样固定数量的点,并记录每个点的法向量,生成含有法向量信息的点云数据;(2)构建一个初始椭球网格模型:设置空间隐性方程:x2+2*y2+2*(z+0.8)2-0.08=0,然后在方程上均匀采样,得到一个含有156个顶点、308个面的三角椭球网格模型;三维网格由节点、边和面构成,用图来表示,用邻接矩阵表示图中节点间的连接关系,若两个节点相连则值不为零,若不相连则值为零,由于此邻接矩阵中大部分值都为零,所以用稀疏矩阵的形式表示;(3)构建从图像生成三维网格的深度神经网络,具体包括两部分,第一部分是图片特征网络,设计一个18层的卷积神经网络,此神经网络由卷积层和池化层构成;每2-3个卷积层后面使用一个池化层进行特征降维,用此卷积神经网络提取图像特征;第二部分是...
【专利技术属性】
技术研发人员:姜育刚,付彦伟,王南洋,张寅达,李著文,
申请(专利权)人:复旦大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。