The invention discloses a method for three-dimensional reconstruction and texture generation of single-view face based on Multi-task learning, which belongs to the field of computer vision. This method includes: the selection of special viewpoints for facial 3D model rendering; the generation of depth maps and texture maps as truth data under special viewpoints; the design of integrated learning coding network for sharing depth information and texture information features; the design of branch decoding network for recovering depth maps from shared features; and the design of mutual information maximization with shared features as latent variables. Generate the confrontation network and restore the texture expansion map; adjust the proportion of the loss function of each task and train the model; interpolate the depth map output from the network and then combine the texture map to restore the three-dimensional mesh model of the face with texture details. The invention utilizes multi-task learning to carry out three-dimensional reconstruction of single view face and texture generation and style transfer, and has the advantages of fast speed and low cost.
【技术实现步骤摘要】
基于多任务学习的单视图人脸三维重建及纹理生成的方法
本专利技术涉及计算机视觉领域,特别涉及一种基于多任务学习的单视图人脸三维重建及纹理生成的方法。
技术介绍
三维人脸模型在安全认证、影视动漫、医学科学等领域的应用非常广泛。然而同时获取精准人脸三维结构与完整高分辨率的纹理图的成本非常昂贵,且得到的纹理图也不方便后期处理,或者是存在三维结构与高分辨率纹理图不能同时获取等等各种难题。对于使用传统方法的单视图人脸三维重建及纹理生成,通常有两种技术:(1)采用阴影恢复形状(Shape-from-Shading,SFS)方法或光度立体(Photometricstereo)方法根据单个视图的彩色图像重建三维模型。由不同光照下的相同视角人脸图像信息计算出由表面法向量,再恢复出三维表面信息。该方法依赖于光照条件和光照模型的先验知识,而且它更适合重建人脸表面细节,对人头部整体的三维重建精度不高;(2)FengLiu、DanZeng和QijunZhao(LiuF,ZengD,ZhaoQ,etal.Jointfacealignmentand3dfacereconstruction[C]//EuropeanConferenceonComputerVision.Springer,Cham,2016:545-560)提出了在回归框架下的人脸对齐和三维重建,该方法在给定输入二维人脸图像上的特征点的条件下,实时重建其三维模型的方法。利用两组级联的线性回归,一组用来更新2D特征点,另一组用来更新3D人脸形状。在每一次迭代中,先用SDM(SupervisedDescentMethod)方法得到 ...
【技术保护点】
1.基于多任务学习的单视图人脸三维重建及纹理生成的方法,其特征在于,包括如下步骤:S1,基于OpenGL将虚拟相机放置于人脸头部三维模型内部,朝向人脸,在这样的渲染视点下不断调整相机内外参数,选择合适的视场角和焦距,使整个人脸展开在平面上尽可能完整地在窗口中渲染出来;S2,利用S1中得到的相机内外参数,基于CGAL计算上述渲染视点下的人脸三维模型的深度数据,并存为深度图,基于OpenGL加载人脸三维模型文件,在所述渲染视点下进行渲染,得到纹理图像,作为深度学习训练的一组真值;S3,构建深度信息与纹理信息特征共享的集成学习编码网络,将S2获得的真值数据与人脸原图数据作为一组训练数据;收集多个预训练的人脸识别模型作为元模型,第一级网络是将人脸原图数据分别输入各个元模型,将元模型的输出再次作为输入,传送给第二卷积神经级网络,利用集成学习中的集成叠加算法,最终得到人脸的特征图;S4,由S3中的集成学习编码网络得到由原始人脸图片提取到的特征图,作为深度图分支解码网络的输入,由该分支解码网络恢复出单通道的深度图;S5,由S3中的集成学习编码网络得到由原始人脸图片提取到的共享特征,作为互信息最大化对 ...
【技术特征摘要】
1.基于多任务学习的单视图人脸三维重建及纹理生成的方法,其特征在于,包括如下步骤:S1,基于OpenGL将虚拟相机放置于人脸头部三维模型内部,朝向人脸,在这样的渲染视点下不断调整相机内外参数,选择合适的视场角和焦距,使整个人脸展开在平面上尽可能完整地在窗口中渲染出来;S2,利用S1中得到的相机内外参数,基于CGAL计算上述渲染视点下的人脸三维模型的深度数据,并存为深度图,基于OpenGL加载人脸三维模型文件,在所述渲染视点下进行渲染,得到纹理图像,作为深度学习训练的一组真值;S3,构建深度信息与纹理信息特征共享的集成学习编码网络,将S2获得的真值数据与人脸原图数据作为一组训练数据;收集多个预训练的人脸识别模型作为元模型,第一级网络是将人脸原图数据分别输入各个元模型,将元模型的输出再次作为输入,传送给第二卷积神经级网络,利用集成学习中的集成叠加算法,最终得到人脸的特征图;S4,由S3中的集成学习编码网络得到由原始人脸图片提取到的特征图,作为深度图分支解码网络的输入,由该分支解码网络恢复出单通道的深度图;S5,由S3中的集成学习编码网络得到由原始人脸图片提取到的共享特征,作为互信息最大化对抗网络的输入的一部分,由该对抗网络恢复出高分辨率的彩色通道纹理图;S6,根据深度图分支解码网络与互信息最大化对抗网络的收敛速度的相对关系,给这两个网络的损失函数按比例分配权重,进行网络训练;S7,训练完模型后,输入测试的原始人脸图片,由所述深度图分支解码网络与互信息最大化对抗网络分别得到预测深度图和带真实感的人脸纹理展开图,根据需要的任意三维模型分辨率,对网络输出的深度图进行插值来生成需要的尺...
【专利技术属性】
技术研发人员:曹汛,汪晏如,朱昊,张艺迪,
申请(专利权)人:南京大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。