一种多视角全身人体图像生成方法技术

技术编号：38526057 阅读：8 留言：0更新日期：2023-08-19 17:02

本发明专利技术公开了一种多视角全身人体图像生成方法，包括如下步骤：步骤1，构建人体图像生成器及判别器的主体框架；步骤2，输入一批潜在编码、人体关节点热图及相机参数，由生成器生成一批图像；步骤3，将生成的图像送入判别器，计算损失函数，以更新生成器网络参数；步骤4，将数据集中一批图像送入判别器，计算损失函数，以更新判别器网络参数，完成一次网络训练；步骤6，重复步骤2到步骤5，直至训练收敛，得到最终的全身人体图像生成器；步骤7，在测试阶段，把潜在编码、人体关节点热图及相机参数输入生成器，得到生成的图像。本申请解决了全身人体图像生成速度慢、质量低、不真实的问题，且本申请可控制生成图像的人体姿态、相机视角。本申请可控制生成图像的人体姿态、相机视角。本申请可控制生成图像的人体姿态、相机视角。

全部详细技术资料下载

【技术实现步骤摘要】
一种多视角全身人体图像生成方法

[0001]本专利技术属于图像生成与计算机图形学领域，具体涉及到一种多视角人体图像生成方法。

技术介绍

[0002]近年来，生成对抗网络(Generative Adversarial Networks,GAN)被广泛用于生成高分辨率的、高质量的逼真图像。其中，StyleGAN被提出并且成为了先进的无条件图像生成模型。相比较于先前的生成模型，StyleGAN将单独的属性因子(即样式)注入生成器，以影响生成图像的外观。在这之后，StyleGAN2重新设计了归一化、多尺度方案和正则化方法，以校正StyleGAN模型所生成的图像中的伪影。最新的StyleGAN3模型揭示了细节纹理出现在固定像素位置的非理想情况，并提出了无别名网络。
[0003]如今，如何将传统GAN的生成能力拓展到3D层面受到越来越多的关注，如何生成多视角一致的图像以及如何生成对应图像中的3D形状被广泛研究。随着神经辐射场(Neural Radiance Field,NeRF)的发展，许多工作如GRAF、GIRAFFE、StyleNeRF尝试将其引入到GAN中，以增强生成图像的多视角一致性。GIRAFFE将神经辐射场与卷积结构的解码器结合在一起，以此提升训练和渲染效率。StyleNeRF则采用类似StyleGAN结构的网络生成神经辐射场，以实现对于样式更精准的控制。StyleSDF使用有向距离场替代神经辐射场中的密度，进一步提升了几何一致性。
[0004]尽管现有的生成模型在人脸生成、物体生成方面取得了巨大进步...

【技术保护点】

【技术特征摘要】
1.一种多视角全身人体图像生成方法，其特征在于，该方法包括以下步骤：步骤1，构建多视角全身人体图像生成器及判别器的主体框架；步骤2，输入一批潜在编码、人体关节点热图及相机参数，由生成器生成一批全身人体图像；步骤3，将生成的全身人体图像及对应的人体关节点热图、相机参数送入判别器，计算损失函数，以更新生成器网络参数；步骤4，将一批真实的全身人体图像及其对应的人体关节点热图、相机参数送入判别器，计算损失函数，以更新判别器网络参数，完成一次网络训练；步骤5，重复步骤2到步骤4，直至训练收敛，得到最终的全身人体图像生成器；步骤6，在测试阶段，把潜在编码、人体关节点热图及相机参数输入最终的生成器，得到生成的全身人体图像。2.根据权利要求1所述的一种多视角全身人体图像生成方法，其特征在于，所述步骤1中，生成器包含姿态编码器、骨干网络、体渲染模块以及超分辨率模块；姿态编码器由多个残差模块组成，能提取人体关节点热图中的有效信息，为生成过程提供引导，减少生成难度；骨干网络为StyleGAN2生成器结构，包括一个映射网络及多层上采样模块，其输入为潜在编码、人体关节点热图及相机参数，能生成中间表征，用于体渲染；骨干网络输出的特征图经空间变换，转化为三平面表征，该表征在保证信息有效性的同时，节省了存储空间，提升了生成器生成效率；体渲染模块采用相机参数进行光线采样，在三平面表征提取特征，以渲染得到特征图像，体渲染使得在测试阶段能通过输入不同的相机视角参数，控制生成的人体图像的观察视角；超分辨率模块以特征图像为输入，输出上采样8倍分辨率后的全身人体图像，该模块使得体渲染无需直接渲染大尺寸图像，提升生成器运行速度。3.根据权利要求1所述的一种多视角全身人体图像生成方法，其特征在于，所述步骤1中，...

【专利技术属性】
技术研发人员：杨万扣，陈子威，杨森，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人