人脸图像生成方法、装置、设备及存储介质制造方法及图纸

技术编号：36072638 阅读：13 留言：0更新日期：2022-12-24 10:43

本发明专利技术提供了一种人脸图像生成方法、装置、设备及存储介质，其中，该方法包括：获取输入的草图和人脸属性；将草图输入预设的人脸生成模型中，通过所述人脸生成模型计算所述草图中各分区的令牌序列，并基于所述令牌序列计算所述草图的全局注意力；根据所述全局注意力计算所述草图的图像特征；将所述图像特征映射至人脸特征空间，并将映射至人脸特征空间的图像特征进行特征编辑，得到所述草图的对应的人脸特征；根据所述人脸特征生成对应的人脸图像。本方式中，通过计算草图的全局注意力实现高质量提取图像特征，降低对草图质量的要求，可以从粗糙甚至不完整的徒手素描中生成高质量的面部图像，并通过特征编辑功能提高生成人脸的可编辑范围。可编辑范围。可编辑范围。

全部详细技术资料下载

【技术实现步骤摘要】
embedding层计算所述草图中对应分区的令牌序列；通过所述stage中的Transformer Encoder根据所述令牌序列计算所述草图的全局注意力。
[0010]可选的，在本专利技术第一方面的第三种实现方式中，所述特征编辑网络由clip模型和全连接层构成；所述将所述图像特征映射至人脸特征空间，并将映射至人脸特征空间的图像特征进行特征编辑，得到所述草图的对应的人脸特征包括：将所述图像特征映射至人脸特征空间；通过所述特征编辑网络中的clip模型提取所述人脸属性的文字特征信息；通过所述特征编辑网络中的全连接层将所述文字特征信息映射至人脸特征空间，并根据人脸特征空间中的图像特征和文字特征信息得到所述草图的对应的人脸特征。
[0011]可选的，在本专利技术第一方面的第四种实现方式中，所述根据所述人脸特征生成对应的人脸图像包括：获取至少一个随机噪声，并通过所述人脸生成网络基于至少一个所述随机噪声和所述人脸特征生成至少一个人脸图像。
[0012]可选的，在本专利技术第一方面的第五种实现方式中，所述人脸生成网络由多个生成模块构成，每个生成模块由特征层和上采样层构成；所述通过所述生成器基于所述随机噪声和所述人脸特征生成初始图像包括：将所述随机噪声通过权重解调的方式叠加至每个生成模块的特征层中；将预设的固定输入输入至第一生成模块中的特征层中，并将所述人脸特征通过自适应归一化的方式加入所述特征层中，生成对应的人脸特征图像，并通过对应的上采样层输入处理后，作为下一生成模块的输入；重复进行人脸特征图像生成的步骤，直至最后一个生成模块输出，将最后一个生成...

【技术保护点】

【技术特征摘要】
1.一种人脸图像生成方法，其特征在于，所述人脸图像生成方法包括：获取输入的草图和人脸属性；将草图输入预设的人脸生成模型中，通过所述人脸生成模型计算所述草图中各分区的令牌序列，并基于所述令牌序列计算所述草图的全局注意力；根据所述全局注意力计算所述草图的图像特征；将所述图像特征映射至人脸特征空间，并将映射至人脸特征空间的图像特征进行特征编辑，得到所述草图的对应的人脸特征；根据所述人脸特征生成对应的人脸图像。2.根据权利要求1所述的人脸图像生成方法，其特征在于，所述人脸生成模型包括特征提取网络、特征编辑网络和人脸生成网络。3.根据权利要求2所述的人脸图像生成方法，其特征在于，所述特征提取网络由M个stage以及N个styleblock构成，所述stage由Patch embedding层和Transformer Encoder组成，所述M和N均为大于1的自然数；所述将草图输入预设的人脸生成模型中，通过所述人脸生成模型计算所述草图中各分区的令牌序列，并基于所述令牌序列计算所述草图的全局注意力包括：将草图输入预设的人脸生成模型中，通过所述特征提取网络中的M个stage的Patch embedding层计算所述草图中对应分区的令牌序列；通过所述stage中的Transformer Encoder根据所述令牌序列计算所述草图的全局注意力。4.根据权利要求2所述的人脸图像生成方法，其特征在于，所述特征编辑网络由clip模型和全连接层构成；所述将所述图像特征映射至人脸特征空间，并将映射至人脸特征空间的图像特征进行特征编辑，得到所述草图的对应的人脸特征包括：将所述图像特征映射至人脸特征空间；通过所述特征编辑网络中的clip模型提取所述人脸属性的文字特征信息；通过所述特征编辑网络中的全连接层将所述文字特征信息映射至人脸特征空间，并根据人脸特征空间中的图像特征和文字特征信息得到所述草图的对应的人脸特征。5.根据权利要求2所述的人脸图像生成方法，其特征在于，所述根据所述人脸特征生成对应的人脸图像包括：获取至少一个随机噪声，并通过所述人脸生成网络基于至少一个所述随机噪声和所述人脸特征生成至少一个人脸图像。6.根据权利要求5所述的人脸图像生成方法，其特征在于，所述人脸生成网络由多个生成模块构成，每个生成模块由特征层和上采样层构成；所述通过所述生成器基于所述随机噪声和所述人脸特征生成初始图像包括：将所述随机噪声通过权重解调的方式叠加至每个生成模块的特征层中；将预设的固定输入输入至第一生成模块中的特征层中，并将所述人脸特征通过自适应归一化的方式加入所述特征层中，生成对应的人脸特征图像，并通过对应的上采样层输入处理后，作为下一生成模块的输入；重复进...

【专利技术属性】
技术研发人员：习思，陈康，李天惠，张伟东，
申请(专利权)人：网易杭州网络有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人