用于高分辨率人脸图像的多样化编辑方法及系统技术方案

技术编号：37672146 阅读：13 留言：0更新日期：2023-05-26 04:34

本发明专利技术涉及人脸图像编辑技术领域，提出一种用于高分辨率人脸图像的多样化编辑方法及系统。该方法包括设置目标属性，并且根据所述目标属性生成多个采样噪声；提供低分辨率图像生成模块，向所述低分辨率图像生成模块中输入人脸图像和所述多个采样噪声以生成多个低分辨率结果图像；提供高分辨率图像生成模块，将所述多个低分辨率结果图像反演至所述高分辨率图像生成模块中以生成训练数据集；构造神经网络，通过所述神经网络从所述采样噪声拟合残差量；以及通过所述训练数据集对所述神经网络进行监督学习。通过本发明专利技术可以实现对于高分辨率人脸图像的多样化编辑并且可以保持生成图像的面部目标属性以外的其他属性不变化。像的面部目标属性以外的其他属性不变化。像的面部目标属性以外的其他属性不变化。

全部详细技术资料下载

【技术实现步骤摘要】
用于高分辨率人脸图像的多样化编辑方法及系统

[0001]本专利技术总的来说涉及人脸图像编辑
具体而言，本专利技术涉及一种用于高分辨率人脸图像的多样化编辑方法及系统。

技术介绍

[0002]现有技术中可以通过深度学习方法对人脸图像进行编辑，例如可以使得人脸图像中的人脸戴上不同风格样式的眼镜。
[0003]传统上对于低分辨率人脸图像可以使用生成对抗网络(Generative adversarial nets)对其进行编辑。生成对抗网络包括生成器以及鉴别器，所述生成器和所述鉴别器是由卷积层构成的子网络，通过对抗训练的方式，可以让所述生成器具有高性能的分布拟合能力。在图像生成过程中，所述生成器的输入是从高斯分布中随机采样的噪声，输出是一副图像；鉴别器的输入是一副图像，输出是对图像真实程度的评分。生成器的目的是欺瞒鉴别器，让所生成的图像尽可能的真实；鉴别器的目的是分辨出真实的图像和生成器生成的图像，以此来形成对抗训练。最终实现由噪声到图像的生成。基于生成对抗网络的图像编辑方法，例如SMIT(Stochastic multi
‑
label image
‑
to
‑
image translation)使用参数随机初始化后的编码器编码采样的噪声，然后和真实图像一起输入给生成器，以此获得无限的多样性，可以很好地适用于低分辨率人脸图像的多样性编辑。
[0004]然而基于生成对抗网络的图像编辑方法目前仍难以适用于高分辨率图像。现有技术中代表性的高分辨率下二维图像生...

【技术保护点】

【技术特征摘要】
1.一种用于高分辨率人脸图像的多样化编辑方法，其特征在于，包括下列步骤：设置目标属性，并且根据所述目标属性生成多个采样噪声；提供低分辨率图像生成模块，向所述低分辨率图像生成模块中输入人脸图像和所述多个采样噪声以生成多个低分辨率结果图像，其中所述多个低分辨率结果图像的所述编辑属性是各不相同的；提供高分辨率图像生成模块，将所述多个低分辨率结果图像反演至所述高分辨率图像生成模块中以生成训练数据集；构造神经网络，通过所述神经网络从所述采样噪声拟合残差量；以及通过所述训练数据集对所述神经网络进行监督学习。2.根据权利要求1所述的用于高分辨率人脸图像的多样化编辑方法，其特征在于，所述高分辨率图像生成模块包括编码器以及生成器，其中所述编码器被配置为执行下列动作：对所述多个低分辨率结果图像进行图像反演以生成多个假图代码；对所述人脸图像进行图像反演以生成真图代码；以及将所述多个假图代码减去所述真图代码以生成多个方向代码。3.根据权利要求2所述的用于高分辨率人脸图像的多样化编辑方法，其特征在于，还包括：将所述采样噪声输入所述神经网络中以生成第一代码；将所述人脸图像输入所述编码器中以生成第二代码；将所述第一代码与所述第二代码相加以生成第三代码，其中所述第三代码包括所述编辑属性；将所述第三代码输入所述第一生成器中生成粗糙图像；以及对所述神经网络进行监督学习，其中监督学习的损失函数表示为：|方向代码
‑
第一代码|。4.根据权利要求3所述的用于高分辨率人脸图像的多样化编辑方法，其特征在于，还包括：构造人脸属性分割网络，通过所述人脸属性分割网络基于所述目标属性构造优化模块；以及通过所述优化模块对所述粗糙图像进行处理以生成优化结果图像，其中所述优化结果图像的非目标属性处与所述人脸图像相同。5.根据权利要求4所述的用于高分辨率人脸图像的多样化编辑方法，其特征在于，所述目标属性包括眼镜，其中通过所述优化模块对所述粗糙图像进行处理包括下列步骤：将所述粗糙图像输入所述人脸属性分割网络以生成眼镜部位的第一蒙版；将所述第一蒙版与所述粗糙图像相乘以生成眼镜部位的第一像素值图；通过所述高分辨率图像生成模块生成第一方向代码以便去除眼镜属性；将所述第三代码与所述第一方向代码相加并且输入所述生成器中以生成第一图像；将所述第一图像输入所述人脸属性分割网络以生成眼睛部位的第二蒙版；将所述第二蒙版与所述人脸图像相乘以生成眼睛部位的眼睛部位的第二像素值...

【专利技术属性】
技术研发人员：李怡康，黄秋胜，郭建非，李新阳，杨致远，杨晓航，
申请(专利权)人：上海人工智能创新中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人