一种基于深度对抗生成网络的文本生成人脸方法技术

技术编号：33093484 阅读：37 留言：0更新日期：2022-04-16 23:23

针对从文本描述生成人脸图像，本发明专利技术设计了一种基于深度对抗生成网络的文本生成人脸方法。主要涉及从文本描述生成图像领域的应用，尤其涉及社会公共安全领域中根据目击者对目标人物的描述进行画像的应用。本方法包含数据集制作，网络模型设计，网络模型参数训练，网络模型性能测试四个部分。本发明专利技术充分发挥对抗生成网络在图像生成方面的优越性，设计了从文本生成人脸的一套优良解决方案，在公共安全、人脸图像修复、影视传媒和考古研究等领域具有较为广阔的应用前景。较为广阔的应用前景。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度对抗生成网络的文本生成人脸方法

[0001]本专利技术涉及计算机视觉领域，具体涉及基于深度学习的文本到图像生成、人脸生成领域的应用，尤其涉及一种基于深度学习的从文本描述生成人脸图像的应用。

技术介绍

[0002]近年来，基于深度学习的图像生成技术发展迅速，该技术已经应用到了社会的各个领域中，比如影视媒体、相机美颜、计算机辅助修图、换脸、考古研究和图像修复等。其中从文本描述到图像生成的技术也越来越成熟，出现了AttnGAN、DM-GAN、KT-GAN等技术在文本描述到图像生成方面取得了较大的突破，这些技术将会逐渐地应用到相关的各个领域。在社会公共安全领域，在对犯罪份子进行追捕时，往往会从目击者对目标人物的描述中获取到面貌的关键信息，甚至需要专业人员根据目击者的描述进行人脸画像。为此，研究从文本描述到人脸的生成技术，不但在公共安全领域有着较大的应用前景，在人脸图像修复、影视娱乐和考古研究等领域都有着较大的应用前景。
[0003]目前文本到图像的生成技术研究已经越来越成熟，但专注于文本到人脸生成方面的研究非常的少，还处于起步阶段。当前，只根据文本描述要生成与原始人脸相似的人脸图像技术难度高，还需要在技术上不断进步，本专利技术在该领域进行了创新和取得了一定的突破。

技术实现思路

[0004]本专利技术针对从文本描述到图像生成领域，尤其是从文本描述到人脸生成方面的问题，提供了一种基于深度对抗生成网络的文本生成人脸方法。该方法采用三级对抗生成网络，分别生成64
×
64、128...

【技术保护点】

【技术特征摘要】
1.一种基于深度对抗生成网络的文本生成人脸方法，其特征在于包括以下步骤：步骤一：数据集制作，在公开人脸数据集上选取人脸图像并对其进行文本描述，然后将描述完成的人脸图像和文本描述数据随机拆分为训练集和测试集；步骤二：网络模型设计，提出双通道对抗生成网络(Dual-channel Generative Adversarial Network,DualGAN)模型，同时引入感知损失函数(Perceptual Loss)来引导网络模型根据文本描述生成更逼真的人脸图像；步骤三：网络模型参数训练，将步骤一中的训练数据集输入到步骤二中的模型进行训练，并根据中间结果不断对网络模型参数进行调整和优化；步骤四：网络模型性能测试，将步骤一中的测试数据集输入到步骤三训练好的网络模型中进行人脸生成测试，并引入人脸相似度(Face Similarity Score,FSS)和人脸相似度距离(Face Similarity Distance,FSD)来对生成的人脸图像进行评价。2.根据权利要求1所述的基于深度对抗生成网络的文本生成人脸方法，其特征在于步骤二中的网络模型，采用的是三级对抗生成网络，第一级生成的人脸图像分辨率大小为64<...

【专利技术属性】
技术研发人员：何小海，罗晓东，张津，刘露平，卿粼波，吴小强，滕奇志，
申请(专利权)人：四川大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人