【技术实现步骤摘要】
本专利技术属于图像生成,涉及一种文本引导人像生成方法、系统及设备,具体涉及一种基于扩散模型的文本引导可控人像生成方法、系统及设备。
技术介绍
1、近些年,图像生成技术已经取得了显著的发展。文本引导人像生成是通过理解文本描述中的语义,生成与文本描述相对应的人像的任务。该任务结合了自然语言处理和计算机视觉技术,为虚拟人物设计、视觉效果制作、高质量虚拟数据集增强和个性化用户体验等领域提供了创新的可能性。
2、随着深度学习技术的进步,尤其是生成对抗网络(gans)等模型的出现(creswella, white t, dumoulin v, et al. generative adversarial networks: an overview[j]. ieee signal processing magazine, 2018, 35(1): 53-65.),图像生成领域取得了重大突破。近年来,扩散模型(diffusion models)等新兴技术崭露头角(ho j, jain a,abbeel p. denoising diffusi
...【技术保护点】
1.一种基于扩散模型的文本引导可控人像生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于扩散模型的文本引导可控人像生成方法,其特征在于:步骤2中,利用区域定位网络ERLM生成语义条件指定的编辑区域遮罩的实现方式如下,
3.根据权利要求2所述的基于扩散模型的文本引导可控人像生成方法,其特征在于:所述区域定位网络ERLM,是训练好的网络;
4.根据权利要求3所述的基于扩散模型的文本引导可控人像生成方法,其特征在于:步骤3中所述基于扩散模型的图像生成网络,包含编码器和解码器;
5.根据权利要求3所述的基于扩散模
...【技术特征摘要】
1.一种基于扩散模型的文本引导可控人像生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于扩散模型的文本引导可控人像生成方法,其特征在于:步骤2中,利用区域定位网络erlm生成语义条件指定的编辑区域遮罩的实现方式如下,
3.根据权利要求2所述的基于扩散模型的文本引导可控人像生成方法,其特征在于:所述区域定位网络erlm,是训练好的网络;
4.根据权利要求3所述的基于扩散模型的文本引导可控人像生成方法,其特征在于:步骤3中所述基于扩散模型的图...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。