一种图像生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号：40273808 阅读：10 留言：0更新日期：2024-02-02 23:00

本申请涉及一种图像生成方法、装置、电子设备及存储介质。该方法包括：获取目标脸部图像、目标脸部图像对应的目标脸部特征、待迁移表情图像对应的内容描述特征和第一描述文本对应的先验图像特征，第一描述文本用于指示生成目标脸部具有目标表情的表情图像，目标脸部为目标脸部图像对应的脸部，目标表情为待迁移表情图像对应的表情；将目标脸部特征、内容描述特征和先验图像特征输入表情个性化融合模型进行表情个性化融合，得到个性化表情特征；将目标脸部图像和个性化表情特征输入表情图像生成模型进行表情图像生成，得到目标个性化表情图像。利用本申请提供的方案可以在实现表情迁移的同时更好地保持原本的脸部特征，满足用户的个性化表情需求。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及图像处理，尤其涉及一种图像生成方法、装置、电子设备及存储介质。

技术介绍

1、近些年，随着移动互联网和社交网络的快速发展，表情包分享与传播在各类即时通讯社交场景之中，表情包的使用成为年轻人个性化表达的一种重要方式，表情包可以涉及各种类型的表情内容。

2、但是，现有技术相关的表情包制作场景中，通常是对表情包的脸部表情区域进行简单地裁剪替换，无法将用户感兴趣的表情(哭、微笑等)和用户感兴趣的脸部图像进行生动地结合，从而得到用户需要的生动的个性化表情包，降低了用户体验。

技术实现思路

1、为了解决上述提出的至少一个技术问题，本申请提供了一种图像生成方法、装置、电子设备及存储介质：

2、根据本申请的第一方面，提供了一种图像生成方法，所述方法包括：

3、获取目标脸部图像、所述目标脸部图像对应的目标脸部特征、待迁移表情图像对应的内容描述特征和第一描述文本对应的先验图像特征，所述第一描述文本用于指示生成目标脸部具有目标表情的表情图像，所述目标脸部为所述目标脸部图像对应的脸部，所述目标表情为所述待迁移表情图像对应的表情；

4、将所述目标脸部特征、所述内容描述特征和所述先验图像特征输入表情个性化融合模型进行表情个性化融合，得到所述目标脸部对应的个性化表情特征；

5、将所述目标脸部图像和所述个性化表情特征输入表情图像生成模型进行表情图像生成，得到目标个性化表情图像。

6、根据本申请的第二方面，提供了一种图像生成装置，所述装置包括：

7、特征获取模块，用于获取目标脸部图像、所述目标脸部图像对应的目标脸部特征、待迁移表情图像对应的内容描述特征和第一描述文本对应的先验图像特征，所述第一描述文本用于指示生成目标脸部具有目标表情的表情图像，所述目标脸部为所述目标脸部图像对应的脸部，所述目标表情为所述待迁移表情图像对应的表情；

8、表情个性化融合模块，用于将所述目标脸部特征、所述内容描述特征和所述先验图像特征输入表情个性化融合模型进行表情个性化融合，得到所述目标脸部对应的个性化表情特征；

9、表情图像生成模块，用于将所述目标脸部图像和所述个性化表情特征输入表情图像生成模型进行表情图像生成，得到目标个性化表情图像。

10、根据本申请的第三方面，提供了一种电子设备，所述电子设备包括至少一个处理器，以及与所述至少一个处理器通信连接的存储器；其中，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或至少一段程序由所述至少一个处理器加载并执行以实现如第一方面所述的图像生成方法。

11、根据本申请的第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或至少一段程序由处理器加载并执行以实现如第一方面所述的图像生成方法。

12、根据本申请的第五方面，提供了一种计算机程序产品，所述计算机程序产品包括至少一条指令或至少一段程序，所述至少一条指令或至少一段程序由处理器加载并执行以实现如第一方面所述的图像生成方法。

13、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，而非限制本申请。

14、实施本申请，具有以下有益效果：

15、本申请的技术方案在表情图像个性化定制的应用场景中，通过获取目标脸部图像、待迁移表情图像和第一描述文本，该第一描述文本用于指示生成目标脸部具有目标表情的表情图像，该目标脸部为目标脸部图像对应的脸部，该目标表情为待迁移表情图像对应的表情，然后确定目标脸部图像对应的目标脸部特征、待迁移表情图像对应的内容描述特征和第一描述文本对应的先验图像特征，并将三种特征输入表情个性化融合模型进行表情个性化融合，得到目标脸部对应的个性化表情特征，最后将个性化表情特征和目标脸部图像输入表情图像生成模型进行表情图像生成，得到目标个性化表情图像，在实现表情迁移的同时能够更好地保持原本的脸部特征，提升目标个性化表情图像与目标脸部图像的风格统一性，满足用户的个性化表情需求，进而提升用户体验。

16、根据下面参考附图对示例性实施例的详细说明，本申请的其它特征及方面将变得清楚。

本文档来自技高网...

【技术保护点】

1.一种图像生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述表情个性化融合模型包括：跨模态融合模块和表情扩散模型，所述将所述目标脸部特征、所述内容描述特征和所述先验图像特征输入表情个性化融合模型进行表情个性化融合，得到所述目标脸部对应的个性化表情特征包括：

3.根据权利要求1所述的方法，其特征在于，所述内容描述特征是通过如下方式获取的：

4.根据权利要求1所述的方法，其特征在于，所述目标脸部特征是通过如下方式获取的：

5.根据权利要求1所述的方法，其特征在于，所述先验图像特征是通过如下方式获取的：

6.根据权利要求1所述的方法，其特征在于，所述表情图像生成模型包括：图像编码器、图像特征融合模块和图像解码器，所述将所述目标脸部图像和所述个性化表情特征输入表情图像生成模型进行表情图像生成，得到目标个性化表情图像包括：

7.根据权利要求2所述的方法，其特征在于，所述方法还包括：

8.根据权利要求7所述的方法，其特征在于，所述基于所述第一样本条件特征、所述第一样本加噪图

9.根据权利要求8所述的方法，其特征在于，所述第一表情扩散模型包括：扩散编码模块和扩散解码模块，所述第一旁路模型包括：与所述扩散编码模块并联的旁路编码模块和与所述扩散解码模块并联的旁路解码模块，所述将所述第一样本条件特征和所述第一样本加噪图像特征输入所述第二表情扩散模型，基于所述第一样本条件特征，对所述第一样本加噪图像特征进行噪声预测，得到第一样本噪声信息包括：

10.根据权利要求1至6任一所述的方法，其特征在于，所述方法还包括：

11.一种图像生成装置，其特征在于，所述装置包括：

12.一种电子设备，其特征在于，所述设备包括处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如权利要求1至10任一所述的图像生成方法。

13.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1至10任一所述的图像生成方法。

14.一种计算机程序产品，其特征在于，所述计算机程序产品包括至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1至10任一所述的图像生成方法。

...

【技术特征摘要】

1.一种图像生成方法，其特征在于，所述方法包括：

3.根据权利要求1所述的方法，其特征在于，所述内容描述特征是通过如下方式获取的：

4.根据权利要求1所述的方法，其特征在于，所述目标脸部特征是通过如下方式获取的：

5.根据权利要求1所述的方法，其特征在于，所述先验图像特征是通过如下方式获取的：

7.根据权利要求2所述的方法，其特征在于，所述方法还包括：

8.根据权利要求7所述的方法，其特征在于，所述基于所述第一样本条件特征、所述第一样本加噪图像特征和所述第一预设添加噪声信息，对所述第二表情扩散模型中的第一旁路模型进行噪声预测训练，得到第二旁路模型包括：

9.根据权...

【专利技术属性】
技术研发人员：刘刚，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人