生成图像的方法、装置、可读介质及电子设备制造方法及图纸

技术编号：37146345 阅读：11 留言：0更新日期：2023-04-06 21:58

本公开实施例涉及一种生成图像的方法、装置、可读介质及电子设备。该方法包括：获取用于描述目标对象的第一文本，获取第二文本；将第一文本和第二文本输入预先生成的目标图像生成模型中，得到目标图像生成模型输出的目标图像；其中，该目标图像包括目标对象和第二文本对应的文字信息，该目标图像生成模型包括第一文本编码器和第二文本编码器，第一文本编码器用于对第一文本进行编码得到第一文本对应的第一文本特征，第二文本编码器用于对第二文本进行编码，得到第二文本对应的第二文本特征，目标图像生成模型还用于根据第一文本特征和第二文本特征生成目标图像。这样，可以在生成的目标图像中包含清晰的文字信息。的目标图像中包含清晰的文字信息。的目标图像中包含清晰的文字信息。

全部详细技术资料下载

【技术实现步骤摘要】
生成图像的方法、装置、可读介质及电子设备

[0001]本公开涉及计算机
，具体地，涉及一种生成图像的方法、装置、可读介质及电子设备。

技术介绍

[0002]随着计算机技术的进步，图像生成技术取得了较大的进展，例如，可以输入一段对图像内容进行描述的文本，可以根据文本生成符合文本描述要求的图像。
[0003]但是，在相关技术中，无法在生成的图像中包含清晰的文字信息。

技术实现思路

[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
[0005]根据本公开实施例的第一方面，提供一种生成图像的方法，所述方法包括：
[0006]获取用于描述目标对象的第一文本；
[0007]获取第二文本；
[0008]将所述第一文本和所述第二文本输入预先生成的目标图像生成模型中，得到所述目标图像生成模型输出的目标图像；
[0009]其中，所述目标图像包括所述目标对象和所述第二文本对应的文字信息，所述目标图像生成模型包括第一文本编码器和第二文本编码器，所述第一文本编码器用于对所述第一文本进行编码，得到所述第一文本对应的第一文本特征，所述第二文本编码器用于对所述第二文本进行编码，得到所述第二文本对应的第二文本特征，所述目标图像生成模型用于根据所述第一文本特征和所述第二文本特征生成所述目标图像。
[001...

【技术保护点】

【技术特征摘要】
1.一种生成图像的方法，其特征在于，所述方法包括：获取用于描述目标对象的第一文本；获取第二文本；将所述第一文本和所述第二文本输入预先生成的目标图像生成模型中，得到所述目标图像生成模型输出的目标图像；其中，所述目标图像包括所述目标对象和所述第二文本对应的文字信息，所述目标图像生成模型包括第一文本编码器和第二文本编码器，所述第一文本编码器用于对所述第一文本进行编码，得到所述第一文本对应的第一文本特征，所述第二文本编码器用于对所述第二文本进行编码，得到所述第二文本对应的第二文本特征，所述目标图像生成模型用于根据所述第一文本特征和所述第二文本特征生成所述目标图像。2.根据权利要求1所述的方法，其特征在于，所述目标图像生成模型还包括特征转换器和图像生成器，所述将所述第一文本和所述第二文本输入预先生成的目标图像生成模型中，得到所述目标图像生成模型输出的目标图像包括：将所述第一文本输入所述第一文本编码器，得到所述第一文本编码器输出的第一文本特征；将所述第一文本特征输入所述特征转换器，得到第一图像特征；将所述第二文本输入所述第二文本编码器，得到所述第二文本编码器输出的第二文本特征；将所述第一图像特征和所述第二文本特征输入所述图像生成器，得到所述图像生成器生成的所述目标图像。3.根据权利要求2所述的方法，其特征在于，所述将所述第一图像特征和所述第二文本特征输入所述图像生成器，得到所述图像生成器生成的所述目标图像包括：将所述第一图像特征和所述第二文本特征进行叠加处理，得到叠加特征；将所述叠加特征输入所述图像生成器，得到所述目标图像。4.根据权利要求2所述的方法，其特征在于，所述目标图像生成模型通过以下方式生成：获取第一样本集合；所述第一样本集合中包括多个第一样本图像、以及每个第一样本图像对应的第一文本样本和第二文本样本，所述第二文本样本用于描述所述第一样本图像中包含的样本文字信息，所述第一文本样本用于描述所述第一样本图像中的除所述样本文字信息外的其他图像信息；根据所述第一样本集合对待定图像生成模型进行训练后得到所述目标图像生成模型。5.根据权利要求4所述的方法，其特征在于，所述获取第一样本集合包括：获取第二样本集合；所述第二样本集合中包括多个第二样本图像、以及每个第二样本图像对应的第三文本样本，所述第三文本样本用于描述所述第二样本图像的图像信息，所述第二样本图像为不包含文字信息的图像；获取第四文本样本；在所述第二样本图像的指定区域增加所述第四文本样本对应的待定文字信息；将增加所述待定文字信息后的第二样本图像作为所述第一样本图像，将所述第三文本样本作为所述第一样本图像对应的所述第一文本样本，将所述第四文本样本作为所述第一
样本图像对应的所述第二文本样本，得到所述第一样本集合。6.根据权利要求4所述的方法，其特征在于，所述获取第一样本集合包括：获取第三样本集合；所述第三样本集合中包括多个第三样本图像、以及每个第三样本图像对应的第五文本样本，所述第五文本样本用于描述所述第三样本图像的图像信息，所述第三样本图像为包含文字信息的图像；根据所述第三样本图像中的文字信息确定第六文本样本；将所述第三样本图像作为所述第一样本图像，将所述第五文本样本作为所述第一样本图像对应的所述第一文本样本，将所...

【专利技术属性】
技术研发人员：郭明宇，刘博元，冉蛟，
申请(专利权)人：北京字跳网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人