一种图像生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号：39320208 阅读：9 留言：0更新日期：2023-11-12 16:01

本公开涉及一种图像生成方法、装置、电子设备及存储介质，该方法包括：获取初始图像的图像特征信息；图像特征信息包括初始图像中的初始对象的初始姿态信息和初始图像的初始背景语义信息；获取目标对象的对象特征信息；利用对象特征信息和图像特征信息对噪声图像进行合成处理，得到包含目标对象的目标图像；噪声图像是对初始图像添加高斯噪声得到的；目标图像的背景语义信息与初始背景语义信息相匹配，目标图像中的目标对象的姿态与初始姿态信息相匹配。本公开实施例提供了一种新颖的图像生成方法，在图像生成领域中具有广泛的应用前景。景。景。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像生成方法、装置、电子设备及存储介质

[0001]本公开涉及互联网
，尤其涉及一种图像生成方法、装置、电子设备及存储介质。

技术介绍

[0002]随着数字技术和人工智能(artificial intelligence，AI)技术的发展，内容生成领域逐渐从专业人士专业领域(比如具有专业领域知识的短视频博主)生成内容转向人工智能生成内容(artificial intelligence generated content，AIGC)。AIGC大大扩充了数字内容生成领域的丰富程度和想象力，将极大地丰富人们的数字生活，是未来全面迈向数字文明新时代不可或缺的支撑力量。
[0003]在目前的人工智能生成图像的领域中，根据文本生成对应图像，将原始图像进行风格转化生成新图像等任务已广泛应用，但目前任务形式均比较单一，亟需开发新的任务以提高图像生成领域中应用的多样性。

技术实现思路

[0004]本公开提供一种图像生成方法、装置、电子设备及存储介质，本公开的技术方案如下：
[0005]根据本公开实施例的第一方面，提供一种图像生成方法，包括：
[0006]获取初始图像的图像特征信息；图像特征信息包括初始图像中的初始对象的初始姿态信息和初始图像的初始背景语义信息；
[0007]获取目标对象的对象特征信息；
[0008]利用对象特征信息和图像特征信息对噪声图像进行合成处理，得到包含目标对象的目标图像；噪声图像是对初始图像添加高斯噪声得到的；目标图像的背景语义信息与初始背景语义信...

【技术保护点】

【技术特征摘要】
1.一种图像生成方法，其特征在于，包括：获取初始图像的图像特征信息；所述图像特征信息包括所述初始图像中的初始对象的初始姿态信息和所述初始图像的初始背景语义信息；获取目标对象的对象特征信息；利用所述对象特征信息和所述图像特征信息对噪声图像进行合成处理，得到包含所述目标对象的目标图像；所述噪声图像是对所述初始图像添加高斯噪声得到的；所述目标图像的背景语义信息与所述初始背景语义信息相匹配，所述目标图像中的目标对象的姿态与所述初始姿态信息相匹配。2.根据权利要求1所述的图像生成方法，其特征在于，所述利用所述对象特征信息和所述图像特征信息对噪声图像进行合成处理，得到包含所述目标对象的目标图像，包括：将所述对象特征信息和所述图像特征信息作为引导信息；基于所述引导信息对所述噪声图像进行多次去噪处理，得到去噪图像；直至所述去噪图像中包含所述目标对象和所述初始图像的初始背景，将所述去噪图像作为所述目标图像。3.根据权利要求2所述的图像生成方法，其特征在于，所述基于所述引导信息对所述噪声图像进行多次去噪处理，得到去噪图像，包括：通过图像去噪模型，对所述引导信息和所述噪声图像进行处理，预测所添加的噪音数据；根据所述噪音数据、所述噪声图像和所述图像去噪模型的模型超参数，确定去噪图像分布参数；所述去噪图像分布参数包括均值和方差；基于所述去噪图像分布参数从标准高斯分布中采样，得到所述去噪图像。4.根据权利要求2所述的图像生成方法，其特征在于，所述对象特征信息的数据维度不同于所述图像特征信息的数据维度；所述将所述对象特征信息和所述图像特征信息作为引导信息，包括：将所述对象特征信息和所述图像特征信息进行特征融合，得到融合后的特征信息；所述融合后的特征信息的数据维度满足预设数据维度；将所述融合后的特征信息作为所述引导信息。5.根据权利要求3所述的图像生成方法，其特征在于，所述图像去噪模型的训练方式，包括：获取初始训练图像；所述初始训练图像包括初始训练对象；获取所述初始训练对象的对象训练特征信息；获取第一初始训练模型；所述第一初始训练模型包括初始特征处理模型、图像加噪模块和初始图像去噪模型；根据所述图像加噪模块，对所述初始训练图像添加符合高斯分布的噪音数据，得到对应的训练噪声图像；根据所述初始特征处理模型，获取所述初始训练图像的图像训练特征信息；所述图像训练特征信息包括所述初始训练对象的初始姿态信息和所述初始训练图像的初始背景语义信息；基于所述训练噪声图像、所述对象训练特征信息和所述图像训练特征信息，利用所述
初始图像去噪模型得到预测噪音数据；基于所述预测噪音数据和实际添加的噪音数据，对所述初始特征处理模型和所述初始图像去噪模型进行训练，直至得到训练好的特征处理模型和所述图像去噪模型；其中，所述特征处理模型用于对所述初始图像进行特征提取，得到所述初始图像的图像特征信息。6.根据权利要求1所述的图像生成方法，其特征在于，所述获取初始图像的图像特征信息，包括：获取初始对象掩膜图像；基于所述初始对象掩膜图像，确定所述初始图像中的初始对象区域；对所述初始对象区域进行特征提取，得到所述初始对象的初始姿态信息；基于所述初始对象掩膜图像，将所述初始图像中除所述初始对象外的区域确定为背景区域；对所述背景区域进行背景语义提取，得到所述初始图像的初始背景语义信息。7.根据权利要求1
‑
6任一所述的图像生成方法，其特征在于，所述获取目标对象的对象特征信息，包括：获取所述目标对象的描述信息；所述描述信息包括图片描述信息、文本描述信息、音频描述信息中的任一种；根据特征编码模型对所述目标对象的描述信息进行特征编码，得到所述对象特征信息。8.根据权利要求7所述的图像生成方法，其特征在于，所述特征编码模型的训练方式，包括：获取多个训练样本对；每个训...

【专利技术属性】
技术研发人员：陈瑞，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人