图像生成、模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号：38989639 阅读：11 留言：0更新日期：2023-10-07 10:20

本公开涉及一种图像生成、模型训练方法、装置、设备及存储介质。本公开通过多个图像生成元素，生成目标图像，使得所述目标图像的多个图像元素包括多个目标元素，所述多个目标元素和所述多个图像生成元素一一对应，且存在对应关系的目标元素和图像生成元素的相似度大于或等于预设值。由于图像生成元素的个数是大量的，且不同图像生成元素之间的组合方式也是灵活多样的，因此，通过组合不同的多个图像生成元素，可以生成大量的不同的目标图像，极大的提高了目标图像的多样性。的提高了目标图像的多样性。的提高了目标图像的多样性。

全部详细技术资料下载

【技术实现步骤摘要】
图像生成、模型训练方法、装置、设备及存储介质

[0001]本公开涉及信息
，尤其涉及一种图像生成、模型训练方法、装置、设备及存储介质。

技术介绍

[0002]随着图像被广泛的应用，图像生成技术也在不断的发展。例如，在目前的人工智能自动内容生成(AI generated content，AIGC)方案中，图像生成模型可以自动的生成图像。
[0003]但是，目前的图像生成模型所生成的图像不够多样，导致图像生成模型生成的图像无法被广泛应用。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题，本公开提供了一种图像生成、模型训练方法、装置、设备及存储介质，通过组合不同的多个图像生成元素，可以生成大量的不同的目标图像，极大的提高了目标图像的多样性。
[0005]第一方面，本公开实施例提供一种图像生成方法，包括：
[0006]获取多个图像生成元素；
[0007]根据所述多个图像生成元素，生成目标图像，使得所述目标图像的多个图像元素包括多个目标元素，所述多个目标元素和所述多个图像生成元素一一对应，且存在对应关系的目标元素和图像生成元素的相似度大于或等于预设值。
[0008]第二方面，本公开实施例提供一种图像生成方法，包括：
[0009]接收终端发送的多个图像生成元素；
[0010]根据所述多个图像生成元素，生成目标图像，使得所述目标图像的多个图像元素包括多个目标元素，所述多个目标元素和所述多个图像生成元素一一对应，且存在对应关系

【技术保护点】

【技术特征摘要】
1.一种图像生成方法，其中，所述方法包括：获取多个图像生成元素；根据所述多个图像生成元素，生成目标图像，使得所述目标图像的多个图像元素包括多个目标元素，所述多个目标元素和所述多个图像生成元素一一对应，且存在对应关系的目标元素和图像生成元素的相似度大于或等于预设值。2.根据权利要求1所述的方法，其中，根据所述多个图像生成元素，生成目标图像，包括：将所述多个图像生成元素输入预先训练完成的机器学习模型中，使得所述机器学习模型根据所述多个图像生成元素对带噪图像进行迭代去噪后生成所述目标图像，并在生成所述目标图像的过程中，补全所述目标图像的多个图像元素中除所述多个目标元素之外的其他图像元素。3.根据权利要求2所述的方法，其中，所述机器学习模型包括第一中间层、第二中间层、第三中间层和第四中间层，所述第二中间层是所述第一中间层的下一层，所述第四中间层是所述第三中间层的下一层，所述第四中间层位于所述第一中间层之上；所述多个图像生成元素包括至少一个全局性的图像生成元素，所述全局性的图像生成元素对应有全局向量；所述机器学习模型根据所述多个图像生成元素对带噪图像进行迭代去噪，包括：将至少一个全局向量、以及本次迭代对应的向量进行相加，得到第一相加结果；将所述第一相加结果输入所述第一中间层，所述第一中间层用于将所述第一相加结果映射为第一向量和第二向量，所述第一中间层的输出信息是根据所述第一向量、所述第二中间层的输出信息和所述第二向量确定的，所述第二中间层的输出信息与所述带噪图像相关；将所述至少一个全局向量分别映射为多个向量，得到向量序列；将所述向量序列输入所述第三中间层，所述第三中间层用于将所述向量序列和所述第四中间层的输出信息进行交互，使得所述第三中间层的输出信息包括所述向量序列的信息；根据所述第三中间层的输出信息，完成本次迭代去噪。4.根据权利要求2所述的方法，其中，所述多个图像生成元素包括至少一个局部性的图像生成元素，所述局部性的图像生成元素对应有局部向量；将所述多个图像生成元素输入预先训练完成的机器学习模型中，包括：将至少一个局部向量进行相加，得到第二相加结果；将所述第二相加结果和所述带噪图像的表示向量进行拼接，得到拼接结果；将所述拼接结果输入到所述预先训练完成的机器学习模型中。5.根据权利要求1所述的方法，其中，获取多个图像生成元素之前，所述方法还包括：将至少一个样本图像分别拆解为多个图像元素，所述至少一个样本图像分别对应的多个图像元素构成集合。6.根据权利要求5所述的方法，其中，获取多个图像生成元素，包括：将所述集合中的至少两个图像元素作为所述多个图像生成元素；或者将新的图像元素和所述集合中的至少一个图像元素作为所述多个图像生成元素，所述
新的图像元素是用户输入的图像元素或用户对所述集合中的所述图像元素进行修改后的图像元素；或者将至少两个新的图像元素作为所述多个图像生成元素。7.根据权利要求5所述的方法，其中，所述方法还...

【专利技术属性】
技术研发人员：黄梁华，陈狄，刘宇，沈宇军，赵德丽，周靖人，
申请(专利权)人：阿里巴巴达摩院杭州科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人