图片生成模型的训练方法及装置、存储介质、电子装置制造方法及图纸

技术编号：40713385 阅读：4 留言：0更新日期：2024-03-22 11:15

本申请公开了一种图片生成模型的训练方法及装置、存储介质、电子装置，涉及智慧家庭技术领域，该方法包括：获取第一训练样本集合，其中，第一训练样本集合中的每个训练样本包括：样本图片，样本图片对应的描述信息；使用第一训练样本集合对通用图片生成模型进行训练，直到目标损失函数的取值满足预设的第一收敛条件，结束训练，将结束训练时的通用图片生成模型确定为目标图片生成模型；目标损失函数的取值由第一损失函数的取值和第二损失函数的取值共同确定，第一损失函数为通用图片生成模型的损失函数，第二损失函数的取值为根据样本图片和生成图片各自的对象属性特征确定的取值。上述技术方案，提高了通用图片生成模型的图片生成效果。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及智慧家庭，具体而言，涉及一种图片生成模型的训练方法及装置、存储介质、电子装置。

技术介绍

1、随着科学技术的进步和人工智能的发展，越来越多的文本生成图像的算法被相继提出，并被广泛应用在工业设计、计算机辅助设计、幼儿教育以及医疗领域中。作为提升工作效率的工具，保证生成图像的准确性是至关重要的，而生成图像的准确性是与提供的描述文本相对应的。相关技术中的文本生成图像技术主要基于三类基础算法，分别是生成对抗网络、变分自编码器和扩散模型；虽然上述文本生成图像的算法模型在单一场景和目标下，可以得到与目标文本描述相符合的生成图像，但是生成包含多个目标物体的复杂家居场景时，图片的生成效果较差。

2、针对相关技术中，通用图片生成模型的图片生成效果较差的问题，目前尚未提出有效的解决方案。

3、因此，有必要对相关技术予以改良以克服相关技术中的所述缺陷。

技术实现思路

1、本申请实施例提供了一种图片生成模型的训练方法及装置、存储介质、电子装置，以至少解决通用图片生成模型的图片生成效果较差的问题。

2、根据本申请实施例的一方面，提供一种图片生成模型的训练方法，包括：获取第一训练样本集合，其中，所述第一训练样本集合中的每个训练样本包括：样本图片，所述样本图片对应的描述信息；所述描述信息用于描述所述样本图片中的对象以及所述对象的属性信息；使用所述第一训练样本集合对通用图片生成模型进行训练，直到目标损失函数的取值满足预设的第一收敛条件，结束训练，将结束训练时的所述通用

3、在一个示例性的实施例中，使用所述第一训练样本集合对通用图片生成模型进行训练，包括：通过以下步骤执行第i轮训练，其中，i为大于或等于1的正整数，经过第0轮训练得到的通用图片生成模型是未经过训练的所述通用图片生成模型：从所述第一训练样本集合中获取第i轮使用的训练样本，其中，所述第i轮使用的训练样本包括第i轮使用的样本图片，所述第i轮使用的样本图片对应的描述信息；将第i轮使用的样本图片对应的描述信息输入到经过第i-1轮训练得到的通用图片生成模型中，得到第i轮训练得到的生成图片；获取所述第i-1轮训练得到的通用图片生成模型根据所述第i轮使用的样本图片和所述第i轮训练得到的生成图片确定的第i轮训练的第一损失函数的取值；以及使用所述目标特征提取模型对所述第i轮使用的样本图片和所述第i轮训练得到的生成图片分别进行特征提取，得到所述第i轮使用的样本图片的第一对象属性特征和所述第i轮训练得到的生成图片的第二对象属性特征；根据所述第一对象属性特征和所述第二对象属性特征确定第i轮训练的第二损失函数的取值；根据所述第i轮训练的第一损失函数的取值和所述第i轮训练的第二损失函数的取值确定第i轮训练的目标损失函数的取值；在所述第i轮训练的目标损失函数的取值满足所述第一收敛条件的情况下，结束训练；在所述第i轮训练的目标损失函数的取值不满足所述第一收敛条件的情况下，调整所述经过第i-1轮训练得到的通用图片生成模型中的参数，得到经过第i轮训练得到的通用图片生成模型。

4、在一个示例性的实施例中，使用所述目标特征提取模型对所述第i轮使用的样本图片和所述第i轮训练得到的生成图片分别进行特征提取，得到所述第i轮使用的样本图片的第一对象属性特征和所述第i轮训练得到的生成图片的第二对象属性特征，包括：使用所述目标特征提取模型对所述第i轮使用的样本图片进行目标检测，确定所述第i轮使用的样本图片中的n个对象；对所述n个对象中的每个对象进行特征提取，确定所述n个对象中的每个对象的第一属性特征集合，以得到所述第一对象属性特征，其中，所述第一对象属性特征包括所述第i轮使用的样本图片中的n个对象的n个第一属性特征集合；使用所述目标特征提取模型对所述第i轮训练得到的生成图片进行目标检测和特征提取，确定所述n个对象中的每个对象的第二属性特征集合，以得到所述第二对象属性特征，其中，所述第二对象属性特征包括所述第i轮训练得到的生成图片中的n个对象的n个第二属性特征集合。

5、在一个示例性的实施例中，根据所述第一对象属性特征和所述第二对象属性特征确定第i轮训练的第二损失函数的取值，包括：根据所述n个第一属性特征集合和所述n个第二属性特征集合确定所述n个对象的n个对象损失值，其中，所述n个对象损失值中的第j个对象的第j个对象损失值根据第j个第一属性特征集合和第j个第二属性特征集合确定，所述第j个第一属性特征集合为所述n个第一属性特征集合中与所述第j个对象对应的属性特征集合，所述第j个第二属性特征集合为所述n个第二属性特征集合中与所述第j个对象对应的属性特征集合；根据所述n个对象损失值确定所述第i轮训练的第二损失函数的取值。

6、在一个示例性的实施例中，根据所述n个第一属性特征集合和所述n个第二属性特征集合确定所述n个对象的n个对象损失值，包括：通过以下方式确定所述n个对象中的第j个对象的第j个对象损失值，以确定所述n个对象的n个对象损失值：根据第j个第一属性特征集合中的第j个对象的m个属性的m个第一属性特征和所述第j个第二属性特征集合中的所述m个属性的m个第二属性特征确定m个属性损失值；根据所述m个属性损失值确定所述第j个对象的第j个对象损失值。

7、在一个示例性的实施例中，根据所述n个对象损失值确定所述第i轮训练的第二损失函数的取值，包括：确定所述n个对象中每个对象对应的权重，得到n个权重值；根据所述n个对象损失值和所述n个权重值确定所述第i轮训练的第二损失函数的取值。

8、在一个示例性的实施例中，确定所述n个对象中每个对象对应的权重，得到n个权重值，包括：确定所述通用图片生成模型对所述n个对象的生成能力；根据所述通用图片生成模型对所述n个对象的生成能力确定所述n个权重值，其中，所述第j个对象损失值对应的权重值的大小与所述通用图片生成模型对所述第j个对象的生成能力正相关。

9、在一个示例性的实施例中，根据所述第i轮训练的第一损失函数的取值和所述第i轮训练的第二损失函数的取值确定第i轮训练的目标损失函数的取值，包括：确定目标权重值；将所述第i轮训练的第一损失函数的取值加上所述第i轮训练的第二损失函数的取值与所述目标权重值的乘积，得到所述第i轮训练的目标损失函数的取值。

10、在一个示例性的实施例中，使用所述第一训练样本集合对通用图片生成模型进行训练之前，所述方法还包括：获取本文档来自技高网...

【技术保护点】

1.一种图片生成模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，使用所述第一训练样本集合对通用图片生成模型进行训练，包括：

3.根据权利要求2所述的方法，其特征在于，使用所述目标特征提取模型对所述第i轮使用的样本图片和所述第i轮训练得到的生成图片分别进行特征提取，得到所述第i轮使用的样本图片的第一对象属性特征和所述第i轮训练得到的生成图片的第二对象属性特征，包括：

4.根据权利要求3所述的方法，其特征在于，根据所述第一对象属性特征和所述第二对象属性特征确定第i轮训练的第二损失函数的取值，包括：

5.根据权利要求4所述的方法，其特征在于，根据所述N个第一属性特征集合和所述N个第二属性特征集合确定所述N个对象的N个对象损失值，包括：

6.根据权利要求4所述的方法，其特征在于，根据所述N个对象损失值确定所述第i轮训练的第二损失函数的取值，包括：

7.根据权利要求6所述的方法，其特征在于，确定所述N个对象中每个对象对应的权重，得到N个权重值，包括：

8.根据权利要求2所述的方

9.根据权利要求1所述的方法，其特征在于，使用所述第一训练样本集合对通用图片生成模型进行训练之前，所述方法还包括：

10.根据权利要求1所述的方法，其特征在于，将结束训练时的所述通用图片生成模型确定为目标图片生成模型之后，所述方法还包括：

11.一种图片生成模型的训练装置，其特征在于，包括：

12.一种计算机可读的存储介质，其特征在于，所述计算机可读的存储介质包括存储的程序，其中，所述程序运行时执行权利要求1至10中任一项所述的方法。

13.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行权利要求1至10中任一项所述的方法。

...

【技术特征摘要】

1.一种图片生成模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，使用所述第一训练样本集合对通用图片生成模型进行训练，包括：

4.根据权利要求3所述的方法，其特征在于，根据所述第一对象属性特征和所述第二对象属性特征确定第i轮训练的第二损失函数的取值，包括：

5.根据权利要求4所述的方法，其特征在于，根据所述n个第一属性特征集合和所述n个第二属性特征集合确定所述n个对象的n个对象损失值，包括：

6.根据权利要求4所述的方法，其特征在于，根据所述n个对象损失值确定所述第i轮训练的第二损失函数的取值，包括：

7.根据权利要求6所述的方法，其特征在于，...

【专利技术属性】
技术研发人员：田云龙，苏明月，牛丽，郭义合，张军，
申请(专利权)人：青岛海尔科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人