模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：41218908 阅读：3 留言：0更新日期：2024-05-09 23:39

本申请提供了一种模型训练方法、装置、电子设备及存储介质。包括：获取模型训练请求，其中，所述模型训练请求用于指示训练目标风格类型的图片生成模型；获取所述目标风格类型对应的目标图片集合，以及，基于所述目标风格类型确定对应的目标基础模型和训练参数；针对所述目标图片集合中的每张目标图片，确定所述目标图片对应的文字描述信息；基于所述训练参数、所有目标图片及每张目标图片对应的文字描述信息，对所述目标基础模型进行训练，得到用于生成所述目标风格类型的图片的图片生成模型。由此实现智能化训练模型，提高模型构建的效率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及模型训练，尤其涉及一种模型训练方法、装置、电子设备及存储介质。

技术介绍

1、lora(low-rank adaptation of large language models，大语言模型的低阶适应)模型，可以理解为sd(stable diffusion，文生图模型)模型的一种插件。lora模型，可以通过较少的训练数据和计算量来训练，以获得特定风格类型的图片。广泛应用于图片素材制作中，例如，影视宣发物料、ip形象设计、游戏道具设计等。

2、然而，目前对于lora模型的训练主要依赖于工作人员的经验，由工作人员根据经验准备模型训练过程中所需的一切资源(例如，用于训练模型的图片素材、参数等)，没有形成智能化训练模型的流程，模型构建效率非常低。

3、因此，亟需一种可以智能化训练lora模型的技术方案。

技术实现思路

1、本申请实施例的目的在于提供一种模型训练方法、装置、电子设备及存储介质，以解决目前对于lora模型的训练主要依赖于工作人员的经验，模型构建效率低的问题。具体技术方案如下：

2、第一方面，本申请提供了一种模型训练方法，包括：

3、获取模型训练请求，其中，所述模型训练请求用于指示训练目标风格类型的图片生成模型；

4、获取所述目标风格类型对应的目标图片集合，以及，基于所述目标风格类型确定对应的目标基础模型和训练参数；

5、针对所述目标图片集合中的每张目标图片，确定所述目标图片对应的文字描述信息；>

6、基于所述训练参数、所有目标图片及每张目标图片对应的文字描述信息，对所述目标基础模型进行训练，得到用于生成所述目标风格类型的图片的图片生成模型。

7、在一个可能的实施方式中，所述获取所述目标风格类型对应的目标图片集合，包括：

8、获取图片素材集合；

9、确定所述目标风格类型对应的图片筛选信息和图片数量；

10、在所述图片素材集合中确定符合所述图片筛选信息的第一图片；

11、在所有所述第一图片的数量大于或等于所述图片数量的情况下，将所有所述第一图片组成的图片集合确定为所述目标图片集合。

12、在一个可能的实施方式中，所述方法还包括：

13、在所有所述第一图片的数量小于所述图片数量的情况下，确定所述图片数量与所有所述第一图片的数量之间的差值；

14、将所述差值确定为目标数量；

15、通过可视化组件显示所述图片筛选信息和所述目标数量，以提示用户上传所述目标数量的、符合所述图片筛选信息的第二图片；

16、将所有所述第一图片和所有所述第二图片组成的图片集合确定为所述目标图片集合。

17、在一个可能的实施方式中，所述方法还包括：

18、确定待训练的图片生成模型的模型数量；

19、在所述模型数量大于预设数量阈值的情况下，确定每个所述图片生成模型对应的训练优先级；

20、按照对应训练优先级由高到低的顺序依次训练每个所述图片生成模型。

21、在一个可能的实施方式中，所述确定每个所述图片生成模型对应的训练优先级，包括：

22、针对每个图片生成模型，基于所述图片生成模型对应的目标风格类型确定对应的训练时长、重要性分数及训练资源需求；

23、基于所述训练时长、所述重要性分数及所述训练资源需求，确定所述图片生成模型对应的训练优先级，其中，所述训练时长越短、所述重要性分数越高、所述训练资源需求越低，对应的训练优先级越高。

24、在一个可能的实施方式中，所述得到用于生成所述目标风格类型的图片的图片生成模型之后，还包括：

25、获取测试样本，其中，所述测试样本包括测试文本和测试图片；

26、将所述测试文本输入至所述图片生成模型，以由所述图片生成模型输出对应的预测图片；

27、确定所述预测图片与所述测试图片之间的图片相似度；

28、在所述图片相似度低于预设阈值的情况下，对所述训练参数进行调整，并按照调整后的训练参数重新训练所述图片生成模型。

29、在一个可能的实施方式中，所述将所述测试文本输入至所述图片生成模型，以由所述图片生成模型输出对应的预测图片之后，还包括：

30、确定所述测试图片中包含的目标对象；

31、识别所述预测图片中是否包含所述目标对象；

32、在所述预测图片中不包含所述目标对象的情况下，对所述训练参数进行调整，并按照调整后的训练参数重新训练所述图片生成模型。

33、第二方面，本申请提供了一种模型训练装置，包括：

34、第一获取模块，用于获取模型训练请求，其中，所述模型训练请求用于指示训练目标风格类型的图片生成模型；

35、第二获取模块，用于获取所述目标风格类型对应的目标图片集合，以及，基于所述目标风格类型确定对应的目标基础模型和训练参数；

36、确定模块，用于针对所述目标图片集合中的每张目标图片，确定所述目标图片对应的文字描述信息；

37、训练模块，用于基于所述训练参数、所有目标图片及每张目标图片对应的文字描述信息，对所述目标基础模型进行训练，得到用于生成所述目标风格类型的图片的图片生成模型。

38、在一个可能的实施方式中，所述第二获取模块，进一步用于：

39、获取图片素材集合；

40、确定所述目标风格类型对应的图片筛选信息和图片数量；

41、在所述图片素材集合中确定符合所述图片筛选信息的第一图片；

42、在所有所述第一图片的数量大于或等于所述图片数量的情况下，将所有所述第一图片组成的图片集合确定为所述目标图片集合。

43、在一个可能的实施方式中，所述第二获取模块，还用于：

44、在所有所述第一图片的数量小于所述图片数量的情况下，确定所述图片数量与所有所述第一图片的数量之间的差值；

45、将所述差值确定为目标数量；

46、通过可视化组件显示所述图片筛选信息和所述目标数量，以提示用户上传所述目标数量的、符合所述图片筛选信息的第二图片；

47、将所有所述第一图片和所有所述第二图片组成的图片集合确定为所述目标图片集合。

48、在一个可能的实施方式中，所述装置还包括调度模块，用于：

49、确定待训练的图片生成模型的模型数量；

50、在所述模型数量大于预设数量阈值的情况下，确定每个所述图片生成模型对应的训练优先级；

51、按照对应训练优先级由高到低的顺序依次训练每个所述图片生成模型。

52、在一个可能的实施方式中，所述调度模块，进一步用于：

53、针对每个图片生成模型，基于所述图片生成模型对应的目标风格类型确定对应的训练时长、重要性分数及训练资源需求；

54、基于所述训练时长、所述重要本文档来自技高网...

【技术保护点】

1.一种模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取所述目标风格类型对应的目标图片集合，包括：

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述确定每个所述图片生成模型对应的训练优先级，包括：

6.根据权利要求1所述的方法，其特征在于，所述得到用于生成所述目标风格类型的图片的图片生成模型之后，还包括：

7.根据权利要求6所述的方法，其特征在于，所述将所述测试文本输入至所述图片生成模型，以由所述图片生成模型输出对应的预测图片之后，还包括：

8.一种模型训练装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程

...

【技术特征摘要】

1.一种模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取所述目标风格类型对应的目标图片集合，包括：

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述确定每个所述图片生成模型对应的训练优先级，包括：

6.根据权利要求1所述的方法，其特征在于，所述得到用于生成所述目标风格类型的图片的图片生成模型之后，还包...

【专利技术属性】
技术研发人员：王楠，
申请(专利权)人：北京爱奇艺科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人