System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种模型训练方法、装置、计算机设备和存储介质制造方法及图纸_技高网

一种模型训练方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:40770196 阅读:5 留言:0更新日期:2024-03-25 20:18
本申请实施例公开了一种模型训练方法、装置、计算机设备和存储介质;本申请实施例可以获取训练样本图像,对训练样本图像进行噪声添加处理,得到噪声添加后样本图像;利用图像生成模型对噪声添加后样本图像进行去噪转移处理,得到去噪转移样本图像;利用预设判别模型对噪声添加后样本图像进行判别处理,得到噪声添加后样本图像对应的样本判别分布信息;基于样本判别分布信息和预设标签信息,计算预设判别模型对应的判别损失信息;基于判别损失信息对预设判别模型进行调整,得到性能符合要求的判别模型。通过本申请,可以有效地克服梯度消失的问题,提高模型生成图像的质量。

【技术实现步骤摘要】

本申请涉及计算机,具体涉及一种模型训练方法、装置、计算机设备和存储介质


技术介绍

1、人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。梯度消失在人工智能模型应用中影响模型性能的一个常见问题。梯度消失会使得模型对图像进行处理时,损失很多纹理细节,从而影响图像最后生成质量。


技术实现思路

1、本申请实施例提出了一种模型训练方法、装置、计算机设备和存储介质,可以有效地克服梯度消失的问题,提高模型生成图像的质量。

2、本申请实施例提供了一种模型训练方法,包括:

3、获取训练样本图像,对所述训练样本图像进行噪声添加处理,得到噪声添加后样本图像;

4、利用图像生成模型对所述噪声添加后样本图像进行去噪转移处理,得到去噪转移样本图像;

5、利用预设判别模型对所述噪声添加后样本图像进行判别处理,得到所述噪声添加后样本图像对应的样本判别分布信息;

6、基于所述样本判别分布信息和预设标签信息,计算所述预设判别模型对应的判别损失信息;

7、基于所述判别损失信息对所述预设判别模型进行调整,得到性能符合要求的判别模型。

8、相应的,本申请实施例还提供了一种模型训练装置,包括:

9、第一噪声添加单元,用于获取训练样本图像,对所述训练样本图像进行噪声添加处理,得到噪声添加后样本图像;

10、第一采样单元,用于利用图像生成模型对所述噪声添加后样本图像进行去噪转移处理,得到去噪转移样本图像;

11、第一判别单元,用于利用预设判别模型对所述噪声添加后样本图像进行判别处理,得到所述噪声添加后样本图像对应的样本判别分布信息;

12、损失计算单元,用于基于所述样本判别分布信息和预设标签信息,计算所述预设判别模型对应的判别损失信息;

13、模型调整单元,用于基于所述判别损失信息对所述预设判别模型进行调整,得到性能符合要求的判别模型。

14、在一实施例中,所述第一采样单元,可以包括:

15、噪声估计子单元,用于对所述噪声添加后样本图像进行噪声估计,得到所述噪声添加后样本图像对应的噪声样本图像

16、特征提取子单元,用于对所述噪声样本图像进行特征提取,得到所述噪声样本图像对应的特征信息;

17、下采样子单元,用于对所述特征信息进行下采样处理,得到所述特征信息对应的下采样信息;

18、上采样子单元,用于对所述下采样信息进行上采样处理,得到所述下采样信息对应的上采样信息;

19、注意力融合子单元,用于将所述下采样信息和所述上采样信息进行注意力融合,得到所述去噪转移样本图像。

20、在一实施例中,所述损失计算单元,可以包括:

21、损失计算子单元,用于基于所述样本判别分布信息和所述预设标签信息,计算标签损失信息;

22、熵损失运算子单元,用于对所述样本判别分布信息进行熵损失运算,得到分布熵损失信息;

23、融合子单元,用于将所述标签损失信息和所述分布熵损失信息进行融合处理,得到所述判别损失信息。

24、在一实施例中,所述损失计算子单元,可以包括:

25、对数运算模块,用于对所述样本判别分布信息进行对数运算,得到运算后样本判别分布信息;

26、相乘模块,用于将所述运算后样本判别分布信息和所述预设标签信息进行相乘,得到所述标签损失信息。

27、在一实施例中,所述第一噪声添加单元,可以包括:

28、参数获取子单元,用于获取噪声参数;

29、因子生成子单元,用于根据所述噪声参数,生成符合预设分布的噪声添加因子;

30、添加子单元,用于将所述噪声添加因子添加至所述训练样本图像,得到所述噪声添加后样本图像。

31、本申请实施例还提供了一种图像生成方法,包括:

32、获取原始图像,对所述原始图像进行噪声添加处理,得到噪声添加后图像;

33、利用判别模型对所述噪声添加后图像进行判别处理,得到所述噪声添加后图像对应的判别分布信息;

34、对所述噪声添加后图像对应的判别分布信息进行度量映射,得到针对所述图像生成模型的梯度度量信息;

35、基于所述梯度度量信息和所述判别分布信息,生成针对所述图像生成模型的梯度指导参数;

36、基于所述梯度指导参数,利用图像生成模型基于所述噪声添加后图像进行去噪转移处理,得到目标图像。

37、相应的,本申请实施例还提供了一种图像生成装置,包括:

38、第二噪声添加单元,用于获取原始图像,对所述原始图像进行噪声添加处理,得到噪声添加后图像;

39、第二判别单元,用于利用判别模型对所述噪声添加后图像进行判别处理,得到所述噪声添加后图像对应的判别分布信息;

40、度量映射单元,用于对所述噪声添加后图像对应的判别分布信息进行度量映射,得到针对所述图像生成模型的梯度度量信息;

41、参数生成单元,用于基于所述梯度度量信息和所述判别分布信息,生成针对所述图像生成模型的梯度指导参数;

42、第二采样单元,用于基于所述梯度指导参数,利用图像生成模型基于所述噪声添加后图像进行去噪转移处理,得到目标图像。

43、在一实施例中,所述第二判别单元,可以包括:

44、卷积运算子单元,用于利用所述判别模型对所述噪声添加后图像进行卷积运算,得到卷积运算后信息;

45、非线性转换子单元,用于利用所述判别模型对所述卷积运算后信息进行非线性转换,得到转换后信息;

46、池化子单元,用于利用所述判别模型对所述转换后信息进行池化处理,得到所述判别分布信息。

47、在一实施例中,所述参数生成单元,可以包括:

48、纹理图像获取子单元,用于获取判别模型针对所述噪声添加后图像进行判别处理得到的纹理图像;

49、放缩因子生成子单元,用于根据所述纹理图像和所述判别分布信息,生成针对所述梯度度量信息的放缩因子;

50、算术运算子单元,用于将所述放缩因子和所述梯度度量信息进行算术运算,得到所述梯度指导参数。

51、在一实施例中,所述放缩因子生成子单元,可以包括:

52、分布运算模块,用于对所述纹理图像进行分布运算,得到所述纹理图像对应的纹理分布信息;

53、比较运算模块,用于将所述纹理分布信息和所述判别分布信息进行比较运算,得到所述纹理分布信息和所述判别分布信息之间的比较信息;

54、调整处理模块,用于利用预设平衡参数对所述比较信息进行调整处理,得到所述梯度度量信息的放缩因子。

55、在一实施例中,所述算术运算子单元,可本文档来自技高网...

【技术保护点】

1.一种模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述利用图像生成模型对所述噪声添加后样本图像进行去噪转移处理,得到去噪转移样本图像,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述样本判别分布信息和预设标签信息,计算所述预设判别模型对应的判别损失信息,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述样本判别分布信息和所述预设标签信息,计算标签损失信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述对所述训练样本图像进行噪声添加处理,得到噪声添加后样本图像,包括:

6.一种图像生成方法,其特征在于,包括:

7.根据权利要求6所述的方法,其特征在于,所述利用判别模型对所述噪声添加后图像进行判别处理,得到所述噪声添加后图像对应的判别分布信息,包括:

8.根据权利要求6所述的方法,其特征在于,所述基于所述梯度度量信息和所述判别分布信息,生成针对所述图像生成模型的梯度指导参数,包括:

9.根据权利要求8所述的方法,其特征在于,所述根据所述纹理图像和所述判别分布信息,生成针对所述梯度度量信息的放缩因子,包括:

10.根据权利要求8所述的方法,其特征在于,所述将所述放缩因子和所述梯度度量信息进行算术运算,得到所述梯度指导参数,包括:

11.根据权利要求6所述的方法,其特征在于,所述基于所述梯度指导参数,利用图像生成模型基于所述噪声添加后图像进行去噪转移处理,得到目标图像,包括:

12.一种模型训练装置,其特征在于,包括:

13.一种图像生成装置,其特征在于,包括:

14.一种计算机设备,其特征在于,包括存储器和处理器;所述存储器存储有应用程序,所述处理器用于运行所述存储器内的应用程序,以执行权利要求1至5任一项所述的模型训练方法或6至11任一项所述的图像生成方法中的操作。

15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至5任一项所述的模型训练方法或6至11任一项所述的图像生成方法中的步骤。

16.一种计算机程序产品,包括计算机程序或指令,其特征在于,该计算机程序或指令被处理器执行时实现权利要求1至5任一项所述的模型训练方法或6至11任一项所述的图像生成方法中的步骤。

...

【技术特征摘要】

1.一种模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述利用图像生成模型对所述噪声添加后样本图像进行去噪转移处理,得到去噪转移样本图像,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述样本判别分布信息和预设标签信息,计算所述预设判别模型对应的判别损失信息,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述样本判别分布信息和所述预设标签信息,计算标签损失信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述对所述训练样本图像进行噪声添加处理,得到噪声添加后样本图像,包括:

6.一种图像生成方法,其特征在于,包括:

7.根据权利要求6所述的方法,其特征在于,所述利用判别模型对所述噪声添加后图像进行判别处理,得到所述噪声添加后图像对应的判别分布信息,包括:

8.根据权利要求6所述的方法,其特征在于,所述基于所述梯度度量信息和所述判别分布信息,生成针对所述图像生成模型的梯度指导参数,包括:

9.根据权利要求8所述的方法,其特征在于,所述根据所述纹理图像和所述判别分布信息,生成针对所述梯度度量...

【专利技术属性】
技术研发人员:李玺李盛名郑光聪姚太平丁守鸿
申请(专利权)人:腾讯科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1