模型训练方法、图像分割方法、电子设备及介质技术

技术编号:37417613 阅读:22 留言:0更新日期:2023-04-30 09:41
本申请公开了模型训练方法、图像分割方法、电子设备及介质,包括:利用第一训练数据生成多组不同的训练组合,每一所述训练组合包括训练集和与所述训练集对应的推理集;分别利用所述多组不同的训练组合中的所述训练集对第一模型进行预训练,获得多个预训练模型,其中,每个所述预训练模型对应一个所述训练组合;分别将所述多组不同的训练组合中的所述推理集输入至对应的所述预训练模型中,获得多个推理结果,每一所述推理结果对应一个所述推理集;通过多个推理结果确定第二训练数据;利用所述第二训练数据对第二模型进行训练。可以实现对模型的快速训练,优选训练效果,提高系统的鲁棒性。棒性。棒性。

【技术实现步骤摘要】
模型训练方法、图像分割方法、电子设备及介质


[0001]本申请一般涉及模型训练
,具体涉及一种模型训练方法、图像分割方法、电子设备及介质。

技术介绍

[0002]随着人工智能的发展,机器学习模型的使用越来越广泛。在进行极其学习中,需要进行模型的训练,模型的训练结果直接影响机器学习的最终结果。
[0003]但是,在用数据训练模型时,常常需要调参使模型尽可能多地、非过拟合地学习到训练数据中包含的鲁棒的特征信息,以便后续测试时可以推理出可靠的结果。但是调参是一个耗时间的过程,且根据调参人水平的不同,模型不一定会被调到最优效果。

技术实现思路

[0004]鉴于现有技术中的上述缺陷或不足,期望提供一种模型训练方法、图像分割方法、电子设备及介质,可以实现对模型的快速训练,优选训练效果,提高系统的鲁棒性。
[0005]第一方面,本申请提供了一种模型训练方法,其特征在于,包括:
[0006]利用第一训练数据生成多组不同的训练组合,每一所述训练组合包括一个训练集和与所述训练集对应的一个推理集;
[0007]分别利用所述多组不同的训练组合中的所述训练集对第一模型进行预训练,获得多个预训练模型,其中,每个所述预训练模型对应一个所述训练组合;
[0008]分别将所述多组不同的训练组合中的所述推理集输入至对应的所述预训练模型中,获得多个推理结果,每一所述推理结果对应一个所述训练组合;
[0009]通过所述多个推理结果确定第二训练数据;
[0010]利用所述第二训练数据对第二模型进行训练。
[0011]可选地,所述第一训练数据包括多个训练样本,其中,
[0012]利用第一训练数据生成多组不同的训练组合,每一所述训练组合包括一个训练集和与所述训练集对应的一个推理集,方法包括:
[0013]将所述第一训练数据中的全部所述训练样本随机划分为多个样本子集,每个所述样本子集中的训练样本数量相同;
[0014]将随机选取所述第一训练数据中的至少一个所述样本子集作为所述训练集,其余所述样本子集的合集作为所述推理集;
[0015]重复随机选取多次,直到生成多组不同的训练组合。
[0016]可选地,所述预训练的方法包括:
[0017]针对待预训练的模型对象,确定对应的所述训练组合中的所述训练集;
[0018]基于所述训练集,构建预训练样本集;
[0019]采用所述预训练样本集对所述模型对象进行训练。
[0020]可选地,所述基于所述训练集,构建预训练样本集,方法包括:
[0021]选取所述训练集中的部分样本作为所述预训练样本集,其余样本作为预训练验证集,所述预训练验证集用于对预训练好的模型对象进行评估,以获得该预训练好的模型对象对应的评估结果。
[0022]可选地,通过多个推理结果确定第二训练数据,包括:
[0023]利用所述推理结果,迭代进行至少一次预训练;
[0024]基于最终迭代后的多个推理结果确定第二训练数据。
[0025]进一步地,所述利用所述推理结果,迭代进行至少一次预训练,方法包括:
[0026]通过所述推理结果更新所述第一训练数据;
[0027]利用更新后的所述第一训练数据进行预训练,获得本次预训练好的多个预训练模型和本次的多个推理结果;
[0028]迭代预训练,直到完成设定的迭代次数,获得最终迭代的多个预训练模型和最终迭代的多个推理结果。
[0029]进一步地,所述方法还包括:
[0030]获取上一次迭代预训练中各个预训练模型的评估结果;
[0031]基于所述评估结果,更新本次迭代预训练中的模型对象,其中,本次迭代预训练中的模型对象为上一次迭代预训练好的预训练模型中的第一最优模型,所述第一最优模型为上一次迭代中评估结果最优的一个预训练模型。
[0032]可选地,所述第二模型与所述第一模型为同一模型。
[0033]可选地,所述第二模型为各个所述预训练好的第一训练模型中的第二最优模型,其中,所述第二最优模型为各个所述第一训练模型的评估结果最优的一个对应的所述第一训练模型。
[0034]第二方面,本申请提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行以下方法:
[0035]利用第一训练数据生成多组不同的训练组合,每一所述训练组合包括一个训练集和与所述训练集对应的一个推理集;
[0036]分别利用所述多组不同的训练组合中的所述训练集对第一模型进行预训练,获得多个预训练模型,其中,每个所述预训练模型对应一个所述训练组合;
[0037]分别将所述多组不同的训练组合中的所述推理集输入至对应的所述预训练模型中,获得多个推理结果,每一所述推理结果对应一个所述训练组合;
[0038]通过所述多个推理结果确定第二训练数据;
[0039]利用所述第二训练数据对第二模型进行训练。
[0040]第三方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时用于执行以上中任一项所述的方法。
[0041]第四方面,本申请提供了一种图像分割方法,所述方法包括:
[0042]获取待分割图像;
[0043]将所述待分割图像输入图像分割模型中,获取所述待分割图像的目标分割结果,其中,所述图像分割模型是通过以上中任一项所述的方法训练得到的。
[0044]在本申请的一个实施例中,将所述待分割图像输入图像分割模型中,以获取所述待分割图像的目标分割结果,方法包括:
[0045]将所述待分割图像输入至预训练好的最优模型中,获得所述待分割图像的第一分割结果,所述最优模型为各个所述第一训练模型的评估结果最优的一个对应的所述第一训练模型;
[0046]将所述第一分割结果输入至所述图像分割模型中,获得所述待分割图像的目标分割结果。
[0047]在本申请的一个实施例中,将所述第一分割结果输入至所述图像分割模型之前,还包括:
[0048]将所述第一分割结果迭代输入至各次迭代预训练好的最优模型中。
[0049]第五方面,本申请提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器用于执行以下方法:
[0050]获取待分割图像;
[0051]将所述待分割图像输入图像分割模型中,获取所述待分割图像的目标分割结果,其中,所述图像分割模型是通过权利要求1

8中任一项所述的方法训练得到的。
[0052]第六方面,本申请提供了一种计算机可读存储介质,所述计算机指令用于执行如以上中任一项所述的方法。
[0053]本申请的实施例提供的技术方案可以包括以下有益效果:
[0054]本申请实施例提供的模型训练方法、装置、图像分割方法、装置及介质,通过对于数据进行选取组合,进行迭本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:利用第一训练数据生成多组不同的训练组合,每一所述训练组合包括一个训练集和与所述训练集对应的一个推理集;分别利用所述多组不同的训练组合中的所述训练集对第一模型进行预训练,获得多个预训练模型,其中,每个所述预训练模型对应一个所述训练组合;分别将所述多组不同的训练组合中的所述推理集输入至对应的所述预训练模型中,获得多个推理结果,每一所述推理结果对应一个所述训练组合;通过所述多个推理结果确定第二训练数据;利用所述第二训练数据对第二模型进行训练。2.根据权利要求1所述的模型训练方法,其特征在于,所述第一训练数据包括多个训练样本,其中,利用第一训练数据生成多组不同的训练组合,每一所述训练组合包括一个训练集和与所述训练集对应的一个推理集,方法包括:将所述第一训练数据中的全部所述训练样本随机划分为多个样本子集,每个所述样本子集中的训练样本数量相同;随机选取所述第一训练数据中的至少一个所述样本子集作为所述训练集,其余所述样本子集的合集作为所述推理集;重复随机选取多次,直到生成多组不同的训练组合。3.根据权利要求1所述的模型训练方法,其特征在于,所述预训练的方法包括:针对待预训练的模型对象,确定对应的所述训练组合中的所述训练集;基于所述训练集,构建预训练样本集;采用所述预训练样本集对所述模型对象进行训练。4.根据权利要求3所述的模型训练方法,其特征在于,所述基于所述训练集,构建预训练样本集,方法包括:选取所述训练集中的部分样本作为所述预训练样本集,其余样本作为预训练验证集,所述预训练验证集用于对预训练好的模型对象进行评估,以获得该预训练好的模型对象对应的评估结果。5.根据权利要求1所述的模型训练方法,其特征在于,通过所述多个推理结果确定第二训练数据,包括:利用所述推理结果,迭代进行至少一次预训练;基于最终迭代后的多个推理结果确定第二训练数据。6.根据权利要求5所述的模型训练方法,其特征在于,所述利用所述推理结果,迭代进行至少一次预训练,方法包括:通过所述推理结果更新所述第一训练数据;利用更新后的所述第一训练数据进行预训练,获得本次预训练好的多个预训练模型和本次的多个推理结果;迭代预训练,直到完成设定的迭代次数,获得最终迭代的多个预训练模型和最终迭代的多个推理结果。7.根据权利要求5所述的模型训练方法,其特征在于,所述方法还包括:
获取上一次迭代预训练中各个预训练模型的评估结果;基于所述评估结果,更新本次迭代预训练中的模型对象,其中,本次迭代预训练中的模型对象为上一次迭代预训练好的预训练模型中的第一最优模型,所述第一最优模型为上一次迭代中评估结果最优的一个预训练模型。8.根据权利要求1所述的模型训练方法,其特征在于,所述第二模型为各个所述预训练好的第一训练模型中的第二最优模型,其中,所述第二最优模型为各个所述第一训练模型的评估结果最优的一个对应的所述第一训练模型。9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行以下方法:利用第一训练数据生成多组不同的训练组合,每一所述训练组合包括一个训练集和与所述训练集对应的一个推理集;分别利用所述多组不同的训练组合中的所述训练集对第一模型进行预训练,获得多个预训练模型,其中,每个所述预训练模型对应一个所述训练组合;分别将所述多组不同的训练组合中的所述推理集输入至对应的...

【专利技术属性】
技术研发人员:郑瑞唐小军王英豪孔繁昊
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1