【技术实现步骤摘要】
一种模型的训练方法、设备以及介质
本专利技术涉及超参数搜索领域,具体涉及一种模型的训练方法、系统、设备以及存储介质。
技术介绍
当在模型上使用超参数调优方案的时候,多以相应的评估参数作为评估网络训练效果、从而判断超参数组合质量的标准。如果在超参数调优时使用早停算法,步骤大体如下:使用某种采样方法确定一个或一组超参数组合,并得到每一组超参数组合对应的目标检测模型;根据早停算法的具体要求,将模型训练若干轮,并得到验证集相应的评估值。在某些算法中,可能会基于现有的评估参数值判断模型质量;在某些算法中会根据现有的值预测模型训练后最佳的评估参数值。但无论是哪种情况,都需要根据现有的评估参数值判断。当模型现有的评估参数值或预测的评估参数值比较低的时候,算法会根据一定的标准停止其中一部分训练;重复上述过程直到只剩下一个网络在训练,该网络所使用的超参数组合即为最佳组合。超参数调优中的早停策略原本是为了尽快停止效果不好的网络,从而节省时间和计算资源。但采用怎样的评价标准判断是否应该停止训练是很重要的。对于目标检测模型来说,如果采用mA ...
【技术保护点】
1.一种模型的训练方法,其特征在于,包括以下步骤:/n获取多组超参数并分别利用每一组所述超参数构建模型;/n利用训练集分别对构建的多个模型进行训练,并利用验证集对正在训练的模型进行验证;/n响应于触发早停,获取正在训练的所述模型在利用所述验证集进行验证时产生的评估参数,并从多个所述评估参数中得到标准参数;/n判断所述标准参数是否大于阈值;/n响应于所述标准参数不大于阈值,获取所述正在训练的模型在利用所述验证集进行验证时产生的损失函数值的倒数,并根据获取到的损失函数值的倒数以及对应的所述评估参数从所述正在训练的模型中确定继续训练的若干个模型;/n响应于所述继续训练的若干个模型 ...
【技术特征摘要】
1.一种模型的训练方法,其特征在于,包括以下步骤:
获取多组超参数并分别利用每一组所述超参数构建模型;
利用训练集分别对构建的多个模型进行训练,并利用验证集对正在训练的模型进行验证;
响应于触发早停,获取正在训练的所述模型在利用所述验证集进行验证时产生的评估参数,并从多个所述评估参数中得到标准参数;
判断所述标准参数是否大于阈值;
响应于所述标准参数不大于阈值,获取所述正在训练的模型在利用所述验证集进行验证时产生的损失函数值的倒数,并根据获取到的损失函数值的倒数以及对应的所述评估参数从所述正在训练的模型中确定继续训练的若干个模型;
响应于所述继续训练的若干个模型的数量大于1,返回进行训练的步骤,直到所述继续训练的若干个模型的数量等于1。
2.如权利要求1所述的方法,其特征在于,还包括:
响应于所述标准参数大于所述阈值,根据对应的所述评估参数的大小从所述正在训练的模型中确定继续训练的若干个模型。
3.如权利要求1所述的方法,其特征在于,响应于所述标准参数不大于阈值,获取所述正在训练的模型对应的损失函数值的倒数,并根据获取到的损失函数值的倒数以及对应的所述评估参数从所述正在训练的模型中确定继续训练的若干个模型,进一步包括:
响应于所述标准参数大于0不大于所述阈值,根据对所述获取到的损失函数值的倒数以及对应的所述评估参数进行加权求和后的大小确定继续训练的若干个模型。
4.如权利要求3所述的方法,...
【专利技术属性】
技术研发人员:于彤,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。