一种目标检测模型学习率的设置方法和装置制造方法及图纸

技术编号:27806542 阅读:25 留言:0更新日期:2021-03-30 09:21
本发明专利技术公开了目标检测模型学习率的设置方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括设置训练集总图片数量和每轮迭代训练的图片数量,以计算步长;初始化学习率,以在训练集上进行目标检测模型的训练,且每迭代一个步长将学习率增大预设数值,同时计算一次验证集的平均精度均值,进而获得最小学习率和最大学习率;再以预设数量个步长为一个周期循环训练目标检测模型,直到完成预设的最大迭代次数;其中,基于最小学习率和最大学习率,根据步长内当前迭代的次数,计算每次迭代的学习率。从而,本发明专利技术的实施方式能够解决现有技术训练目标检测模型的学习率设置效率低的问题。低的问题。低的问题。

【技术实现步骤摘要】
一种目标检测模型学习率的设置方法和装置


[0001]本专利技术涉及计算机
,尤其涉及一种目标检测模型学习率的设置方法和装置。

技术介绍

[0002]在训练目标检测模型过程中,通过随机梯度下降以及反向传播机制不断减小损失函数值,从而使预测框的位置逼近真实框的位置,同时提高类别置信度,不断增强模型检测目标的效果。最终得到一个最优的目标检测模型。而学习率是训练目标检测模型重要的超参数,设置学习率时,首先需要确定初始值,训练过程中还需要不断调整,而这两步都影响着最后的模型检测效果。
[0003]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:
[0004]目前,最优的学习率初始值与数据集具有一定联系,找到最优的学习率初始值需要多次尝试调整。另外,训练过程中学习率的调整策略会影响最后的模型效果,调整的时机和程度不易把握。现实中往往需要进行多次无效训练尝试才能设置出合适的学习率调整方案。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供一种目标检测模型学习率的设置方法和装置,能够解决现有技术训练目标检测模型的学习率设置效率低的问题。
[0006]为实现上述目的,根据本专利技术实施例的一个方面,提供了一种目标检测模型学习率的设置方法,包括设置训练集总图片数量和每轮迭代训练的图片数量,以计算步长;初始化学习率,以在训练集上进行目标检测模型的训练,且每迭代一个步长将学习率增大预设数值,同时计算一次验证集的平均精度均值,进而获得最小学习率和最大学习率;基于最小学习率和最大学习率,根据步长内当前迭代的次数,计算每次迭代的学习率,进而以预设数量个步长为一个周期循环训练目标检测模型,直到完成预设的最大迭代次数。
[0007]可选地,获得最小学习率和最大学习率,包括:
[0008]根据验证集的平均精度均值脱离趋近于0的区域开始增大时,获得最小学习率;
[0009]根据验证集的平均精度均值开始降低时,获得最大学习率。
[0010]可选地,以预设数量个步长为一个周期循环训练目标检测模型,包括:
[0011]以2个步长为一个周期循环训练目标检测模型;其中,在第一个步长期间,学习率由最小学习率逐渐增大到最大学习率;在第二个步长期间,学习率由最大学习率逐渐减小到最小学习率。
[0012]可选地,基于最小学习率和最大学习率,根据步长内当前迭代的次数,计算每次迭代的学习率,包括:
[0013]在第一个步长期间,每次迭代的学习率为最大学习率与最小学习率之差乘以步长内当前迭代的次数与步长的商,再加上最小学习率;
[0014]在第二个步长期间,每次迭代的学习率为最大学习率与最小学习率之差乘以,步长与步长内当前迭代的次数的差再除以步长的结果,最后再加上最小学习率
[0015]另外,根据本专利技术实施例的一个方面,提供了一种目标检测模型学习率的设置装置,包括设置模块,用于设置训练集总图片数量和每轮迭代训练的图片数量,以计算步长;处理模块,用于初始化学习率,以在训练集上进行目标检测模型的训练,且每迭代一个步长将学习率增大预设数值,同时计算一次验证集的平均精度均值,进而获得最小学习率和最大学习率;基于最小学习率和最大学习率,根据步长内当前迭代的次数,计算每次迭代的学习率,进而以预设数量个步长为一个周期循环训练目标检测模型,直到完成预设的最大迭代次数。
[0016]可选地,所述处理模块获得最小学习率和最大学习率,包括:
[0017]根据验证集的平均精度均值脱离趋近于0的区域开始增大时,获得最小学习率;
[0018]根据验证集的平均精度均值开始降低时,获得最大学习率。
[0019]可选地,所述处理模块以预设数量个步长为一个周期循环训练目标检测模型,包括:
[0020]以2个步长为一个周期循环训练目标检测模型;其中,在第一个步长期间,学习率由最小学习率逐渐增大到最大学习率;在第二个步长期间,学习率由最大学习率逐渐减小到最小学习率。
[0021]可选地,所述处理模块基于最小学习率和最大学习率,根据步长内当前迭代的次数,计算每次迭代的学习率,包括:
[0022]在第一个步长期间,每次迭代的学习率为最大学习率与最小学习率之差乘以步长内当前迭代的次数与步长的商,再加上最小学习率;
[0023]在第二个步长期间,每次迭代的学习率为最大学习率与最小学习率之差乘以,步长与步长内当前迭代的次数的差再除以步长的结果,最后再加上最小学习率。
[0024]根据本专利技术实施例的另一个方面,还提供了一种电子设备,包括:
[0025]一个或多个处理器;
[0026]存储装置,用于存储一个或多个程序,
[0027]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一目标检测模型学习率的设置实施例所述的方法。
[0028]根据本专利技术实施例的另一个方面,还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一基于目标检测模型学习率的设置实施例所述的方法。
[0029]上述专利技术中的一个实施例具有如下优点或有益效果:本专利技术通过设置训练集总图片数量和每轮迭代训练的图片数量,以计算步长;初始化学习率,以在训练集上进行目标检测模型的训练,且每迭代一个步长将学习率增大预设数值,同时计算一次验证集的平均精度均值,进而获得最小学习率和最大学习率;基于最小学习率和最大学习率,根据步长内当前迭代的次数,计算每次迭代的学习率,进而以预设数量个步长为一个周期循环训练目标检测模型,直到完成预设的最大迭代次数。。从而,本专利技术提出一种通用学习率设置方法,并使对学习率的初始化和调整能符合当前数据集的特点,从而在避免人工尝试调整的同时,获得更优的训练效果。
[0030]上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
[0031]附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:
[0032]图1是根据本专利技术第一实施例的目标检测模型学习率的设置方法的主要流程的示意图
[0033]图2是根据本专利技术第二实施例的目标检测模型学习率的设置方法的主要流程的示意图;
[0034]图3是根据本专利技术实施例的目标检测模型学习率的设置装置的主要模块的示意图;
[0035]图4是本专利技术实施例可以应用于其中的示例性系统架构图;
[0036]图5是适于用来实现本专利技术实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
[0037]以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0038]图1是根据本专利技术第一实施例的目标检测模型学习率的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测模型学习率的设置方法,其特征在于,包括:设置训练集总图片数量和每轮迭代训练的图片数量,以计算步长;初始化学习率,以在训练集上进行目标检测模型的训练,且每迭代一个步长将学习率增大预设数值,同时计算一次验证集的平均精度均值,进而获得最小学习率和最大学习率;基于最小学习率和最大学习率,根据步长内当前迭代的次数,计算每次迭代的学习率,进而以预设数量个步长为一个周期循环训练目标检测模型,直到完成预设的最大迭代次数。2.根据权利要求1所述的方法,其特征在于,获得最小学习率和最大学习率,包括:根据验证集的平均精度均值脱离趋近于0的区域开始增大时,获得最小学习率;根据验证集的平均精度均值开始降低时,获得最大学习率。3.根据权利要求1所述的方法,其特征在于,以预设数量个步长为一个周期循环训练目标检测模型,包括:以2个步长为一个周期循环训练目标检测模型;其中,在第一个步长期间,学习率由最小学习率逐渐增大到最大学习率;在第二个步长期间,学习率由最大学习率逐渐减小到最小学习率。4.根据权利要求3所述的方法,其特征在于,基于最小学习率和最大学习率,根据步长内当前迭代的次数,计算每次迭代的学习率,包括:在第一个步长期间,每次迭代的学习率为最大学习率与最小学习率之差乘以步长内当前迭代的次数与步长的商,再加上最小学习率;在第二个步长期间,每次迭代的学习率为最大学习率与最小学习率之差乘以,步长与步长内当前迭代的次数的差再除以步长的结果,最后再加上最小学习率。5.一种目标检测模型学习率的设置装置,其特征在于,包括:设置模块,用于设置训练集总图片数量和每轮迭代训练的图片数量,以计算步长;处理模块,用于初始化学习率,以在训练集上进行目标检测模型的训练,且每迭代一个...

【专利技术属性】
技术研发人员:罗壮何云龙赵亚滨郭晓辉张志强
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1