一种针对模型的调参方法及装置制造方法及图纸

技术编号:30491897 阅读:19 留言:0更新日期:2021-10-27 22:20
本申请公开了一种针对模型的自动调参方法,包括:从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型;如果所述第一目标模型中不包括满足预设性能条件的目标模型,则根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型;根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。所述方法可以灵活、快速的实现模型的持续迭代,增加目标模型的准确度。目标模型的准确度。目标模型的准确度。

【技术实现步骤摘要】
一种针对模型的调参方法及装置


[0001]本申请涉及计算机
,具体涉及一种针对模型的调参方法、装置、电子设备及存储设备。本申请同时涉及一种语音识别模型的获得方法、装置、电子设备及存储设备。本申请还涉及一种语音识别方法、装置、电子设备及存储设备。

技术介绍

[0002]随着深度学习(DL,Deep Learning)技术的不断发展,将训练获得的模型应用于不同的应用场景中,可以较好的方便人们生活。例如,将训练获得的模型应用于语音识别、语义理解、语音合成或者搜索推荐等应用中,可以方便的满足人们的各种需求。
[0003]目前在训练模型时,针对模型中的超参数(Hyperparameter),一般是通过人工手动调整超参数的方法来训练获得不同的模型,例如,针对初始的待训练基础模型,一般是由人工设定第一超参数组合信息后,通过训练数据训练获得与第一超参数组合信息对应的目标模型;之后,再由人工设定第二超参数组合信息,并训练获得与第二超参数组合对应的目标模型;如此经过多次手动调整并获得至少一个目标模型之后,从这至少一个目标模型中选取满足性能需求的模型以供使用。当然,目前也有针对模型的自动调参方法,该方法一般是通过计算设备模拟人工调参,即,在获得针对初始基础模型的多个超参数组合信息后,由计算设备串行或并行的获得与不同超参数组合信息对应的至少一个目标模型,并从这至少一个目标模型中选取满足性能需求的模型以供使用。
[0004]然而,随着深度学习技术的不断发展,模型的训练通常会占用较多的计算资源,并且单轮训练的耗时也在不断增长,因此,现有技术在对模型进行调参时,通常由于其流程比较固定,存在耗时大量增加的问题,进而导致将训练获得的目标模型或者超参数组合应用到线上时,最新上线的模型的性能效果反而不如线上经过实际数据不断训练获得的模型的效果。由此可知,目前针对模型的自动调参方法存在灵活度低以及准确度相对较低的问题。

技术实现思路

[0005]本申请实施例提供一种针对模型的调参方法,以解决现有技术存在的灵活度低以及准确度低的问题。
[0006]本申请实施例提供一种针对模型的调参方法,包括:从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型;如果所述第一目标模型中不存在满足预设性能条件的目标模型,则根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型;根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。
[0007]可选的,还包括:获得与所述第一目标模型对应的第一性能信息;根据所述第一性能信息,判断所述第一目标模型中是否存在满足所述预设性能条件的目标模型。
[0008]可选的,所述根据所述第一性能信息,判断所述第一目标模型中是否包括满足所
述预设性能条件的所述目标模型,包括:如果所述第一性能信息中存在不小于预设性能阈值的性能信息,则判定所述第一目标模型中存在所述目标模型。
[0009]可选的,还包括:根据所述第一目标模型中与所述不小于预设性能阈值的性能信息对应的模型,获得所述目标模型。
[0010]可选的,所述根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型,包括:从所述原始超参数组合信息中,获得所述第二超参数组合信息,其中,所述第二超参数组合信息是所述原始超参数组合信息中除所述第一超参数组合信息以外的任意一组超参数组合信息;从所述第一目标模型中,选取满足预设模型筛选条件的模型;根据所述满足预设模型筛选条件的模型,获得所述第二待训练基础模型。
[0011]可选的,所述从所述原始超参数组合信息中,获得所述第二超参数组合信息,包括:从所述原始超参数组合信息中,获得第二初始超参数组合信息,其中,所述第二初始超参数组合信息是所述原始超参数组合信息中除所述第一超参数组合信息以外的任意一组超参数组合信息;从所述第一超参数组合信息中,选取满足预设超参数筛选条件的超参数组合信息;根据所述第二初始超参数组合信息和所述满足预设超参数筛选条件的超参数组合信息,获得所述第二超参数组合信息。
[0012]可选的,所述从所述第一超参数组合信息中,选取满足预设超参数筛选条件的超参数组合信息,包括:获得与所述第一目标模型对应的第一性能信息;从所述第一性能信息中,获得数值满足预设第一数值条件的性能信息;根据所述第一超参数组合信息中与满足所述预设第一数值条件的性能信息对应的超参数组合信息,获得满足所述预设超参数筛选条件的超参数组合信息。
[0013]可选的,所述从所述第一目标模型中,选取满足预设模型筛选条件的模型,包括:获得与所述第一目标模型对应的第一性能信息;从所述第一性能信息中,获得数值满足预设第二数值条件的性能信息;根据所述第一目标模型中与满足所述预设第二数值条件的性能信息对应的模型,获得满足所述预设模型筛选条件的模型。
[0014]可选的,所述根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型,包括:根据所述第二超参数组合信息训练所述第二待训练基础模型,获得第二目标模型;如果所述第二目标模型中存在满足所述预设性能条件的模型,则根据所述满足所述预设性能条件的模型,获得所述目标模型。
[0015]可选的,所述第一待训练基础模型包括由用户配置的初始待训练基础模型。
[0016]可选的,还包括:获得初始待训练基础模型;如果所述原始超参数组合信息不满足预设的分组训练条件,则根据所述原始超参数组合信息训练所述初始待训练基础模型,获得用于表征训练获得的模型的性能的性能信息;从所述性能信息中,获得数值满足预设第二数值条件的性能信息;根据所述原始超参数组合信息中、与满足所述预设第二数值条件的性能信息对应的超参数组合信息,获得目标经验超参数组合信息,其中,所述目标经验超参数组合信息用于作为持续优化所述初始待训练基础模型时的经验超参数。
[0017]可选的,还包括:获取原始训练数据,所述使用所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型,包括:根据所述第一超参数组合信息和所述原始训练数据训练所述第一待训练基础模型,获得所述第一目标模型;所述根据所述第二超参数组
合信息和所述第二待训练基础模型,获得所述目标模型,包括:根据所述第二超参数组合信息和所述原始训练数据训练所述第二待训练基础模型,获得所述目标模型。
[0018]可选的,如果所述原始训练数据满足预设的数据拆分条件,则所述方法还包括:根据所述预设的数据拆分条件,对所述原始训练数据进行拆分处理,获取至少一组原始分组训练数据;所述根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型,还包括:从所述至少一组原始分组训练数据中,获取任意一组原始分组训练数据作为第一训练数据;根据所述第一超参数组合信息和所述第一训练数据训练所述第一待训练基础模型,获得所述第一目标模型;
[0019]可选的,所述根据所述第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对模型的调参方法,其特征在于,包括:从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息;根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型;如果所述第一目标模型中不存在满足预设性能条件的目标模型,则根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型;根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型。2.根据权利要求1所述的针对模型的调参方法,其特征在于,还包括:获得与所述第一目标模型对应的第一性能信息;根据所述第一性能信息,判断所述第一目标模型中是否存在满足所述预设性能条件的目标模型。3.根据权利要求2所述的针对模型的调参方法,其特征在于,所述根据所述第一性能信息,判断所述第一目标模型中是否包括满足所述预设性能条件的所述目标模型,包括:如果所述第一性能信息中存在不小于预设性能阈值的性能信息,则判定所述第一目标模型中存在所述目标模型。4.根据权利要求3所述的针对模型的调参方法,其特征在于,还包括:根据所述第一目标模型中与所述不小于预设性能阈值的性能信息对应的模型,获得所述目标模型。5.根据权利要求1所述的针对模型的调参方法,其特征在于,所述根据所述原始超参数组合信息和所述第一目标模型,获得第二超参数组合信息和第二待训练基础模型,包括:从所述原始超参数组合信息中,获得所述第二超参数组合信息,其中,所述第二超参数组合信息是所述原始超参数组合信息中除所述第一超参数组合信息以外的任意一组超参数组合信息;从所述第一目标模型中,选取满足预设模型筛选条件的模型;根据所述满足预设模型筛选条件的模型,获得所述第二待训练基础模型。6.根据权利要求5所述的针对模型的调参方法,其特征在于,所述从所述原始超参数组合信息中,获得所述第二超参数组合信息,包括:从所述原始超参数组合信息中,获得第二初始超参数组合信息,其中,所述第二初始超参数组合信息是所述原始超参数组合信息中除所述第一超参数组合信息以外的任意一组超参数组合信息;从所述第一超参数组合信息中,选取满足预设超参数筛选条件的超参数组合信息;根据所述第二初始超参数组合信息和所述满足预设超参数筛选条件的超参数组合信息,获得所述第二超参数组合信息。7.根据权利要求6所述的针对模型的调参方法,其特征在于,所述从所述第一超参数组合信息中,选取满足预设超参数筛选条件的超参数组合信息,包括:获得与所述第一目标模型对应的第一性能信息;从所述第一性能信息中,获得数值满足预设第一数值条件的性能信息;根据所述第一超参数组合信息中与满足所述预设第一数值条件的性能信息对应的超参数组合信息,获得满足所述预设超参数筛选条件的超参数组合信息。8.根据权利要求5所述的针对模型的调参方法,其特征在于,所述从所述第一目标模型
中,选取满足预设模型筛选条件的模型,包括:获得与所述第一目标模型对应的第一性能信息;从所述第一性能信息中,获得数值满足预设第二数值条件的性能信息;根据所述第一目标模型中与满足所述预设第二数值条件的性能信息对应的模型,获得满足所述预设模型筛选条件的模型。9.根据权利要求1所述的针对模型的调参方法,其特征在于,所述根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型,包括:根据所述第二超参数组合信息训练所述第二待训练基础模型,获得第二目标模型;如果所述第二目标模型中存在满足所述预设性能条件的模型,则根据所述满足所述预设性能条件的模型,获得所述目标模型。10.根据权利要求1所述的针对模型的调参方法,其特征在于,所述第一待训练基础模型包括由用户配置的初始待训练基础模型。11.根据权利要求1所述的针对模型的调参方法,其特征在于,还包括:获得初始待训练基础模型;如果所述原始超参数组合信息不满足预设的分组训练条件,则根据所述原始超参数组合信息训练所述初始待训练基础模型,获得用于表征训练获得的模型的性能的性能信息;从所述性能信息中,获得数值满足预设第二数值条件的性能信息;根据所述原始超参数组合信息中、与满足所述预设第二数值条件的性能信息对应的超参数组合信息,获得目标经验超参数组合信息,其中,所述目标经验超参数组合信息用于作为持续优化所述初始待训练基础模型时的经验超参数。12.根据权利要求1所述的针对模型的调参方法,其特征在于,还包括:获取原始训练数据;所述使用所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型,包括:根据所述第一超参数组合信息和所述原始训练数据训练所述第一待训练基础模型,获得所述第一目标模型;所述根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型,包括:根据所述第二超参数组合信息和所述原始训练数据训练所述第二待训练基础模型,获得所述目标模型。13.根据权利要求12所述的针对模型的调参方法,其特征在于,如果所述原始训练数据满足预设的数据拆分条件,则所述方法还包括:根据所述预设的数据拆分条件,对所述原始训练数据进行拆分处理,获取至少一组原始分组训练数据;所述根据所述第一超参数组合信息训练第一待训练基础模型,获得第一目标模型,还包括:从所述至少一组原始分组训练数据中,获取任意一组原始分组训练数据作为第一训练数据;根据所述第一超参数组合信息和所述第一训练数据训练所述第一待训练基础模型,获得所述第一目标模型;所述根据所述第二超参数组合信息和所述第二待训练基础模型,获得所述目标模型,包括:从所述至少一组原始分组训练数据中,获取第二训练数据;根据所述第二超参数组合信息和所述第二训练数据训练所述第二待训练基础模型,获得所述目标模型,其中,所述第
二训练数据是所述至少一组原始分组训练数据中,除所述第一训练数据以外的任意一组原始分组训练数据。14.根据权利要求13所述的针对模型的调参方法,其特征在于,如果所述原始训练数据的数量不小于预设的训练数据阈值,则判定所述原始训练数据满足所述预设的数据拆分条件。15.根据权利要求1所述的针对模型的调参方法,其特征在于,还包括:获得与第一目标模型对应的第一性能信息,以及,获得与所述目标模型对应的第二性能信息;根据所述第一性能信息和所述第二性能信息,获得与所述原始超参数组合信息对应的性能变化信息。16.根据权利要求1所述的针对模型的调参方法,其特征在于,所述方法还包括:获取用于表征启动调参操作的触发操作;响应于所述触发操作,执行从原始超参数组合信息中,获得任意一组超参数组合信息作为第一超参数组合信息步骤。17.根据权利要求10所述的针对模型的调参方法,其特征在于,所述原始超参数组合信息包括以下至少一种超参数组合的信息:由所述用户配置的与所述初始待训练基础模型对应的超参数组合、从与所述初始待训练基础模型对应的历史超参数组合中获得的超参数组合。18.一种语音识别模型...

【专利技术属性】
技术研发人员:朱晓如
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1