超参数搜索方法、装置、设备以及存储介质制造方法及图纸

技术编号：25398844 阅读：42 留言：0更新日期：2020-08-25 23:03

本申请实施例公开了超参数搜索方法、装置、设备以及存储介质，涉及人工智能技术领域。该方法的一具体实施方式包括：获取模型的训练脚本和超参数配置信息；基于超参数配置信息，生成超参数搜索空间；将训练脚本作为第一组件，在超参数搜索空间中执行，自动搜索超参数搜索空间中的超参数的目标值。该实施方式通过自动搜索的方式进行超参数的搜索，大大缩短了为模型选择较优的超参数所花费的时间。同时，在接口设计上采用组件化的设计方式，将训练脚本作为组件，方便任意模型的快速接入。

全部详细技术资料下载

【技术实现步骤摘要】
超参数搜索方法、装置、设备以及存储介质
本申请实施例涉及计算机
，具体涉及人工智能

技术介绍
深度学习技术在很多方向上都取得了巨大的成功。在深度学习技术中，模型的超参数对模型的性能和效果有着非常重要的影响。目前，所有的模型在开始训练过程之前都需要对超参数进行设置。而传统的超参数设置严重依赖人工的干预，例如人工设定超参数，并花费大量的时间进行多次调节，以得到较优的超参数。
技术实现思路
本申请实施例提出了超参数搜索方法、装置、设备以及存储介质。第一方面，本申请实施例提出了一种超参数搜索方法，包括：获取模型的训练脚本和超参数配置信息；基于超参数配置信息，生成超参数搜索空间；将训练脚本作为第一组件，在超参数搜索空间中执行，自动搜索超参数搜索空间中的超参数的目标值。第二方面，本申请实施例提出了一种超参数搜索装置，包括：模型信息获取模块，被配置成获取模型的训练脚本和超参数配置信息；搜索空间生成模块，被配置成基于超参数配置信息，生成超参数搜索空间；超参数搜索模块，被配置成将训练脚本作为第一组件，在超参数搜索空间中执行，自动搜索超参数搜索空间中的超参数的目标值。第三方面，本申请实施例提出了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行如第一方面中任一实现方式描述的方法。第四方面，本申请实施例提出了一种存储有计算机指令的非瞬时计算机...

【技术保护点】
1.一种超参数搜索方法，包括：/n获取模型的训练脚本和超参数配置信息；/n基于所述超参数配置信息，生成超参数搜索空间；/n将所述训练脚本作为第一组件，在所述超参数搜索空间中执行，自动搜索所述超参数搜索空间中的超参数的目标值。/n

【技术特征摘要】
1.一种超参数搜索方法，包括：
获取模型的训练脚本和超参数配置信息；
基于所述超参数配置信息，生成超参数搜索空间；
将所述训练脚本作为第一组件，在所述超参数搜索空间中执行，自动搜索所述超参数搜索空间中的超参数的目标值。

2.根据权利要求1所述的方法，其中，所述训练脚本具有组件化传参接口；以及
所述将所述训练脚本作为第一组件，在所述超参数搜索空间中执行，自动搜索所述超参数搜索空间中的超参数的目标值，包括：
对于所述超参数搜索空间中的超参数的候选值，将该候选值作为第二组件，通过组件化传参接口传递给所述训练脚本进行模型训练，得到该候选值对应的模型；
将满足预设效果的模型对应的候选值确定为所述目标值。

3.根据权利要求1所述的方法，其中，所述获取模型的超参数配置信息，包括：
将所述超参数配置信息作为第三组件，以及从组件化配置信息提交接口获取所述超参数配置信息，其中，所述超参数配置信息的提交方式包括在线提交或命令行提交。

4.根据权利要求1所述的方法，其中，所述方法还包括：
获取训练样本集；
将所述目标值设置成模型的超参数，以及利用所述训练样本集进行训练，得到目标模型。

5.根据权利要求1-4之一所述的方法，其中，超参数包括以下至少一种：学习率、学习率衰减策略、一次训练所选取的样本数、指数移动平均值、丢弃率、预热学习率。

6.一种超参数搜索装置，包括：
模型信息获取模块，被配置成获取模型的训练脚本和超参数配置信息；
搜索空间生成模块，被配置成基于所述超参数配置信息，生成超参数搜索空间；
超参数搜索模块，...

【专利技术属性】
技术研发人员：希滕，张刚，温圣召，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人