一种超参数调优方法、装置及存储介质制造方法及图纸

技术编号：28977864 阅读：9 留言：0更新日期：2021-06-23 09:23

本申请公开了一种超参数调优方法、装置及存储介质，其中，方法包括：由于预先存储了计算资源的资源量与超参数调优策略的对应关系，因此在获取到当前可用的计算资源时，可以依据对应关系选择当前可用的计算资源对应的超参数调优策略，然后根据该超参数调优策略对超参数进行调优。应用以上技术方案，根据具体场景中可用的计算资源选择不同的超参数调优策略，能够最大限度的利用现有计算资源，达到最优的调优效果，尽可能的满足训练精度的要求。

全部详细技术资料下载

【技术实现步骤摘要】
一种超参数调优方法、装置及存储介质
本申请涉及深度学习
，特别是涉及一种超参数调优方法、装置及存储介质。
技术介绍
目前，深度学习被应用于大数据分析、计算机视觉和自然语言处理等各种领域。为了现实中的复杂问题，深度学习模型往往结构复杂，且需要以极大的数据量训练网络，而训练和推理都需要大量的计算资源才能快速运行。深度学习模型的超参数调优是以计算资源替代专家经验，设定若干超参数建立深度学习模型，对深度学习模型进行训练，将深度学习模型效果最好的那一组超参数设定为最终超参数。上述过程中，每一组超参数都需要对应一个深度学习模型，并进行训练结果对比，所以对计算资源提出了要求，若大量减少计算量，则会降低深度学习模型的精度，因此训练精度与计算资源产生矛盾。由此可见，如何平衡训练精度与计算资源之间的关系是本领域技术人员亟待解决的问题。
技术实现思路
本申请的目的是提供一种超参数调优方法、装置及存储介质，根据具体场景中可用的计算资源选择不同的超参数调优策略，能够平衡训练精度与计算资源之间的关系。为解决上述技术问题，本申请提供一种超参数调优方法，包括：预先存储计算资源的资源量与超参数调优策略的对应关系；获取当前可用的所述计算资源；调用所述对应关系，并依据所述对应关系确定当前可用的所述计算资源对应的超参数调优策略；根据所述超参数调优策略对超参数进行调优。优选地，所述依据所述对应关系确定当前可用的所述计算资源对应的超参数调优策略，具体包括：若当前可...

【技术保护点】
1.一种超参数调优方法，其特征在于，包括：/n预先存储计算资源的资源量与超参数调优策略的对应关系；/n获取当前可用的所述计算资源；/n调用所述对应关系，并依据所述对应关系确定当前可用的所述计算资源对应的超参数调优策略；/n根据所述超参数调优策略对超参数进行调优。/n

【技术特征摘要】
1.一种超参数调优方法，其特征在于，包括：
预先存储计算资源的资源量与超参数调优策略的对应关系；
获取当前可用的所述计算资源；
调用所述对应关系，并依据所述对应关系确定当前可用的所述计算资源对应的超参数调优策略；
根据所述超参数调优策略对超参数进行调优。

2.如权利要求1所述的超参数调优方法，其特征在于，所述依据所述对应关系确定当前可用的所述计算资源对应的超参数调优策略，具体包括：
若当前可用的所述计算资源的资源量不小于第一预设阈值，则所述超参数调优策略为对全部所述超参数进行并行调优；
若当前可用的所述计算资源的资源量小于所述第一预设阈值且大于第二预设阈值，则所述超参数调优策略为对全部所述超参数进行并行调优并在调优过程中采用早停策略；
若当前可用的所述计算资源的资源量不大于所述第二预设阈值，则所述超参数调优策略为对全部所述超参数进行降维，并对降维后的所述超参数进行调优；
其中，所述第一预设阈值大于所述第二预设阈值。

3.如权利要求2所述的超参数调优方法，其特征在于，所述对全部所述超参数进行降维，并对降维后的所述超参数进行调优具体为：
对全部所述超参数进行分组；
对各组所述超参数进行并行调优。

4.如权利要求2所述的超参数调优方法，其特征在于，所述对全部所述超参数进行降维，并对降维后的所述超参数进行调优具体为：
按照对于超参数调优结果的影响由大到小的顺序对全部所述超参数进行排序；
按照所述超参数的顺序，选取至少一个所述超参数进行...

【专利技术属性】
技术研发人员：于彤，
申请(专利权)人：山东英信计算机技术有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人