【技术实现步骤摘要】
一种实现自动超参数选择的方法、装置及系统
本专利技术涉及机器学习
,更具体地,涉及一种实现自动超参数选择的方法、一种实现自动超参数选择的装置、一种包括至少一个计算装置和至少一个存储装置的系统、及一种可读存储介质。
技术介绍
机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。传统的机器学习模型的训练之前,会通过调参算法来选取机器学习模型的超参数。通常情况下,需要对超参数进行优化,给模型选择一组最优超参数,以提高学习的性能和效果。在实际项目中,由于机器学习模型上线影响代价较大,因此,为机器学习模型选择稳定的超参数显得尤为重要。
技术实现思路
本专利技术的一个目的是提供一种自动选择机器学习模型的超参数的新技术方案。根据本专利技术的第一方面,提供了一种实现自动超参数选择的方法,包括:获取样本集,其中,所述样本集中的每条样本包括对应的数据和标签;根据预设的拆分规则将所述样本集拆分为训练集和验证集;根据预设的调参算法进行超参数搜 ...
【技术保护点】
1.一种实现自动超参数选择的方法,包括:/n获取样本集,其中,所述样本集中的每条样本包括对应的数据和标签;/n根据预设的拆分规则将所述样本集拆分为训练集和验证集;/n根据预设的调参算法进行超参数搜索,并基于所述训练集进行机器学习模型训练,获取多组候选超参数值;/n基于所述验证集对每组候选超参数值对应的机器学习模型进行验证,得到每组候选超参数值对应的机器学习模型在所述验证集上的验证得分;/n根据所述验证得分从所述多组候选超参数值中选取至少一组优选超参数值。/n
【技术特征摘要】
1.一种实现自动超参数选择的方法,包括:
获取样本集,其中,所述样本集中的每条样本包括对应的数据和标签;
根据预设的拆分规则将所述样本集拆分为训练集和验证集;
根据预设的调参算法进行超参数搜索,并基于所述训练集进行机器学习模型训练,获取多组候选超参数值;
基于所述验证集对每组候选超参数值对应的机器学习模型进行验证,得到每组候选超参数值对应的机器学习模型在所述验证集上的验证得分;
根据所述验证得分从所述多组候选超参数值中选取至少一组优选超参数值。
2.根据权利要求1所述的方法,所述根据预设的拆分规则将所述样本集拆分为训练集和验证集包括:
判断所述样本集的标签是否具有时序关系;
获取与判断结果对应的拆分规则,并根据所述拆分规则将所述样本集拆分为训练集和验证集。
3.根据权利要求2所述的方法,所述获取与判断结果对应的拆分规则,并根据所述拆分规则将所述样本集拆分为训练集和验证集包括:
在所述样本集的标签具有时序关系的情况下,获取所述训练集和所述验证集的时间拆分比例;
选取设定时间长度的目标时间窗;
根据所述时间拆分比例将所述目标时间窗拆分为用于选取所述训练集的前部分时间窗、和用于选取所述验证集的后部分时间窗;
选取产生时间与所述前部分时间窗对应的样本作为所述训练集,选取产生时间与所述后部分时间窗对应的样本作为所述验证集。
4.根据权利要求3所述的方法,还包括:
检测启动自学习的事件是否发生;
在所述事件发生的情况下,获取新的训练集和新的验证集;
根据所述新的训练集对每组候选超参数值对应的机器学习模型进行迭代训练;
根据所述新的验证集对每组候选超参数值对应的迭代后的机器学习模型进行验证,得到每组候选超参数值对应的迭代后的机器学习模型在所述新的验证集上的新的验证得分;
根据所述新的验证得分从所述多组候选超参数值中重新选取优选超参数值。
5.根据权利要求4所述的方法,所述获取新的训练集和新的验证集包括:
获取预设的滑动时长;
按照所述滑...
【专利技术属性】
技术研发人员:郑佳尔,秦一焜,
申请(专利权)人:第四范式北京技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。