确定业务模型超参数的方法和装置制造方法及图纸

技术编号:24997518 阅读:40 留言:0更新日期:2020-07-24 17:59
本说明书实施例提供了一种确定业务模型超参数的方法和装置,所述业务模型包括多个超参数,所述方法包括:获取多个超参数组合,每个所述超参数组合包括所述多个超参数各自的值;从预先准备的第一训练样本集中选取部分训练样本以构成第二训练样本集;使用所述第二训练样本集训练与所述多个超参数组合分别对应的业务模型,以获取多个低精度业务模型;测试各个低精度业务模型的性能分数,作为各个超参数组合的低精度分数;使用预先训练的拟合模型拟合各个超参数组合的高精度分数与低精度分数的差距;基于各个超参数组合的低精度分数、及拟合的高精度分数与低精度分数的差距,计算各个超参数组合的估计高精度分数。

【技术实现步骤摘要】
确定业务模型超参数的方法和装置
本说明书实施例涉及机器学习
,更具体地,涉及一种确定业务模型超参数的方法和装置。
技术介绍
在互联网的应用场景中,每天会有大量的业务数据需要分析,而机器学习作为一种技术手段,正在越来越多的场景中发挥着作用。对于给定的任务,建立并部署有效的模型通常包括两个主要的部分,其一是选择合适的模型,其二则是针对该模型选择合适的超参数,从而为模型的性能提供保障。在当前的方案中,最基本且使用最为广泛的是两种搜索算法,即网格搜索(GridSearch)算法和随机搜索(RandomSearch)算法,在这两种算法中,在给定搜索范围内搜索较优的超参数。对上述搜索算法的改进算法包括遗传算法(GeneticAlgorithm)或差分进化(DifferentialEvolution)算法,其中,遗传算法适用于离散的超参数,差分进化算法适用于连续的超参数。除此之外,贝叶斯优化算法基于高斯过程拟合历史超参数的“超参数-性能”曲线,从而去指导下一轮的超参数的选择。在上述各种超参数搜索算法中,为了比较各个超参数组合的优劣,通常使用全量训练样本进行模型的训练,从而基于该训练的模型进行超参数评估。因此,每一组超参数组合的验证都需要大量时间成本。而如果减少训练样本的数量以减少评估超参数的时间,基于少量训练样本获得的超参数评估结果有可能与大量训练样本下的超参数评估结果不同。因此,需要一种更有效的确定业务模型的超参数的方案。
技术实现思路
本说明书实施例旨在提供一种更有效的确定业务模型的超参数的方案,以解决现有技术中的不足。为实现上述目的,本说明书一个方面提供一种确定业务模型超参数的方法,所述业务模型包括多个超参数,所述方法包括:获取多个超参数组合,每个所述超参数组合包括所述多个超参数各自的值;从预先准备的第一训练样本集中选取部分训练样本以构成第二训练样本集,其中,所述训练样本与网络平台中的以下任一对象相关:用户、商户、商品、交易;使用所述第二训练样本集训练与所述多个超参数组合分别对应的业务模型,以获取多个低精度业务模型;测试各个低精度业务模型的性能分数,作为各个超参数组合的低精度分数;使用预先训练的拟合模型拟合各个超参数组合的高精度分数与低精度分数的差距,其中,所述超参数组合的高精度分数为对应的高精度业务模型的性能分数,所述超参数组合对应的高精度业务模型为通过以所述第一训练样本集训练所述超参数组合对应的业务模型所获取的模型;基于各个超参数组合的低精度分数、及拟合的高精度分数与低精度分数的差距,计算各个超参数组合的估计高精度分数。在一种实施方式中,所述方法还包括,在计算各个超参数组合的估计高精度分数之后,在当前不具有高精度分数的超参数组合中确定估计高精度分数最高的第一超参数组合;以所述第一训练样本集训练所述第一超参数组合对应的业务模型,以获取高精度业务模型;测试所述高精度业务模型的性能分数,作为所述第一超参数组合的高精度分数。在一种实施方式中,所述方法还包括:在测试所述高精度业务模型的性能分数之后,计算所述第一超参数组合的高精度分数与低精度分数的第一差距;以所述第一超参数组合作为样本特征值、以所述第一差距作为样本标签值,训练所述拟合模型。在一种实施方式中,所述方法还包括:在训练所述拟合模型之后,获取当前具有低精度分数、不具有高精度分数的多个第二超参数组合;基于所述拟合模型和各个第二超参数组合的低精度分数,计算各个第二超参数组合的估计高精度分数;基于各个第二超参数组合的估计高精度分数、以及当前具有高精度分数的超参数组合的高精度分数,通过预定超参数搜索算法,确定对所述方法的下一次循环中处理的多个超参数组合。在一种实施方式中,所述预定超参数搜索算法为以下任一算法:遗传算法、贝叶斯优化算法、差分进化算法、网格搜索算法、随机搜索算法。在一种实施方式中,所述方法还包括,在获取所述第一超参数组合的高精度分数之后,将当前的具有最高高精度分数的超参数组合确定为所述业务模型的超参数组合。在一种实施方式中,所述拟合模型为以下任一模型:随机森林模型、决策树模型、线性回归模型、逻辑回归模型。本说明书另一方面提供一种确定业务模型超参数的装置,所述业务模型包括多个超参数,所述装置包括:第一获取单元,配置为,获取多个超参数组合,每个所述超参数组合包括所述多个超参数各自的值;选取单元,配置为,从预先准备的第一训练样本集中选取部分训练样本以构成第二训练样本集,其中,所述训练样本与网络平台中的以下任一对象相关:用户、商户、商品、交易;第一训练单元,配置为,使用所述第二训练样本集训练与所述多个超参数组合分别对应的业务模型,以获取多个低精度业务模型;第一测试单元,配置为,测试各个低精度业务模型的性能分数,作为各个超参数组合的低精度分数;拟合单元,配置为,使用预先训练的拟合模型拟合各个超参数组合的高精度分数与低精度分数的差距,其中,所述超参数组合的高精度分数为对应的高精度业务模型的性能分数,所述超参数组合对应的高精度业务模型为通过以所述第一训练样本集训练所述超参数组合对应的业务模型所获取的模型;第一计算单元,配置为,基于各个超参数组合的低精度分数、及拟合的高精度分数与低精度分数的差距,计算各个超参数组合的估计高精度分数。在一种实施方式中,所述装置还包括,第一确定单元,配置为,在计算各个超参数组合的估计高精度分数之后,在当前不具有高精度分数的超参数组合中确定估计高精度分数最高的第一超参数组合;第二训练单元,配置为,以所述第一训练样本集训练所述第一超参数组合对应的业务模型,以获取高精度业务模型;第二测试单元,配置为,测试所述高精度业务模型的性能分数,作为所述第一超参数组合的高精度分数。在一种实施方式中,所述装置还包括:第二计算单元,配置为,在测试所述高精度业务模型的性能分数之后,计算所述第一超参数组合的高精度分数与低精度分数的第一差距;第三训练单元,配置为,以所述第一超参数组合作为样本特征值、以所述第一差距作为样本标签值,训练所述拟合模型。在一种实施方式中,所述装置还包括:第二获取单元,配置为,在训练所述拟合模型之后,获取当前具有低精度分数、不具有高精度分数的多个第二超参数组合;第三计算单元,配置为,基于所述拟合模型和各个第二超参数组合的低精度分数,计算各个第二超参数组合的估计高精度分数;搜索单元,配置为,基于各个第二超参数组合的估计高精度分数、以及当前具有高精度分数的超参数组合的高精度分数,通过预定超参数搜索算法,确定对所述方法的下一次循环中处理的多个超参数组合。在一种实施方式中,所述预定超参数搜索算法为以下任一算法:遗传算法、贝叶斯优化算法、差分进化算法、网格搜索算法、随机搜索算法。在一种实施方式中,所述装置还包括,第二确定单元,配置为,在获本文档来自技高网...

【技术保护点】
1.一种确定业务模型超参数的方法,所述业务模型包括多个超参数,所述方法包括:/n获取多个超参数组合,每个所述超参数组合包括所述多个超参数各自的值;/n从预先准备的第一训练样本集中选取部分训练样本以构成第二训练样本集,其中,所述训练样本与网络平台中的以下任一对象相关:用户、商户、商品、交易;/n使用所述第二训练样本集训练与所述多个超参数组合分别对应的业务模型,以获取多个低精度业务模型;/n测试各个低精度业务模型的性能分数,作为各个超参数组合的低精度分数;/n使用预先训练的拟合模型拟合各个超参数组合的高精度分数与低精度分数的差距,其中,所述超参数组合的高精度分数为对应的高精度业务模型的性能分数,所述超参数组合对应的高精度业务模型为通过以所述第一训练样本集训练所述超参数组合对应的业务模型所获取的模型;/n基于各个超参数组合的低精度分数、及拟合的高精度分数与低精度分数的差距,计算各个超参数组合的估计高精度分数。/n

【技术特征摘要】
1.一种确定业务模型超参数的方法,所述业务模型包括多个超参数,所述方法包括:
获取多个超参数组合,每个所述超参数组合包括所述多个超参数各自的值;
从预先准备的第一训练样本集中选取部分训练样本以构成第二训练样本集,其中,所述训练样本与网络平台中的以下任一对象相关:用户、商户、商品、交易;
使用所述第二训练样本集训练与所述多个超参数组合分别对应的业务模型,以获取多个低精度业务模型;
测试各个低精度业务模型的性能分数,作为各个超参数组合的低精度分数;
使用预先训练的拟合模型拟合各个超参数组合的高精度分数与低精度分数的差距,其中,所述超参数组合的高精度分数为对应的高精度业务模型的性能分数,所述超参数组合对应的高精度业务模型为通过以所述第一训练样本集训练所述超参数组合对应的业务模型所获取的模型;
基于各个超参数组合的低精度分数、及拟合的高精度分数与低精度分数的差距,计算各个超参数组合的估计高精度分数。


2.根据权利要求1所述的方法,还包括,
在计算各个超参数组合的估计高精度分数之后,在当前不具有高精度分数的超参数组合中确定估计高精度分数最高的第一超参数组合;
以所述第一训练样本集训练所述第一超参数组合对应的业务模型,以获取高精度业务模型;
测试所述高精度业务模型的性能分数,作为所述第一超参数组合的高精度分数。


3.根据权利要求2所述的方法,还包括:
在测试所述高精度业务模型的性能分数之后,计算所述第一超参数组合的高精度分数与低精度分数的第一差距;
以所述第一超参数组合作为样本特征值、以所述第一差距作为样本标签值,训练所述拟合模型。


4.根据权利要求3所述的方法,还包括:
在训练所述拟合模型之后,获取当前具有低精度分数、不具有高精度分数的多个第二超参数组合;
基于所述拟合模型和各个第二超参数组合的低精度分数,计算各个第二超参数组合的估计高精度分数;
基于各个第二超参数组合的估计高精度分数、以及当前具有高精度分数的超参数组合的高精度分数,通过预定超参数搜索算法,确定对所述方法的下一次循环中处理的多个超参数组合。


5.根据权利要求4所述的方法,其中,所述预定超参数搜索算法为以下任一算法:遗传算法、贝叶斯优化算法、差分进化算法、网格搜索算法、随机搜索算法。


6.根据权利要求2所述的方法,还包括,在测试所述高精度业务模型的性能分数,作为所述第一超参数组合的高精度分数之后,将当前的具有最高高精度分数的超参数组合确定为所述业务模型的超参数组合。


7.根据权利要求1所述的方法,其中,所述拟合模型为以下任一模型:随机森林模型、决策树模型、线性回归模型、逻辑回归模型。


8.一种确定业务模型超参数的装置,所述业务模型包括多个超参数,所述装置包括:
第一获取单元,配置为,获取多个超参数组合,每个所述超参数组合包括所述多个超参数各自的值;
选取单元,配置为,从预先准备的第一训练样本集中选取部分训练样本以构成第二训练样本集,其中,所述训练样本与网络平台中的以下任一对象相关:...

【专利技术属性】
技术研发人员:张雅淋
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1