预测方法、训练方法、装置、服务器及介质制造方法及图纸

技术编号:24686772 阅读:44 留言:0更新日期:2020-06-27 08:53
本说明书实施例公开一种预测方法、训练方法、装置、服务器及介质,在所述预测方法中,基于预测模型中的多个预测子模型,得到待预测业务样本的多个业务预测结果,基于预测模型中的模型权重子模型,得到每个预测子模型对待预测业务样本进行预测时所占的权重,根据得到每个预测子模型的权重对每个业务预测结果进行加权,得到待预测业务样本的最终业务预测结果,本方案充分考虑到待预测业务样本本身的特点,使得每个预测子模型的模型权重更加可靠,进而提升了预测模型的预测准确度。

Prediction method, training method, device, server and medium

【技术实现步骤摘要】
预测方法、训练方法、装置、服务器及介质
本说明书实施例涉及计算机
,尤其涉及一种预测方法、训练方法、装置、服务器及介质。
技术介绍
随着互联网技术的不断发展,在互联网络的应用场景中,每天都会产生大量的数据,为了能够对这些数量庞大的数据进行分析,机器学习作为一种分析手段被广泛应用。集成学习,作为机器学习的一种,能够通过集成多个不同的子模型,来构建一个更好更全面的整体模型,以提升模型整体的泛化性能。
技术实现思路
本说明书实施例提供一种预测方法、训练方法、装置、服务器及介质。第一方面,本说明书实施例提供一种样本预测方法,包括:获取目标业务下的待预测业务样本;利用预测模型中的多个预测子模型对所述待预测业务样本进行预测,获得所述待预测业务样本在每个预测子模型中的业务预测结果;利用所述预测模型中的模型权重子模型对所述待预测业务样本进行处理,获得所述每个预测子模型对所述待预测业务样本进行预测时所占的权重;根据所述待预测业务样本在每个预测子模型中的业务预测结果,以及所述每个预测子模型对所述待预本文档来自技高网...

【技术保护点】
1.一种样本预测方法,所述方法包括:/n获取目标业务下的待预测业务样本;/n利用预测模型中的多个预测子模型对所述待预测业务样本进行预测,获得所述待预测业务样本在每个预测子模型中的业务预测结果;/n利用所述预测模型中的模型权重子模型对所述待预测业务样本进行处理,获得所述每个预测子模型对所述待预测业务样本进行预测时所占的权重;/n根据所述待预测业务样本在每个预测子模型中的业务预测结果,以及所述每个预测子模型对所述待预测业务样本进行预测时所占的权重,确定所述待预测业务样本的目标业务预测结果。/n

【技术特征摘要】
1.一种样本预测方法,所述方法包括:
获取目标业务下的待预测业务样本;
利用预测模型中的多个预测子模型对所述待预测业务样本进行预测,获得所述待预测业务样本在每个预测子模型中的业务预测结果;
利用所述预测模型中的模型权重子模型对所述待预测业务样本进行处理,获得所述每个预测子模型对所述待预测业务样本进行预测时所占的权重;
根据所述待预测业务样本在每个预测子模型中的业务预测结果,以及所述每个预测子模型对所述待预测业务样本进行预测时所占的权重,确定所述待预测业务样本的目标业务预测结果。


2.根据权利要求1所述的方法,所述模型权重子模型通过以下方式获得:
根据权重子模型训练样本集合以及所述多个预测子模型,对初始模型权重子模型进行训练,得到所述模型权重子模型。


3.根据权利要求2所述的方法,所述权重子模型训练样本集合中的每个样本均包含有所述目标业务中预设维度下的特征数据以及该样本是否为正样本的标签信息。


4.根据权利要求3所述的方法,所述根据权重子模型训练样本集合以及所述多个预测子模型,对初始模型权重子模型进行训练,得到所述模型权重子模型,包括:
针对所述权重子模型训练样本集合中的每个样本,将该样本的特征数据分别输入到所述每个预测子模型中进行预测,得到所述每个预测子模型对该样本的预测结果;
确定与所述初始模型权重子模型对应的初始模型参数,将所述初始模型参数作为当前模型参数,并执行模型参数调整步骤;
所述模型参数调整步骤包括:针对所述权重子模型训练样本集合中的每个样本,根据该样本的特征数据、所述每个预测子模型对该样本的预测结果、以及所述当前模型参数,得到该样本的当前预测结果;在所述当前预测结果与该样本的标签信息之间的误差不满足预设误差范围时,对所述当前模型参数进行调整;将调整后的模型参数作为所述当前模型参数,重复执行所述模型参数调整步骤;
其中,在所述当前预测结果与该样本的标签信息之间的误差满足所述预设误差范围时,将所述当前模型参数作为目标模型参数,以得到所述模型权重子模型。


5.根据权利要求4所述的方法,所述针对所述权重子模型训练样本集合中的每个样本,根据该样本的特征数据、所述每个预测子模型对该样本的预测结果、以及所述当前模型参数,得到该样本的当前预测结果,包括:
针对所述权重子模型训练样本集合中的每个样本,根据该样本的特征数据,以及所述当前模型参数,得到所述每个预测子模型针对该样本的当前模型权重,所述当前模型参数用于将样本的特征数据转换转化成各个预测子模型的模型权重;
根据所述每个预测子模型针对该样本的当前模型权重,对所述每个预测子模型针对该样本的预测结果进行加权处理,得到该样本的所述当前预测结果。


6.根据权利要求5所述的方法,所述当前模型参数为参数矩阵,所述参数矩阵的行数由所述多个预测子模型的个数确定,所述参数矩阵的列数由所述预设维度的维度数确定,所述针对所述权重子模型训练样本集合中的每个样本,根据该样本的特征数据,以及所述当前模型参数,得到所述每个预测子模型针对该样本的当前模型权重,包括:
针对所述权重子模型训练样本集合中的每个样本,将当前模型参数与该样本的特征数据相乘,得到目标向量,其中,所述目标向量中的每个元素用于表征对应的预测子模型在该样本的预测过程中所占的重要程度;
对所述目标向量中的每个元素进行平滑处理,得到所述每个预测子模型对该样本进行预测时的当前模型权重。


7.根据权利要求3所述的方法,所述利用所述预测模型中的模型权重子模型对所述待预测业务样本进行处理,获得所述每个预测子模型对所述待预测业务样本进行预测时所占的权重,包括:
基于所述模型权重子模型的目标模型参数,对所述待预测业务样本在所述预设维度下的特征数据处理,得到所述每个预测子模型对所述待预测业务样本进行预测时所占的权重,其中,所述目标模型参数用于将输入样本的特征数据转化成各个预测子模型的权重。


8.根据权利要求1所述的方法,所述多个预测子模型的类型包括以下模型中的一者或多者:神经网络模型、树模型以及逻辑回归模型。


9.一种预测模型训练方法,所述方法包括:
获取目标业务下的预测子模型训练样本集合以及权重子模型训练样本集合;
构建初始预测模型,所述初始预测模型包括多个初始预测子模型,以及初始模型权重子模型;
基于所述预测子模型训练样本集合,对每个初始预测子模型分别进行训练,得到多个预测子模型,并基于所述权重子模型训练样本集合以及所述多个预测子模型,对所述初始模型权重子模型进行训练,得到模型权重子模型,以完成预测模型的训练。


10.根据权利要求9所述的方法,所述预测子模型训练样本集合以及所述权重子模型训练样本集合中的每个样本均包含有预设维度下的特征数据以及该样本是否为正样本的标签信息。


11.根据权利要求10所述的方法,所述基于所述权重子模型训练样本集合,对所述初始模型权重子模型进行训练,得到模型权重子模型,包括:
针对所述权重子模型训练样本集合中的每个样本,将该样本的特征数据分别输入到每个预测子模型中进行预测,得到所述每个预测子模型对该样本的预测结果;
确定与所述初始模型权重子模型对应的初始模型参数,将所述初始模型参数作为当前模型参数,并执行模型参数调整步骤;
所述模型参数调整步骤包括:针对所述权重子模型训练样本集合中的每个样本,根据该样本的特征数据、所述每个预测子模型对该样本的预测结果、以及所述当前模型参数,得到该样本的当前预测结果;在所述当前预测结果与该样本的标签信息之间的误差不满足预设误差范围时,对所述当前模型参数进行调整;将调整后的模型参数作为所述当前模型参数,重复执行所述模型参数调整步骤;
其中,在所述当前预测结果与该样本的标签信息之间的误差满足所述预设误差范围时,将所述当前模型参数作为目标模型参数,以得到所述模型权重子模型。


12.根据权利要求11所述的方法,所述针对...

【专利技术属性】
技术研发人员:张雅淋
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1