模型训练方法技术

技术编号:39720940 阅读:5 留言:0更新日期:2023-12-17 23:27
本申请实施例提供了一种模型训练方法

【技术实现步骤摘要】
模型训练方法、指标预测方法、装置、设备及存储介质


[0001]本申请实施例涉及人工智能
(Artificial Intelligence

AI)

,尤其涉及一种模型训练方法

指标预测方法

装置

设备及存储介质


技术介绍

[0002]时间序列预测就是利用历史时间上的指标来预测未来时间的指标,例如,利用某金融产品在前
10
天中每天的销量来预测该金融产品在第
11
天的销量

[0003]时间序列预测主要依赖于预测模型

在相关技术中,针对每个对象训练一个模型

然而,一方面由于对象数量庞大,导致需要训练的模型数量较多,从而导致训练成本较高;另一方面对于每个对象对应的模型,该对象的历史数据有限,导致用于训练该模型的训练样本有限,从而可能导致过拟合的问题


技术实现思路

[0004]本申请实施例提供了一种模型训练方法

指标预测方法

装置

设备及存储介质,一方面可以降低需要训练的模型数量,从而可以降低训练成本;另一方面可以降低过拟合的问题

[0005]第一方面,本申请实施例提供一种模型训练方法,该方法包括:获取多个对象各自的历史时间序列;其中,针对每个对象,对象的历史时间序列由对象在不同历史时间上的指标按照时间先后顺序构成;分别对多个对象各自的历史时间序列进行特征提取,得到多个对象各自的时间序列特征;基于多个对象各自的时间序列特征,对多个对象进行分类;并分别对每类对象中各个对象的历史时间序列按照固定时间窗口进行至少一次采样,且生成每个采样数据对应的训练样本;基于每类对象对应的训练样本,训练每类对象对应的预测模型;其中,预测模型用于预测对应类别对象在未来时间的指标

[0006]第二方面,本申请实施例提供一种指标预测方法,包括:获取目标对象的历史时间序列;其中,目标对象的历史时间序列由目标对象在不同历史时间上的指标按照时间先后顺序构成;对目标对象的历史时间序列按照固定时间窗口进行一次采样,得到目标采样数据;确定目标对象对应的目标预测模型;其中,目标预测模型是通过如第一方面所述的模型训练方法训练得到的;基于目标采样数据和目标预测模型,预测目标对象在未来时间的指标

[0007]第三方面,本申请实施例提供一种模型训练方法,该方法包括:获取多个对象各自的历史时间序列;其中,针对每个对象,对象的历史时间序列由对象在不同历史时间上的指标按照时间先后顺序构成;分别对多个对象各自的历史时间序列进行特征提取,得到多个对象各自的时间序列特征;分别对多个对象的历史时间序列按照固定时间窗口进行至少一次采样,且针对每个采样数据,基于采样数据和采样数据对应的对象的时间序列特征,生成训练样本;基于多个对象各自对应的训练样本,训练预测模型;其中,预测模型用于预测多个对象各自在未来时间的指标

[0008]第四方面,本申请实施例提供一种指标预测方法,包括:获取目标对象的历史时间序列;其中,目标对象的历史时间序列由目标对象在不同历史时间上的指标按照时间先后顺序构成;对目标对象的历史时间序列进行特征提取,得到目标对象的时间序列特征;对目标对象的历史时间序列按照固定时间窗口进行一次采样,得到目标采样数据;基于目标对象的时间序列特征和目标采样数据以及如第三方面所述的模型训练方法训练得到的预测模型,预测目标对象在未来时间的指标

[0009]第五方面,本申请实施例提供一种模型训练装置,该装置包括:获取模块

特征提取模块

分类模块

采样模块和训练模块;其中,获取模块用于获取多个对象各自的历史时间序列;其中,针对每个对象,对象的历史时间序列由对象在不同历史时间上的指标按照时间先后顺序构成;特征提取模块用于分别对多个对象各自的历史时间序列进行特征提取,得到多个对象各自的时间序列特征;分类模块用于基于多个对象各自的时间序列特征,对多个对象进行分类;采样模块用于分别对每类对象中各个对象的历史时间序列按照固定时间窗口进行至少一次采样,且生成每个采样数据对应的训练样本;训练模块用于基于每类对象对应的训练样本,训练每类对象对应的预测模型;其中,预测模型用于预测对应类别对象在未来时间的指标

[0010]第六方面,本申请实施例提供一种指标预测装置,包括:获取模块

采样模块

确定模块和预测模块

其中,获取模块用于获取目标对象的历史时间序列;其中,目标对象的历史时间序列由目标对象在不同历史时间上的指标按照时间先后顺序构成;采样模块用于对目标对象的历史时间序列按照固定时间窗口进行一次采样,得到目标采样数据;确定模块用于确定目标对象对应的目标预测模型;其中,目标预测模型是通过如第一方面所述的模型训练方法训练得到的;预测模块用于基于目标采样数据和目标预测模型,预测目标对象在未来时间的指标

[0011]第七方面,本申请实施例提供一种模型训练装置,包括:获取模块

特征提取模块

采样模块和训练模块

其中,获取模块用于获取多个对象各自的历史时间序列;其中,针对每个对象,对象的历史时间序列由对象在不同历史时间上的指标按照时间先后顺序构成;特征提取模块用于分别对多个对象各自的历史时间序列进行特征提取,得到多个对象各自的时间序列特征;采样模块用于分别对多个对象的历史时间序列按照固定时间窗口进行至少一次采样,且针对每个采样数据,基于采样数据和采样数据对应的对象的时间序列特征,生成训练样本;训练模块用于基于多个对象各自对应的训练样本,训练预测模型;其中,预测模型用于预测多个对象各自在未来时间的指标

[0012]第八方面,本申请实施例提供一种指标预测装置,包括:获取模块

特征提取模块

采样模块和训练模块

其中,获取模块用于获取目标对象的历史时间序列;其中,目标对象的历史时间序列由目标对象在不同历史时间上的指标按照时间先后顺序构成;特征提取模块用于对目标对象的历史时间序列进行特征提取,得到目标对象的时间序列特征;采样模块用于对目标对象的历史时间序列按照固定时间窗口进行一次采样,得到目标采样数据;训练模块用于基于目标对象的时间序列特征和目标采样数据以及如第三方面所述的模型训练方法训练得到的预测模型,预测目标对象在未来时间的指标

[0013]第九方面,提供一种电子设备,包括:处理器和存储器,该存储器用于存储计算机程序,该处理器用于调用并运行该存储器中存储的计算机程序,执行如第一方面至第四方
面中任一方面或其各实现方式中的方法

[0014]第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种模型训练方法,其特征在于,包括:获取多个对象各自的历史时间序列;其中,针对每个对象,所述对象的历史时间序列由所述对象在不同历史时间上的指标按照时间先后顺序构成;分别对所述多个对象各自的历史时间序列进行特征提取,得到所述多个对象各自的时间序列特征;基于所述多个对象各自的时间序列特征,对所述多个对象进行分类;并分别对每类对象中各个对象的历史时间序列按照固定时间窗口进行至少一次采样,且生成每个采样数据对应的训练样本;基于所述每类对象对应的训练样本,训练所述每类对象对应的预测模型;其中,所述预测模型用于预测对应类别对象在未来时间的指标
。2.
根据权利要求1所述的方法,其特征在于,所述基于所述多个对象各自的时间序列特征,对所述多个对象进行分类,包括:对所述多个对象各自的时间序列特征进行特征降维,得到所述多个对象各自的降维后特征;基于所述多个对象各自的降维后特征,对所述多个对象进行分类
。3.
根据权利要求2所述的方法,其特征在于,所述基于所述多个对象各自的降维后特征,对所述多个对象进行分类,包括:对所述多个对象各自的降维后特征采用聚类算法,以对所述多个对象进行分类
。4.
根据权利要求1‑3中任一项所述的方法,其特征在于,所述生成每个采样数据对应的训练样本之前,还包括执行以下至少一项:针对每个采样数据,获取所述采样数据对应的对象的类别信息;针对每个采样数据,获取所述采样数据在不同时间窗口下的指标特征;针对每个采样数据,获取所述采样数据包括的各个历史指标的产生时间;所述生成每个采样数据对应的训练样本,包括:针对每个采样数据,基于所述采样数据以及所述采样数据对应的目标信息,生成所述采样数据对应的训练样本;其中,所述采样数据对应的目标信息包括以下至少一项:所述采样数据对应的对象的类别信息

所述采样数据在不同时间窗口下的指标特征

所述采样数据包括的各个历史指标的产生时间
。5.
根据权利要求4所述的方法,其特征在于,所述针对每个采样数据,获取所述采样数据对应的对象的类别信息,包括:针对每个采样数据,获取所述采样数据对应的对象与所述采样数据对应的对象所属簇的中心点之间的距离;将所述采样数据对应的对象与所述采样数据对应的对象所属簇的中心点之间的距离作为所述采样数据对应的对象的类别信息
。6.
根据权利要求4所述的方法,其特征在于,所述针对每个采样数据,获取所述采样数据在不同时间窗口下的指标特征,包括:针对每个采样数据,获取所述采样数据在不同时间窗口下的指标;将所述采样数据在的不同时间窗口下的指标作为所述采样数据在不同时间窗口下的
指标特征
。7.
根据权利要求4所述的方法,其特征在于,所述针对每个采样数据,获取所述采样数据在不同时间窗口下的指标特征,包括:针对每个采样数据,获取所述采样数据在不同时间窗口下的指标的平均值;将所述采样数据在不同时间窗口下的指标的平均值作为所述采样数据在不同时间窗口下的指标特征
。8.
根据权利要求4所述的方法,其特征在于,所述针对每个采样数据,基于所述采样数据以及所述采样数据对应的目标信息,生成所述采样数据对应的训练样本,包括:针对每个采样数据,对所述采样数据和所述采样数据对应的目标信息进行组合,得到所述采样数据对应的训练样本
。9.
一种指标预测方法,其特征在于,包括:获取目标对象的历史时间序列;其中,所述目标对象的历史时间序列由所述目标对象在不同历史时间上的指标按照时间先后顺序构成;对所述目标对象的历史时间序列按照固定时间窗口进行一次采样,得到目标采样数据;确定所述目标对象对应的目标预测模型;其中,所述目标预测模型是通过如权利要求1‑8中任一项所述的模型训练方法训练得到的;基于所述目标采样数据和所述目标预测模型,预测所述目标对象在未来时间的指标
。10.
根据权利要求9所述的方法,其特征在于,所述基于所述目标采样数据和所述目标预测模型,预测所述目标对象在未来时间的指标之前,还包括执行以下至少一项:获取所述目标对象的类别信息;获取所述目标采样数据在不同时间窗口下的指标特征;获取所述目标采样数据包括的各个历史指标的产生时间;所述基于所述目标采样数据和所述目标预测模型,预测所述目标对象在未来时间的指标,包括:基于所述目标采样数据

所述目标采样数据对应的目标信息和所述目标预测模型,预测所述目标对象在未来时间的指标;其中,所述目标采样数据对应的目标信息包括以下至少一项:所述目标对象的类别信息

所述目标采样数据在不同时间窗口下的指标特征

所述目标采样数据包括的各个历史指标的产生时间
。11.
...

【专利技术属性】
技术研发人员:沈雷程嘉欢张睿欣丁守鸿
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1