【技术实现步骤摘要】
数据预测方法及装置和电子设备
本说明书实施例涉及计算机
,尤其涉及一种数据预测方法及装置和电子设备。
技术介绍
数据预测在实际应用中具有非常大的实用价值,特别是预测未来时间序列中的数据,例如可以预测金融市场股价走势,进而制定合理地投资策略实现最大化收益和最小化损失;预测公司流动资金量,进而实现公司资金有效管理等。一般的,对于时间序列的数据预测,传统地可以单独采用例如线性回归,或者单独采用GBDT(GradientBoostingDecisionTree,梯度提升决策树)回归。需要提供更为准确地的方案来进行数据预测。
技术实现思路
本说明书实施例提供的一种数据预测方法及装置和电子设备:根据本说明书实施例提供的一种数据预测方法,所述方法包括:获取时间序列的时间因子;将所述时间因子输入到梯度提升决策树模型;得到所述梯度提升决策树模型输入的第一预测数据;将所述第一预测数据输入到线性回归模型;得到所述线性回归模型输入的第二预测数据。根据本说明书实施例提供的一种数据预测装置,所述装置包括:获取单元,获取时间序列的时间因子;第一输入单元,将所述时间因子输入到梯度提升决策树模型 ...
【技术保护点】
一种数据预测方法,所述方法包括:获取时间序列的时间因子;将所述时间因子输入到梯度提升决策树模型;得到所述梯度提升决策树模型输入的第一预测数据;将所述第一预测数据输入到线性回归模型;得到所述线性回归模型输入的第二预测数据。
【技术特征摘要】
1.一种数据预测方法,所述方法包括:获取时间序列的时间因子;将所述时间因子输入到梯度提升决策树模型;得到所述梯度提升决策树模型输入的第一预测数据;将所述第一预测数据输入到线性回归模型;得到所述线性回归模型输入的第二预测数据。2.根据权利要求1所述的方法,所述梯度提升决策树模型通过如下方式训练得到:获取用于训练的样本集;所述样本集由若干时间因子、数据对构成;基于梯度提升决策树回归算法结合所述样本集训练得到梯度提升决策树模型;所述线性回归模型通过如下方式训练得到:将所述样本集输入所述梯度提升决策树模型;得到所述梯度提升决策树模型输入的回归样本集;基于线性回归算法结合所述回归样本集训练得到线性回归模型。3.根据权利要求2所述的方法,在所述基于梯度提升决策树回归算法结合所述样本集训练得到梯度提升决策树模型之前,所述方法还包括:消除所述样本集中数据的均值趋势和膨胀趋势。4.根据权利要求3所述的方法,所述样本集通过如下方式消除均值趋势:利用一元线性回归结合所述样本集拟合公式ymn=xmnwm+bm,计算每一年的斜率和截距;其中,xmn为样本集中第m年的第n天;ymn为样本集中第m年的第n天的数据;wm为第m年的斜率,bm为第m年的截距;根据所述斜率和截距,并基于公式Ymn=ymn-(bm-b1)-xmn*wm消除样本集中数据的均值趋势;其中,Ymn为消除均值趋势后第m年第n天的数据,ymn为消除均值趋势前第m年第n天的数据,bm为第m年的截距,b1为第1年的截距,xmn为第m年第n天,wm为第m年的斜率。5.根据权利要求4所述的方法,所述样本集通过如下方式消除膨胀趋势:在所述消除样本集中数据的均值趋势的情况下,根据公式计算每一年数据的算术平均值;其中,μm为第m年的算术平均值,Ymn为消除均值趋势后第m年第n天的数据;根据公式计算每一年数据的标准差;其中,Ymi为第m年第i天的数据,i=1,2,…,n,σm为第m年的标准差,μm为第m年的算术平均值;根据公式计算每一年的膨胀系数;其中,Pm为第m年的膨胀系数,σm为第m年的标准差,σ1为第1年的标准差;根据所述膨胀系数,基于公式Ymn'=μm+(Ymn-μm)*Pm消除样本集中数据的膨胀趋势;其中,Ymn′为消除膨胀趋势后第m年第n天的数据,μm为第m年的算术平均值,Ymn为消除膨胀趋势前第m年第n天的数据,Pm为第m年的膨胀系数。6.一种数据预测装置,所述装置包括:获取单元,获取时间序列的时间因子;第一输入单元,将所述时间因子输入到梯度提升决策树模型;第一预测单元,得到所述梯度提升决策树模型输入的第一预测数据;第二输入单元,将所述第一预测数据输入到线性回归模型;第二...
【专利技术属性】
技术研发人员:钱瑜,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。