【技术实现步骤摘要】
基于线性回归和决策树结合的油价预测方法、装置及设备
[0001]本申请涉及数据处理
,尤其涉及一种基于线性回归和决策树结合的油价预测方法、装置及设备。
技术介绍
[0002]目前已经在运用的预测调价油价的方法,是通过单一的时间维度的价格调整数据,其预测的本质基本都是围绕单一维度数:调价价格。这一时序数据本身的周期性,趋势性等特性来进行预测。
[0003]这种传统方式是有很大局限性的。首先决定调整价格结果的因素有很多,仅仅使用单一维度的时序数据,数据利用率很低,并且训练算法模型很难保证准确率。其次时序算法是将过去的趋势延伸到来来,因此这种方法无法预测时间序列的转折点。在这种情况下,预测人员往往需要依靠自己的知识和经验对预测结果进行修正,带来很大的不便。
技术实现思路
[0004]有鉴于此,本申请的目的在于提出一种基于线性回归和决策树结合的油价预测方法、装置及设备以解决或部分解决上述技术问题。
[0005]基于上述目的,本申请的第一方面提供了一种基于线性回归和决策树结合的油价预测方法,包括:获取预定时间段内的油价历史数据;根据所述油价历史数据确定线性回归训练样本;将所述线性回归训练样本输入至预先构建的初始线性回归模型中进行训练分析;根据初始线性回归模型训练分析的训练结果,与油价历史数据中对应的实际油价结果进行对比分析,进而根据对比分析结果对所述初始线性回归模型的特征参数进行校正调整,将最终校正调整后的初始线性回归模型作为线性回归模型;利用油价历史数据进行训练过程中产生油价历史回测数据 ...
【技术保护点】
【技术特征摘要】
1.一种基于线性回归和决策树结合的油价预测方法,其特征在于,包括:获取预定时间段内的油价历史数据;根据所述油价历史数据确定线性回归训练样本;将所述线性回归训练样本输入至预先构建的初始线性回归模型中进行训练分析;根据初始线性回归模型训练分析的训练结果,与油价历史数据中对应的实际油价结果进行对比分析,进而根据对比分析结果对所述初始线性回归模型的特征参数进行校正调整,将最终校正调整后的初始线性回归模型作为线性回归模型;利用油价历史数据进行训练过程中产生油价历史回测数据,记录初始线性回归模型训练过程中训练结果与实际邮件结果的残差,得到历史回测数据对应的残差数据;根据所述历史回测数据对应的残差数据构建决策树模型;获取待预测油价数据,将所述待预测油价数据输入至所述线性回归模型进行预测处理,得到第一预测油价值;利用所述决策树模型确定与所述待预测油价数据对应的残差预测值;将所述第一预测油价值与所述残差预测值进行差值运算得到最终的预测油价值。2.根据权利要求1所述的方法,其特征在于,所述根据所述油价历史数据确定线性回归训练样本,包括:确定所述油价历史数据的类别;利用相关系数计算公式对各类别的油价历史数据进行计算,计算各类别的油价历史数据与油价之间的相关系数;根据计算的相关系数进行热力图绘制;根据所述热力图从各类别的油价历史数据中,确定相关系数大于预定值的至少一个目标类别的油价历史数据作为线性回归训练样本。3.根据权利要求1所述的方法,其特征在于,所述根据所述油价历史数据确定线性回归训练样本,包括:在所述油价历史数据中提取原油价格数据并按照时间周期进行划分;根据所述油价历史数据计算均值数据、斜率数据、中位数数据和拟合中值数据;将均值数据、斜率数据、中位数数据或拟合中值数据,加上所述原油价格数据作为预训练输入数据,其中,均值数据、斜率数据、中位数数据或拟合中值数据均分别对应一组预训练输入数据;将所述预训练输入数据输入至初始线性回归模型进行预训练,得到预训练结果,其中,每组预训练输入数据均对应一组预训练结果;将每组预训练结果与实际油价结果进行比对,确定所述均值数据对应的一组预训练结果与实际油价结果差值最小,则将所述均值数据与所述原油价格数据组合作为初始线性回归模型的线性回归训练样本进行输入训练分析。4.根据权利要求1所述的方法,其特征在于,根据所述油价历史数据确定线性回归训练样本,包括:将所述油价历史数据按照时间周期进行划分,划分N组油价历史数据;根据所述油价历史数据计算均值数据、斜率数据、中位数数据和拟合中值数据;将均值数据、斜率数据、中位数数据或拟合中值数据分别与N组油价历史数据进行组
合,得到多种特征训练数据;利用所述多种特征训练数据对初始线性回归模型进行回测处理,得到与每种特征训练数据对应的回测处理结果;将每种特征训练数据对应的回测处理结果与实际油价结果进行差值比对,将多种特征训练数据对应的多种回测处理结果,按照差值由小到大的顺序进行排列;选取排列顺序靠前的预定数量种类的特征训练数据作为线性回归训练样本。5.根据权利要求1所述的方法,其特征在于,所述根据所述历史回测数据对应的残差数据构建决策树模型,包括:将所述历史回测数据对应的残差数据确定对应的特征值,作为决策训练样本输入决策训练算法,进行决策训练处理得到决策训练处理结果;根据决策训练处理结果确定各个特征值的重要性程度;按照重要性程度将特...
【专利技术属性】
技术研发人员:冀征,
申请(专利权)人:北京易油互联科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。