SARIMA模型的训练方法、装置、设备及存储介质制造方法及图纸

技术编号:29939380 阅读:60 留言:0更新日期:2021-09-04 19:21
本发明专利技术提供一种SARIMA模型的训练方法、装置、设备及存储介质,其中,方案通过将初始数据集分为训练数据集和验证集,基于训练数据集建立SARIMA模型,且建立SARIMA模型时,通过超参d、D的网格搜索,并用AutoArima进行自动拟合,从而得到四种SARIMA模型,再用利用验证集验证SARIMA模型,从而选取最优SARIMA模型,最终将验证集并入训练数据集中,得到目标训练数据集,并通过目标训练数据集对最优SARIMA模型进行训练,更新最优SARIMA模型的系数,得到目标SARIMA模型;从而提高SARIMA模型的泛化预测精度,极大缩短了模型训练时间,且在一定程度上控制了过拟合。控制了过拟合。控制了过拟合。

【技术实现步骤摘要】
SARIMA模型的训练方法、装置、设备及存储介质


[0001]本专利技术涉及大数据
,尤其涉及一种SARIMA模型的训练方法、装置、设备及存储介质。

技术介绍

[0002]传统的SARIMA模型训练方法大部分是用全部时间步的数据进行训练,这种方式没有有效的校验,模型的泛化能力存在问题;还有一小部分训练方法是用交叉验证(cross validation)的方式,这种方式需要进行网格搜索(grid search),先确定超参,再进行K折交叉验证(K

Folds Cross Validation),网格搜索非常耗时,是通过枚举的方式尝试超参组合,由于过于耗时,尝试的组合往往是低阶的,(低阶的意思是比如三个超参p∈{0,1,2},q∈{0,1,2},d∈{0,1},只能尝试小数值);从而导致训练的模型误差较大。

技术实现思路

[0003]基于此,有必要针对上述技术问题,提供一种SARIMA模型的训练方法、装置、设备及存储介质。
[0004]一种SARIMA模型的训练方法,所述方法包括:获取初始数据集,并对所述初始数据集进行处理得到以单位时间为单元的训练数据集和验证集;根据所述训练数据集,建立SARIMA模型,所述SARIMA模型有系数及p、P、q、Q、d、D和m共7个超参;根据所述初始数据集,设定超参m,所述超参m代表预设时间周期中单元的数量;基于预设的所述超参d、D的逻辑关系,对所述超参d、D进行网格搜索,得到四种所述超参d、D的组合;在已知四种所述超参d、D的组合时,通过Auto Arima进行自动拟合,确定每组中超参p、P、q、Q的取值,得到四种SARIMA模型;通过所述四种SARIMA模型分别对所述验证集的单元进行预测,得到初始预测值;基于所述验证集,根据预设的评价指标,对所述初始预测值进行评价,选择评价误差最小的SARIMA模型为最优SARIMA模型;将所述验证集并入所述训练数据集中,得到目标训练数据集,并通过所述目标训练数据集通过所述验证集对所述最优SARIMA模型进行训练,更新所述最优SARIMA模型的系数,得到目标SARIMA模型。
[0005]在其中一个实施例中,所述超参p具体为:普通自回归项的项数;超参P具体为:季节性自回归项的项数;超参q具体为:普通移动平均项的项数;超参Q具体为:季节性移动平均项的项数;超参d具体为:普通差分阶数;超参D具体为:季节性差分阶数。
[0006]一种SARIMA模型的训练装置,包括数据处理模块、模型建立模块、超参设定模块、模型预测模块、误差分析模块和模型训练模块,其中:所述数据处理模块用于,获取初始数据集,并对所述初始数据集进行处理得到以单位时间为单元的训练数据集和验证集;所述模型建立模块用于,根据所述训练数据集,建立SARIMA模型,所述SARIMA模型有系数及p、P、q、Q、d、D和m共7个超参;所述超参设定模块用于,根据所述初始数据集,设定超参m,所述超参m代表预设时间周期中单元的数量;所述超参设定模块还用于,基于预设的所述超参d、D的逻辑关系,对所述超参d、D进行网格搜索,得到四种所述超参d、D的组合;所述超参设定模
块还用于,在已知四种所述超参d、D的组合时,通过Auto Arima进行自动拟合,确定每组中超参p、P、q、Q的取值,得到四种SARIMA模型;所述模型预测模块用于,通过所述四种SARIMA模型分别对所述验证集的单元进行预测,得到初始预测值;所述误差分析模块用于,基于所述验证集,根据预设的评价指标,对所述初始预测值进行评价,选择评价误差最小的SARIMA模型为最优SARIMA模型;所述模型训练模块用于,将所述验证集并入所述训练数据集中,得到目标训练数据集,并通过所述目标训练数据集对所述最优SARIMA模型进行训练,更新所述最优SARIMA模型的系数,得到目标SARIMA模型。
[0007]一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述各个实施例中所述的SARIMA模型的训练方法的步骤。
[0008]一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述各个实施例中所述的SARIMA模型的训练方法的步骤。
[0009]本专利技术的有益效果是:上述SARIMA模型的训练方法、装置、设备及存储介质,通过将初始数据集分为训练数据集和验证集,基于训练数据集建立SARIMA模型,且建立SARIMA模型时,通过超参d、D的网格搜索,并用Auto Arima进行自动拟合,从而得到四种SARIMA模型,再用利用验证集验证SARIMA模型,从而选取最优SARIMA模型,最终将验证集并入训练数据集中,得到目标训练数据集,并通过目标训练数据集对最优SARIMA模型进行训练,更新最优SARIMA模型的系数,得到目标SARIMA模型;从而提高SARIMA模型的泛化预测精度,极大缩短了模型训练时间,且在一定程度上控制了过拟合。
附图说明
[0010]图1为一个实施例中SARIMA模型的训练方法的流程示意图;
[0011]图2为一个实施例中SARIMA模型的训练装置的结构框图;
[0012]图3是一个实施例中设备的内部结构图。
具体实施方式
[0013]为了使本专利技术的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本专利技术做进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0014]在一个实施例中,如图1所示,提供了一种SARIMA模型的训练方法,包括以下步骤:
[0015]S110获取初始数据集,并对初始数据集进行处理得到以单位时间为单元的训练数据集和验证集。
[0016]具体地,获取基本的初始数据集,将初始数据集进行清洗处理,并进行行转列,从而得到训练数据集和验证集。
[0017]S120根据训练数据集,建立SARIMA模型,SARIMA模型有系数及p、P、q、Q、d、D和m共7个超参。
[0018]在一个实施例中,超参p具体为:普通自回归项的项数;超参P具体为:季节性自回归项的项数;超参q具体为:普通移动平均项的项数;超参Q具体为:季节性移动平均项的项数;超参d具体为:普通差分阶数;超参D具体为:季节性差分阶数。
[0019]S130根据初始数据集,设定超参m,超参m代表预设时间周期中单元的数量。
[0020]具体地,SARIMA模型,即季节性差分自回归滑动平均模型。标准的SARIMA算法含有7个超参,p是普通自回归项的项数(阶数),P是季节性自回归项的项数(阶数),q是普通移动平均项的项数(阶数),Q是季节性移动平均项的项数(阶数),d是普通差分阶数(做几次差分),D是季节性差分阶数(做几次季节性差分),超参m代表预设时间周期中单元的数量。
[0021]S140基于预设的超参d、D的逻辑关系,对超参d、D进行网格搜索,得到四种超参d、D的组合。
[0022]具体地,超参D与超本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种SARIMA模型的训练方法,其特征在于,包括:获取初始数据集,并对所述初始数据集进行处理得到以单位时间为单元的训练数据集和验证集;根据所述训练数据集,建立SARIMA模型,所述SARIMA模型有系数及p、P、q、Q、d、D和m共7个超参;根据所述初始数据集,设定超参m,所述超参m代表预设时间周期中单元的数量;基于预设的所述超参d、D的逻辑关系,对所述超参d、D进行网格搜索,得到四种所述超参d、D的组合;在已知四种所述超参d、D的组合时,通过Auto Arima进行自动拟合,确定每组中超参p、P、q、Q的取值,得到四种SARIMA模型;通过所述四种SARIMA模型分别对所述验证集的单元进行预测,得到初始预测值;基于所述验证集,根据预设的评价指标,对所述初始预测值进行评价,选择评价误差最小的SARIMA模型为最优SARIMA模型;将所述验证集并入所述训练数据集中,得到目标训练数据集,并通过所述目标训练数据集对所述最优SARIMA模型进行训练,更新所述最优SARIMA模型的系数,得到目标SARIMA模型。2.如权利要求1所述的方法,其特征在于,所述超参p具体为:普通自回归项的项数;超参P具体为:季节性自回归项的项数;超参q具体为:普通移动平均项的项数;超参Q具体为:季节性移动平均项的项数;超参d具体为:普通差分阶数;超参D具体为:季节性差分阶数。3.一种SARIMA模型的训练装置,其特征在于,包括数据处理模块、模型建立模块、超参设定模块、模型预测模块、误差分析模块和模型训练模块,其中:所述数据处理模块用于,获取...

【专利技术属性】
技术研发人员:张焯曾华桥唐明王振峰任奕林周莉
申请(专利权)人:永辉云金科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1