SARIMA模型的训练方法、装置、设备及存储介质制造方法及图纸

技术编号：29939380 阅读：60 留言：0更新日期：2021-09-04 19:21

本发明专利技术提供一种SARIMA模型的训练方法、装置、设备及存储介质，其中，方案通过将初始数据集分为训练数据集和验证集，基于训练数据集建立SARIMA模型，且建立SARIMA模型时，通过超参d、D的网格搜索，并用AutoArima进行自动拟合，从而得到四种SARIMA模型，再用利用验证集验证SARIMA模型，从而选取最优SARIMA模型，最终将验证集并入训练数据集中，得到目标训练数据集，并通过目标训练数据集对最优SARIMA模型进行训练，更新最优SARIMA模型的系数，得到目标SARIMA模型；从而提高SARIMA模型的泛化预测精度，极大缩短了模型训练时间，且在一定程度上控制了过拟合。控制了过拟合。控制了过拟合。

全部详细技术资料下载

【技术实现步骤摘要】
SARIMA模型的训练方法、装置、设备及存储介质

[0001]本专利技术涉及大数据
，尤其涉及一种SARIMA模型的训练方法、装置、设备及存储介质。

技术介绍

[0002]传统的SARIMA模型训练方法大部分是用全部时间步的数据进行训练，这种方式没有有效的校验，模型的泛化能力存在问题；还有一小部分训练方法是用交叉验证(cross validation)的方式，这种方式需要进行网格搜索(grid search)，先确定超参，再进行K折交叉验证(K
‑
Folds Cross Validation)，网格搜索非常耗时，是通过枚举的方式尝试超参组合，由于过于耗时，尝试的组合往往是低阶的，(低阶的意思是比如三个超参p∈{0,1,2},q∈{0,1,2},d∈{0,1}，只能尝试小数值)；从而导致训练的模型误差较大。

技术实现思路

[0003]基于此，有必要针对上述技术问题，提供一种SARIMA模型的训练方法、装置、设备及存储介质。
[0004]一种SARIMA模型的训练方法，所述方法包括：获取初始数据集，并对所述初始数据集进行处理得到以单位时间为单元的训练数据集和验证集；根据所述训练数据集，建立SARIMA模型，所述SARIMA模型有系数及p、P、q、Q、d、D和m共7个超参；根据所述初始数据集，设定超参m，所述超参m代表预设时间周期中单元的数量；基于预设的所述超参d、D的逻辑关系，对所述超参d、D进行网格搜索，得到四种所述超参d、D的组合；在已知四种所述超参d、D的组合时，通过...

【技术保护点】

【技术特征摘要】
1.一种SARIMA模型的训练方法，其特征在于，包括：获取初始数据集，并对所述初始数据集进行处理得到以单位时间为单元的训练数据集和验证集；根据所述训练数据集，建立SARIMA模型，所述SARIMA模型有系数及p、P、q、Q、d、D和m共7个超参；根据所述初始数据集，设定超参m，所述超参m代表预设时间周期中单元的数量；基于预设的所述超参d、D的逻辑关系，对所述超参d、D进行网格搜索，得到四种所述超参d、D的组合；在已知四种所述超参d、D的组合时，通过Auto Arima进行自动拟合，确定每组中超参p、P、q、Q的取值，得到四种SARIMA模型；通过所述四种SARIMA模型分别对所述验证集的单元进行预测，得到初始预测值；基于所述验证集，根据预设的评价指标，对所述初始预测值进行评价，选择评价误差最小的SARIMA模型为最优SARIMA模型；将所述验证集并入所述训练数据集中，得到目标训练数据集，并通过所述目标训练数据集对所述最优SARIMA模型进行训练，更新所述最优SARIMA模型的系数，得到目标SARIMA模型。2.如权利要求1所述的方法，其特征在于，所述超参p具体为：普通自回归项的项数；超参P具体为：季节性自回归项的项数；超参q具体为：普通移动平均项的项数；超参Q具体为：季节性移动平均项的项数；超参d具体为：普通差分阶数；超参D具体为：季节性差分阶数。3.一种SARIMA模型的训练装置，其特征在于，包括数据处理模块、模型建立模块、超参设定模块、模型预测模块、误差分析模块和模型训练模块，其中：所述数据处理模块用于，获取...

【专利技术属性】
技术研发人员：张焯，曾华桥，唐明，王振峰，任奕林，周莉，
申请(专利权)人：永辉云金科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人