当前位置: 首页 > 专利查询>SPSS公司专利>正文

构建时间序列模型的系统与方法技术方案

技术编号:2921093 阅读:189 留言:0更新日期:2012-04-11 18:40
提供一种方法和计算机系统用于为时间序列自动构造时间序列模型(图2)。该模型可以是一元或多元ARIMA模型,这取决于除该时间序列以外,系统中是否输入预测因子、干预或者事件。构造一元ARIMA模型的方法包含步骤:输入相应时间序列的丢失值;为正时间序列找出合适的变换;确定差分阶数;通过模式检测来确定非季节AR和MA阶数;构造初始模型;以及迭代地评估和修正模型。构造多元模型的方法包含步骤:找出该时间序列的一元ARIMA模型;将一元模型中找出的变换应用到包括将要预测的序列、预测因子在内的所有正时间序列;将一元模型中找出的差分阶数应用到包括将要预测的序列、预测因子、干预和事件在内的所有时间序列中;删除选定的预测因子并进一步差分其它预测因子;构造初始模型,其中它的干扰序列遵循具有一元模型中找到的AR和MA阶数的ARIMA模型;以及迭代地评估与修正该模型。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及为时间序列指定模型的方法和计算机系统。 专利技术的
技术介绍
人们迫切期望能够准确地建立模型并预测事件,特别是在当今的商业环境中。准确建模将会帮助人们预测未来事件,从而做出更好的决策以获得更好的成绩。因为与未来趋势相关的可靠信息是非常有价值的,所以许多组织花费了大量的人力与财力资源,试图预测未来趋势和分析这些趋势最终可能产生的结果。预测的一个基本目的在于降低风险和不确定性。商业决策依赖于预测。因此,预测在许多计划过程中是一个必不可少的工具。人们使用两类模型来创建预测模型,即指数平滑模型和自回归求和滑动平均(ARIMA)模型。指数平滑模型描述了随时间变化的一系列值的变化过程,而它没有试图去理解这些值如此变化的原因。在现有技术中,存在着几种不同的指数平滑模型。与之不同的是,ARIMA统计模型允许建模者详细说明时间序列中过去值在预测该时间序列将来值中所起的作用。ARIMA模型也允许建模者在模型中包含预测因子,这些可能有助于解释正在被预测的时间序列的变化过程。为了有效地预测某一趋势或时间序列中的将来值,必须创建描述该时间序列适合的模型。而创建能够最准确反映时间序列过去值的模型是预测过程中最困难的方面。更好预测的关键在于从过去数据得出更优模型。以前,为反映时间序列中数值而选择的模型要么相对简单、直接,要么基本上全部需要由建模者本人进行长时间而又乏味的数学分析才能得到结果。这样,这种模型要么相对简单而经常不能有效指示时间序列的未来值,要么花费大量人力与财力也许与较简单模型相比并没有更好的成功机会。最近,随着更好的电子计算机硬件的出现,大量预测建模方面都可以由计算机快速地完成。然而,以前的计算机软件预测解决方案受到了限制,因为用来评估历史数据的模型数量有限,且一般来说阶数较低,虽然潜在地存在无数个可用以比较时间序列的模型。由于找到用来拟合数据序列的最优模型要求进行某种迭代数据分析过程,所以建模进一步复杂化。为了保证有效性、精确性和可靠性,统计模型被设计、测试和评估。根据这些评估得出的结论,模型被不断地更新以反映评估过程的结果。过去,由于建模者自身的限制,以及基于计算机的软件解决方案缺乏灵活性,所以这种迭代程序非常繁琐、费力,效率通常也很低。模型建立过程通常包括由以下三个阶段构成的迭代循环(1)模型确定;(2)模型评估;(3)诊断检验。一般情况下,模型确定是建模过程中最困难的方面。这一阶段包括确定差分阶数、自回归(AR)阶数以及滑动平均(MA)阶数。通常在确定AR和MA阶数之前要确定差分阶数。一种广泛地用来确定差分的经验方法是使用一种自相关函数(ACF)曲线,采用这种方法时,如果ACF失效而衰减得很快,则表明需要差分。存在若干个确定是否需要差分的规范检验方法,例如,这些方法中最普遍使用的是Dickey-Fuller检验。然而,当需要多次和季节差分时,这些规范的测试方法均不是很有效。本专利技术使用的是基于Tiao和Tsay的一种回归方法(1983)。Dickey-Fuller检验是这种方法的一个特例。序列经适当差分后,下一步任务就是要找出AR和MA的阶数。在一元ARIMA模型识别中,有以下两类方法模式识别法和补偿函数法。在各种模式识别法中,广泛采用的是ACF模式和部分自相关函数(PACF)模式。PACF用于确定纯AR模型的AR阶数,而ACF用于确定纯MA模型的MA阶数。对于同时出现AR和MA分量的ARIMA模型,因为ACF和PACF中没有清除模式,所以ACF和PACF识别法是失效的。其它的模式识别方法包括R和S阵列法(Gary等人,1980)、隅角法(Begun等人,1980)、最小典型相关法(Tsay与Tiao,1985)以及广义自相关函数(EACF)法(Tsay与Tiao,1984)。提出这些方法用以同时确定ARIMA模型的AR和MA阶数。在模式确定方法中,最有效且最容易使用的方法是EACF。补偿函数法为评估类型的确定过程。它们用于选取使补偿函数P(i,j,k,l)值最小化的ARMA(p,q)(P,Q)模型的阶数,其中0≤i≤l,0≤j≤J,0≤k≤K,0≤l≤L。有多种补偿函数,如使用最广泛的AIC(Akaike信息准则)和BIC(Bayesian信息准则)。补偿函数法涉及拟合所有可能的(I+1)(J+1)(K+1)(L+1)个模型,计算每一个模型的补偿函数,以及选出补偿函数值最小的模型。选择的I,J,K和L的取值必须足够大以覆盖p,q,P和Q的真值。即使必需的I=J=3和K=L=2也会产生出144种可能的模型来拟合。这一过程可能非常耗时,而且I,J,K,L的值也有可能太低而无法覆盖真值模型阶数。虽然识别方法在运算上比补偿函数法快,但模式识别法不能很好地确定季节AR和MA阶数。本专利技术中的方法使用的是模式识别法,它通过使用ACF,PACF和EACF模式来确定非季节AR和MA阶数。季节AR和MA阶数被初始化为P=Q=1,而留到模型评估和诊断检验阶段再修正它们。因此,需要一种对具有单个用户的最少输入的数据序列精确拟合统计模型的系统和方法。进一步还需要一种更灵活与复杂的模型构造器,它使单个用户能够创建更优模型并能用于改善以前的模型。也需要一种对创建的模型进行敏感性分析的系统和方法。专利技术概要根据本专利技术一方面,提供一种基于一元和多元时间序列构造统计模型的计算机系统与方法。通过不断复杂的ARIMA统计建模技术,本专利技术的系统和方法允许根据过去值(一元建模)或观察的过去值的组合连同其它时间序列(多元建模)来建立模型和预测。在本申请中,Y(t)代表将要被预测的时间序列。一元ARIMA模型数学上可以表示为如下形式φ(B)Φ(Bs)(1-B)d(1-Bs)DY(t)=μ+θ(B)Θ(Bs)a(t)其中自回归(AR)多项式为非季节φ(B)=(1-1B-…-pBp),季节Ψ(Bs)=(1-Φ1Bs-···-ΦpBsp),]]>滑动平均(MA)多项式为非季节θ(B)=(1-θ1B-…-θqBq),季节Θ(BS)=(1-Θ1Bs-···-ΘQBsQ),]]>a(t)为一个白噪声序列,s为季节长度,且B为反向移动算子,其使得BY(t)=Y(t-1)。d与D为非季节和季节差分阶数,p和P为非季节和季节AR阶数,q和Q为非季节和季节MA阶数。该模型被表示为″ARIMA(p,d,q)(P,D,Q)″。按照ARIMA(p,d,q)(P,D,Q)模型,有时该模型为f(Y(t)),即对Y(t)的适当变换而不是Y(t)本身。在本专利技术中,变换函数f(.)可以是自然对数或是平方根。变换函数f(.)也称作″方差稳定″变换和差分″水平稳定″变换。如果Y(t)遵循ARIMA(p,d,q)(P,D,Q)模型,那么对Y(t)进行d次非季节差分和D次季节差分后,它就变成了一个平稳模型,表示为ARMA(p,q)(P,Q)。一些简短的符号表示法用于特定情况,例如,非季节本文档来自技高网...

【技术保护点】
一种利用计算机确定时间序列的一元ARIMA(自回归求和滑动平均)模型的方法,该方法包括:将包括分离数据值的该时间序列输入到所述计算机;将该时间序列的季节循环输入到该计算机;确定该时间序列是否有任何丢失数据值; 如果丢失任何数据值,则将这些丢失值的至少一个估算到该时间序列中;确定该时间序列的分离数据值以及任何估算数据值是否都是正数;如果这些数据值均为正,确定是否需要进行对数或平方根变换;如果需要变换,则对包括正的分离数据值和 任何正的估算值的时间序列进行变换;确定该时间序列的差分阶数;确定非季节AR(自回归)和MA(滑动平均)阶数;根据先前确定的差分阶数、AR和MA阶数构造一个初始ARIMA模型;以及根据迭代模型评估结果、诊断检验 以及残差的ACF/PACF(自相关函数/部分自相关函数),修改该初始ARIMA模型。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:方东平瑞S蔡
申请(专利权)人:SPSS公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利