当前位置: 首页 > 专利查询>SPSS公司专利>正文

构建时间序列模型的系统与方法技术方案

技术编号:3761292 阅读:179 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种数据处理方法和系统,用于在使用计算机预测未来趋势的任务中减少用户输入交互数量。该方法包括:将时间序列的分离数据值和季节循环长度输入到计算机中:将包括由数字数据值表示的预测因子、干预和事件的至少一种类型输入到计算机;以及确定时间序列的ARIMA阶数;除去具有至少一个丢失值的预测因子;根据时间序列的ARIMA阶数、干扰和事件、以及剩余的预测因子,构造时间序列的初始多元ARIMA模型;根据迭代模型评估结果、诊断检验以及残差的自相关函数/部分自相关函数,修改初始多元ARIMA模型;创建该时间序列的多元ARIMA模型,从而减少用户输入交互的数量;以及利用计算机创建的多元ARIMA模型来预测未来趋势。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及为时间序列指定模型的方法和计算机系统。
技术介绍
人们迫切期望能够准确地建立模型并预测事件,特别是在当今的 商业环境中。准确建模将会帮助人们预测未来事件,从而做出更好的 决策以获得更好的成绩。因为与未来趋势相关的可靠信息是非常有价 值的,所以许多组织花费了大量的人力与财力资源,试图预测未来趋 势和分析这些趋势最终可能产生的结果。预测的一个基本目的在于降 低风险和不确定性。商业决策依赖于预测。因此,预测在许多计划过 程中是一个必不可少的工具。人们使用两类模型来创建预测模型,即指数平滑模型和自回归求 和滑动平均(ARIMA)模型。指数平滑模型描述了随时间变化的一系 列值的变化过程,而它没有试图去理解这些值如此变化的原因。在现 有技术中,存在着几种不同的指数平滑模型。与之不同的是,ARIMA统 计模型允许建模者详细说明时间序列中过去值在预测该时间序列将 来值中所起的作用。ARIMA模型也允许建模者在模型中包含预测因 子,这些可能有助于解释正在被预测的时间序列的变化过程。为了有效地预测某一趋势或时间序列中的将来值,必须创建描述 该时间序列适合的模型。而创建能够最准确反映时间序列过去值的模 型是预测过程中最困难的方面。更好预测的关键在于从过去数据得出 更优模型。以前,为反映时间序列中数值而选择的模型要么相对简单、 直接,要么基本上全部需要由建模者本人进行长时间而又乏味的数学 分析才能得到结果。这样,这种模型要么相对简单而经常不能有效指 示时间序列的未来值,要么花费大量人力与财力也许与较简单模型相 比并没有更好的成功机会。最近,随着更好的电子计算机硬件的出现, 大量预测建模方面都可以由计算机快速地完成。然而,以前的计算机 软件预测解决方案受到了限制,因为用来评估历史数据的模型数量有 限,且一般来说阶数较低,虽然潜在地存在无数个可用以比较时间序 列的模型。由于找到用来拟合数据序列的最优模型要求进行某种迭代数据 分析过程,所以建模进一步复杂化。为了保证有效性、精确性和可靠 性,统计模型被设计、测试和评估。根据这些评估得出的结论,模型 被不断地更新以反映评估过程的结果。过去,由于建模者自身的限制, 以及基于计算机的软件解决方案缺乏灵活性,所以这种迭代程序非常 繁琐、费力,效率通常也很低。模型建立过程通常包括由以下三个阶段构成的迭代循环(1)模 型确定;(2)模型评估;(3)诊断检验。 一般情况下,模型确定是 建模过程中最困难的方面。这一阶段包括确定差分阶数、自回归(AR) 阶数以及滑动平均(MA)阶数。通常在确定AR和MA阶数之前要确 定差分阶数。 一种广泛地用来确定差分的经验方法是使用一种自相关 函数(ACF)曲线,采用这种方法时,如果ACF失效而衰减得很快, 则表明需要差分。存在若干个确定是否需要差分的规范检验方法,例 如,这些方法中最普遍使用的是Dickey-Fuller检验。然而,当需 要多次和季节差分时,这些规范的测试方法均不是很有效。本专利技术使7用的是基于Tiao和Tsay的一种回归方法(1983) 。 Dickey-Fuller 检验是这种方法的一个特例。序列经适当差分后,下一步任务就是要找出AR和MA的阶数。 在一元ARIMA模型识别中,有以下两类方法模式识别法和补偿函 数法。在各种模式识别法中,广泛采用的是ACF模式和部分自相关 函数(PACF)模式。PACF用于确定纯AR模型的AR阶数,而ACF用 于确定纯MA模型的MA阶数。对于同时出现AR和MA分量的ARIMA 模型,因为ACF和PACF中没有清除模式,所以ACF和PACF识别 法是失效的。其它的模式识别方法包括R和S阵列法(Gary等 人,1980)、隅角法(Begun等人,1980)、最小典型相关法(Tsay与 Tiao, 1985)以及广义自相关函数(EACF)法(Tsay与Tiao, 1984)。提出这些方法用以同时确定ARIMA模型的AR和MA阶数。 在模式确定方法中,最有效且最容易使用的方法是EACF。补偿函数法为评估类型的确定过程。它们用于选取使补偿函数P (i, j, k,l)值最小化的ARMA (p, q) (P, Q)模型的阶数,其中0 《i《l,0《j《丄0《k《K, 0《1《L。有多种补偿 函数,如使用最广泛的AIC (Akaike信息准贝lj)和BIC (Bayesian信 息准则)。补偿函数法涉及拟合所有可能的(1+1) (J+l) (K+l) (L+l) 个模型,计算每一个模型的补偿函数,以及选出补偿函数值最小的模 型。选择的I, J, K禾n L的取值必须足够大以覆盖p, q, P和Q的 真值。即使必需的I=J=3禾B K=L=2也会产生出144种可能的模型 来拟合。这一过程可能非常耗时,而且I, J, K, L的值也有可能太 低而无法覆盖真值模型阶数。虽然识别方法在运算上比补偿函数法快,但模式识别法不能很好 地确定季节AR和MA阶数。本专利技术中的方法使用的是模式识别法, 它通过使用ACF, PACF禾n EACF模式来确定非季节AR和MA阶数。季节AR和MA阶数被初始化为P=Q=1,而留到模型评估和诊断检验阶段再修正它们。因此,需要一种对具有单个用户的最少输入的数据序列精确拟合 统计模型的系统和方法。进一步还需要一种更灵活与复杂的模型构造 器,它使单个用户能够创建更优模型并能用于改善以前的模型。也需 要一种对创建的模型进行敏感性分析的系统和方法。
技术实现思路
根据本专利技术一方面,提供一种基于一元和多元时间序列构造统计 模型的计算机系统与方法。通过不断复杂的ARIMA统计建模技术,本专利技术的系统和方法允 许根据过去值(一元建模)或观察的过去值的组合连同其它时间序列 (多元建模)来建立模型和预测。在本申请中,Y (t)代表将要被预测的时间序列。 一元ARIMA模型数学上可以表示为如下形式 0(5)①(F )(l — (1 —万5 f FW = A + 6>08) (F )a0)其中自回归(AR)多项式为非季节 0(5) = (1 — ^,5-----<^50,季节 = —(D,W-----①pW),滑动平均(MA)多项式为一一季节 6 (5) = (1 —《5——《59),季节 0(丑s卜(l-0i^——为一个白噪声序列, S为季节长度,且万为反向移动算子,其使得BY(t) = Y (t-l)。d与D为非季节和季节差分阶数,p和P为非季节和季节AR阶 数,q和Q为非季节和季节MA阶数。该模型被表示为〃ARIMA (p, d, q) (P, D, Q)〃。按照ARIMA (p, d, q) (P, D, Q)模型,有时该模型为f (Y (t)),即对Y (t)的 适当变换而不是Y (t)本身。在本专利技术中,变换函数f (.)可以是 自然对数或是平方根。变换函数f (.)也称作"方差稳定"变换和 差分 〃水平稳定〃 变换。如果Y (t)遵循ARIMA (p, d, q) (P, D, Q)模型,那么对Y(t)进行d次非季节差分和D次季节差分后, 它就变成了一个平稳模型,表示为ARMA (p, q) (P, Q)。 一些简短 的符号表示法用于特定情况,例如,非季节模型记作ARI本文档来自技高网
...

【技术保护点】
一种数据处理方法,用于在使用计算机预测未来趋势的任务中减少用户输入交互数量,该方法包括: 将时间序列的分离数据值和季节循环长度输入到所述计算机中: 将包括由数字数据值表示的若干个预测因子、若干个干预和若干个事件的至少一种类型输入 到该计算机; 指示该计算机执行以下步骤: a)确定该时间序列的ARIMA阶数; b)除去具有至少一个丢失值的预测因子; c)如果在步骤a)中的该时间序列被变换并且所剩余的预测因子仅包括正的数据值,则采用应用于步骤a) 中的该时间序列的相同变换,对预测因子进行变换; d)如果在步骤a)中的该时间序列被差分,则采用应用于步骤a)中的该时间序列的相同差分阶数,对所述的预测因子、干预和事件差分; e)根据该时间序列的ARIMA阶数、干扰和事件、以及剩 余的预测因子,构造该时间序列的初始多元ARIMA模型;以及 f)根据迭代模型评估结果、诊断检验以及残差的自相关函数/部分自相关函数,修改该初始多元ARIMA模型; 通过计算机执行所述指示的步骤,创建该时间序列的多元ARIMA模型 ,从而减少用户输入交互的数量;以及 利用该计算机创建的多元ARIMA模型来预测未来趋势。...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:方东平瑞S蔡
申请(专利权)人:SPSS公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利