当前位置: 首页 > 专利查询>天津大学专利>正文

基于张量时域相关性分解模型的时间序列分析方法技术

技术编号:14903773 阅读:49 留言:0更新日期:2017-03-29 19:01
一种基于张量时域相关性分解模型的时间序列分析方法,包括:将时间序列编码为张量;将最初的张量变换为一个维度减少的形式;对获得的维度减少形式的张量应用自回归模型去保持时域上的连续性;动态学习上述过程更新结果直到算法收敛,结果达到最优。本发明专利技术的基于张量时域相关性分解模型的时间序列分析方法,通过在张量分解的框架中引入时域相关性模型可以各项异性的对时间序列的空域维度以及时域维度同时进行处理,在去除时间序列空域中的噪声和冗余信息的同时,控制了时间序列时域信息之间的内在联系,保持了时间序列在时域上的连续性。本发明专利技术提升了对时间序列进行预测的准确性,尤其是针对高维度的时间序列预测问题。

【技术实现步骤摘要】

本专利技术涉及一种时间序列分析方法。特别是涉及一种将张量分解技术与时域相关性模型相结合对时间序列进行预测的基于张量时域相关性分解模型的时间序列分析方法。
技术介绍
可接触的数据近些年在数量、速度以及种类方面正在以指数级的方式增长,这种增长的趋势在科学界正面临着各种各样的挑战,在可接触的数据当中一种重要的数据表现形式就是时间序列。时间序列就是在一段时间内由一组连续的测量值组成的一系列数据点。在过去的十年时间中,挖掘时间序列已经成为一个非常有前景的研究领域。对时间序列的分析任务主要包括以下几种:预测、监测、反馈控制、异常检测、聚类、分类以及分割;涵盖了环境学、生态学、生物学、生物医学、气象学、计算机视觉、经济学等诸多领域。建模和预测时间序列数据已经成为当前时间序列分析的一个主流方向。时间序列预测就是依据以前的观察值去预测一个系统的演变行为。在对时间序列进行分析中主要面临着三种挑战:语境制约、时域平滑性和数据高维度。语境制约是指许多真实的时间序列数据受到语境信息的影响,尤其是针对感官网络时间序列的分析。时域平滑性指的是沿着时间维度相邻观察值之间的相关性。数据高维度主要是指时间序列数据是由高维的数组组成的。时间序列数据的数学结构形式不仅仅局限于向量和矩阵的形式,而且也包括多维度的数据形式例如张量。张量是高阶向量和矩阵的一种概括形式,对向量和矩阵提供了一种非常有用的表现形式,例如可以用四阶的张量时间序列去对气象学上的时空网格海洋数据进行建模,张量的四个维度分别表示纬度、经度、高度和时间。当前已经提出了大量的技术去分析时间序列,主要可以分为含参数的方法和无参数的方法两大类。含参数的方法假设依赖于充足的先验知识潜在的时间序列模型可以用一个含有未知参数的参数模型去描述。相比之下,无参数的方法通过在没有任何特定结构下估计谱线密度、条件均值、高阶条件矩和条件密度去减少参数估计的过程。然而,最普遍的将张量时间序列数据迁移成向量或者矩阵的方法不仅容易造成维数灾难,而且也会破坏数据结构造成相邻数据间关系信息的遗失。在近些年随着张量分解技术的完善和日趋成熟,已经提出了许多基于张量分解技术去分析张量时间序列的方法。这些方法可以保存时间序列的高维数据结构信息不造成信息的丢失,也可以解决语境制约的问题。同时由于自回归模型在处理大范围的时间序列结构数据时展现了强有力的优越性和灵活性。
技术实现思路
本专利技术所要解决的技术问题是,提供一种能够保持时间序列在时域上的连续性的基于张量时域相关性分解模型的时间序列分析方法。本专利技术所采用的技术方案是:一种基于张量时域相关性分解模型的时间序列分析方法,包括如下步骤:1)将时间序列编码为张量;2)将最初的张量变换为一个维度减少的形式;3)对获得的维度减少形式的张量应用自回归模型去保持时域上的连续性;4)动态学习步骤2)~3)更新结果直到算法收敛,结果达到最优。步骤1)包括:将N+1维的时间序列X,表示为一个N+1阶的张量形式其中I1,I2,…,IN表示时间序列中除时间维度外的其他维度,T表示时间序列的时间维度,用Xt表示X的第t个时间切片。步骤2)包括:利用张量Tucker分解去提取最初的时间序列中潜在的变量或者成分用于捕获时间序列最显著的特征并移除数据中的冗余信息,具体是寻找N个映射矩阵去建立潜在张量Y的第t个时间切片Yt和时间序列X第t个时间切片Xt之间的联系,形式如下:步骤3)包括:(1)对潜在张量Y的时域依赖性进行建模,引入m阶自回归模型AR(m)去保存潜在张量Y的时间连续性:其中εt是高斯白噪声满足εt~N(0,Σt),N为高斯分布,Σt是白噪声的协方差张量满足Σt=Var(εt),Var表示方差形式,是自回归模型的模型参数;(2)基于m阶自回归模型函数得到以下的噪音协方差张量表达式:(3)采用最大似然估计法去估计自回归模型的模型参数得到基于噪音协方差张量的Yule-Waler方程:(4)通过利用自回归模型去最大化真实观测值与预测值之间的协方差相关性,得到以下的目标函数:该式中Cov(Yt|.)测量真实潜在张量与预测潜在张量之间的条件协方差相关性,为了尽可能多的保存信息并控制未知变量的尺度,是目标函数的正交性限制条件。(5)只要估计出了自回归模型的模型参数噪音协方差张量的累积范数由下式计算得出:(6)用噪音协方差张量的累积范数代替目标函数,最优化的问题转化为如下形式:(7)为了最小化预测误差,将以下的目标函数:拓展为:式中是权重参数用来去平衡预测误差与张量重构误差;(8)求解目标函数:令则的等价形式可以表示为:式中将式写成Yt(n)-Un(Xt×(-n){U本文档来自技高网
...

【技术保护点】
一种基于张量时域相关性分解模型的时间序列分析方法,其特征在于,包括如下步骤:1)将时间序列编码为张量;2)将最初的张量变换为一个维度减少的形式;3)对获得的维度减少形式的张量应用自回归模型去保持时域上的连续性;4)动态学习步骤2)~3)更新结果直到算法收敛,结果达到最优。

【技术特征摘要】
1.一种基于张量时域相关性分解模型的时间序列分析方法,其特征在于,包括如下步骤:1)将时间序列编码为张量;2)将最初的张量变换为一个维度减少的形式;3)对获得的维度减少形式的张量应用自回归模型去保持时域上的连续性;4)动态学习步骤2)~3)更新结果直到算法收敛,结果达到最优。2.根据权利要求1所述的基于多线性自回归模型的时间序列分析方法,其特征在于,步骤1)包括:将N+1维的时间序列X,表示为一个N+1阶的张量形式其中I1,I2,…,IN表示时间序列中除时间维度外的其他维度,T表示时间序列的时间维度,用Xt表示X的第t个时间切片。3.根据权利要求1所述的基于多线性自回归模型的时间序列分析方法,其特征在于,步骤2)包括:利用张量Tucker分解去提取最初的时间序列中潜在的变量或者成分用于捕获时间序列最显著的特征并移除数据中的冗余信息,具体是寻找N个映射矩阵去建立潜在张量Y的第t个时间切片Yt和时间序列X第t个时间切片Xt之间的联系,形式如下:Yt=Xt×U11×U22×...×UNN=XtΠi=1N×Uii---(1).]]>4.根据权利要求1所述的基于多线性自回归模型的时间序列分析方法,其特征在于,步骤3)包括:(1)对潜在张量Y的时域依赖...

【专利技术属性】
技术研发人员:苏育挺徐传忠张静
申请(专利权)人:天津大学
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1