非负右偏时间序列的模式识别与预测方法技术

技术编号:37641075 阅读:10 留言:0更新日期:2023-05-25 10:08
本发明专利技术提供非负右偏时间序列的模式识别与预测方法,涉及数据处理技术领域。该方法包括如下步骤:针对数据所具有典型的非负和右偏特征,采用Tweedie分布作为模式识别和预测的基础模型,利用随机效应来刻画个体效应与序列的相关性;通过对分布函数中的参数进行迭代算法的计算,得到相应的参数值,再对协变量进行预测,结合模式识别过程的参数值给出预测值。通过借助具有随机效应的Tweedie分布,给出针对具有非负右偏特征的时间序列进行模式识别和趋势预测的算法,达到对其趋势进行预测的效果,为后续针对非负右偏特征的时间序列的预测提供算法工具支持,解决经济管理、医学分析和生物统计等方向的时间序列数据分析和预测问题。题。题。

【技术实现步骤摘要】
非负右偏时间序列的模式识别与预测方法


[0001]本专利技术涉及数据处理
,具体为非负右偏时间序列的模式识别与预测方法。

技术介绍

[0002]目前时间序列的预测方法,是借助序列发展的延续性,通过对过去的规律进行分析,进行模式的识别,在此基础上对未来的趋势进行预测,现阶段的主要方法普遍是针对具有正态分布的数据进行的研究,对分布不符合正态分布的数据进行变换,使其满足正态分布的要求后再进行分析和预测,存在着方法不统一,效果不直观和对数据处理后信息不完全等问题。
[0003]在时间序列的数据中,很多数据具有非负和右偏的特征,传统的时间序列分析中,针对此类数据的分析方法多是采用取对数的方式再进行分析,导致其在分析和预测过程中存在着不直观的问题。本专利技术针对一类常见特殊的非正态(非负右偏)时间序列数据,提供了非负右偏时间序列的模式识别与预测方法

技术实现思路

[0004]针对现有技术的不足,本专利技术提供了非负右偏时间序列的模式识别与预测方法,针对非正态时间序列数据进行定制化的分析和预测,为解决经济管理、医学分析和生物统计等方向的类似时间序列的分析和预测问题提供算法工具的支持。
[0005]为实现以上目的,本专利技术通过以下技术方案予以实现:一种非负右偏时间序列的模式识别与预测方法,包括以下步骤:
[0006]步骤一、针对数据所具有典型的非负和右偏特征,采用了Tweedie分布作为模式识别和预测的基础模型,并引入随机效应来刻画个体效应与序列的相关性;
[0007]步骤二、通过对分布函数中的参数进行迭代算法的计算,得到相应的参数值,然后,再对协变量进行预测,结合模式识别过程的参数值给出预测值;在模式识别部分,分两步算法进行参数的初值估计和迭代更新,得到参数值;在预测部分,分两步算法先对协变量X进行预测,再对因变量Y进行预测。
[0008]优选的,所述步骤一中,引入了随机效应U来刻画个体效应与序列的相关性, U=(U1,U2,

,U
n
); 其中n为时间序列的时间点,包括日、周和月等,U
t
代表时间序列在t时间点的随机效应,U
t
的期望给定为1,U
t
的方差为τ
2 , U
i
和U
j
分别为时间序列在i和j时间点的随机效应,U
i
和U
j
的相关系数记为ρ
|i
ꢀ‑
j|
,τ和ρ需要通过对数据的分析进行计算获取;
[0009]Y作为模式识别和预测的时间序列对象,记为Y=(y1,y2,

,y
n
),X是协变量,记为X=(x1,x2,

,x
n
),Yt的条件分布函数为公式:
[0010]ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0011]其中,μ
t
=,为t时间点的协变量,为回归参数,μ
t
为t时刻y
t
的均值,q是Tweedie分布中的超参数,用来控制其对应不同的分布,q需大于2,满足对非负右偏时间序
列的特征刻画,是分散度参数,用来刻画数据的分布特征,U
t
代表时间序列在t时间点的随机效应,是时间序列在t时间点的值,是根据来确定的满足Tweedie分布的参数值,需要通过对数据的分析进行计算获取。
[0012]优选的,步骤二具体包括:
[0013]第一步、迭代初始值确定
[0014]使用Gamma回归模型获得的初值,并对其他参数进行迭代初始值赋值:
[0015]U=Y/[n
×
(y1+y2+

+y
n
)];τ2=|(U

1)|
2 /n;ρ
*
=0.5;=1;μ=;
[0016]μ为(μ1, μ2,

, μ
n
),是 (y1,y2,

,y
n
)的均值向量;
[0017]第二步、循环迭代更新参数
[0018]1)更新参数向量:
[0019]回归参数向量的迭代过程中,首先假定随机效应是已知情况下进行计算,后续通过替换随机效应为其最佳线性无偏预测后,得到对的无偏估计;
[0020]=

Inv(

Diag(μX)'
×
Inv(Y)
×
Diag(μX))
×ꢀ
Diag(μX)'
×
Inv(Var(Y))
×
(Y

μ)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0021]其中,
[0022]Diag是指生成对角矩阵,Inv是对矩阵求逆,Var是计算方差;
[0023]是第一步中获取的初始值;
[0024]Var(Y)=
×
Diag(μ)
p
+ Diag(μ)
×ꢀ
Var(u)
ꢀ×ꢀ
Diag(μ),
[0025]Var(u)是ρ和τ2的张量积;
[0026]ρ是元素如下的矩阵:
[0027]ρ(i,j)= ρ
* (j

i)
,i=1:(T

1) j =(i+1):T;
[0028]ρ(i,j)= ρ
* (j,i),i=2:T j=1:(i

1);
[0029]ρ(i,j)=1, i=j;
[0030]至此,参数向量的更新完毕;
[0031]2)随机效应参数τ2和算法:
[0032]随机效应部分的相关参数有τ2和,使用最佳线性无偏预测方法进行计算获取;
[0033]τ2=mean|u

1|2+(τ
*
)2‑
mean(Diag(Cov(u)))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0034]=mean(((Y

μ
u
)2+(μ2×
τ2‑
(μ2)
×
Diag(Cov(u)))/(μ
p
))(4)
[0035]其中,Cov(u)=Var(u)
×
Diag(μ)
×
Inv(Var(Y))
×
Diag(μ)
ꢀ×ꢀ
Var(T)
[0036]T是T行1列的单位向量;
[0037]u=T+Var(T)
×
Diag(μ)
ꢀ×ꢀ
Inv(Var(Y))
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种非负右偏时间序列的模式识别与预测方法,其特征在于,包括以下步骤:步骤一、针对数据所具有典型的非负和右偏特征,采用Tweedie分布作为模式识别和预测的基础模型,并引入随机效应来刻画个体效应与序列的相关性;步骤二、通过对分布函数中的参数进行迭代算法的计算,得到相应的参数值,然后,再对协变量进行预测,结合模式识别过程的参数值给出预测值;在模式识别部分,分两步算法进行参数的初值估计和迭代更新,得到参数值;在预测部分,分两步算法先对协变量X进行预测,再借助模式识别过程得到的参数值对因变量Y进行预测。2.根据权利要求1所述的非负右偏时间序列的模式识别与预测方法,其特征在于,所述步骤一中,引入了随机效应U来刻画个体效应与序列的相关性, U=(U1,U2,

,U
n
);其中n为时间序列的时间点,包括日、周和月等,U
t
代表时间序列在t时间点的随机效应,U
t
的期望给定为1,U
t
的方差为τ2, U
i
和U
j
分别为时间序列在i和j时间点的随机效应,U
i
和U
j
的相关系数记为ρ
|i
ꢀ‑
j|
,τ和ρ需要通过对数据的分析进行计算获取;Y作为模式识别和预测的时间序列对象,记为Y=(y1,y2,

,y
n
),X是协变量,记为X=(x1,x2,

,x
n
),Y
t
的条件分布函数为公式:
ꢀꢀꢀꢀꢀ
(1);其中,μ
t
=,为t时间点的协变量,为回归参数,μ
t
为t时刻y
t
的均值,q是Tweedie分布中的超参数,用来控制其对应不同的分布,q需大于2,满足对非负右偏时间序列的特征刻画,是分散度参数,用来刻画数据的分布特征,U
t
代表时间序列在t时间点的随机效应,是时间序列在t时间点的值,是根据来确定的满足Tweedie分布的参数值,需要通过对数据的分析进行计算获取。3.根据权利要求1所述的非负右偏时间序列的模式识别与预测方法,其特征在于,步骤二具体包括:第一步、迭代初始值确定;使用Gamma回归模型获得的初值,并对其他参数进行迭代初始值赋值:U=Y/[n
×
(y1+y2+

+y
n
)];τ2=|(U

1)|
2 /n;ρ
*
=0.5;=1;μ=;μ为(μ1, μ2,

, μ
n
),是 (y1,y2,

,y
n
)的均值向量;第二步、循环迭代更新参数;1)更新参数向量:回归参数向量的迭代过程中,首先假定随机效应是已知情况下进行计算,后续通过替换随机效应为其最佳线性无偏预测后,得到对的无偏估计;=

Inv(

Diag(μX)'
×
Inv(Y)
×
Diag(μX))
×
Diag(μX)'
×
Inv(Var(Y))
×
(Y

μ);其中,Diag是指生成对角矩阵,Inv是对矩阵求逆,Var是计算方差;是第一步中获取的初始值;Var(Y)=
×
Diag(μ)
p
+ Diag(...

【专利技术属性】
技术研发人员:张晓磊
申请(专利权)人:云南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1