基于多重分形协同度量门控循环单元的预测方法及模型技术

技术编号:26731602 阅读:31 留言:0更新日期:2020-12-15 14:34
本发明专利技术涉及基于多重分形协同度量门控循环单元的预测方法及模型,该方法包括以下步骤:对输入时序数据进行预处理,得到预处理后的时序数据;对处理好的时序数据用滑动时间窗口进行切分,利用多重分形算法计算各时间窗口上的多重分形谱的谱宽Δα,得到时序数据的多重分形谱的谱宽矩阵E,并将门控循环单元中的更新门权重矩阵改进为与谱宽矩阵E相关的权重矩阵,得到改进门控循环单元,利用改进门控循环单元构建网络模型进行预测。本发明专利技术提出的MF‑GRU模型采用多重分形技术提取时序数据的波动变化程度特征,并设置动态调整矩阵代替传统更新门权重矩阵学习数据中的非平稳数据段的变化趋势,以提升非平稳时序数据的预测精度。

【技术实现步骤摘要】
基于多重分形协同度量门控循环单元的预测方法及模型
本专利技术涉及时序预测
,具体是一种基于多重分形协同度量门控循环单元的预测方法及模型。
技术介绍
时间序列预测在社会的各个领域起着重要的作用,如股价、空气质量、语音识别等。但实际的时序问题多非平稳,导致传统预测方法预测非平稳数据序列精度不高。传统时序预测方法通过建立适当的数学模型拟合时序趋势,如ARMA模型、ES模型、逻辑回归模型等,但难以处理数据的多变量依赖关系导致预测精度较低。基于机器学习的时序预测模型如支持向量回归、K近邻算法等,能够较好处理多变量依赖的时序数据,但易出现过拟合导致预测效果较差。深度神经网络作为一种高度复杂的非线性系统,在处理多变量依赖的复杂时序数据时具有一定的优势。循环神经网络模型存在长期依赖问题,Hochreater和Schmidhuber在RNN基础上引入门控机制提出长短期记忆模型,以解决RNN的长期依赖问题;Chung等在此基础上简化门控机制提出门控循环单元(GatedRecurrentUnit,GRU),使得模型具有更快的训练效率并精度相当;Zhou等提出的最小门控单元,在GRU基础上进一步简化模型结构,训练效率得到进一步提升。但上述模型做的是效率上的提升,在预测性能上趋同,对非平稳时序数据预测效果较差。
技术实现思路
本专利技术要解决的技术问题是针对以上不足,提供一种基于多重分形协同度量门控循环单元的预测方法及模型。本专利技术通过多重分形谱的谱宽量化待预测变量的波动变化程度,建立改进门控循环单元网络实现非平稳时序数据的训练和预测。为解决以上技术问题,本专利技术采用以下技术方案:基于多重分形协同度量门控循环单元的预测方法,包括以下步骤:步骤1、对输入时序数据进行预处理,得到预处理后的时序数据;步骤2、利用多重分形算法计算预处理后的时序数据的多重分形谱的谱函数f(α)和谱宽Δα,对于长度为n的时序数据序列X={X1,X2,…,Xn},设置滑动时间窗口长度为w,步长为1,利用多重分形算法计算每个时间窗口上的多重分形谱的谱宽Δαi,得到多重分形谱的谱宽矩阵E=GT=[Δα1,Δα2,…,Δαn-w]T;步骤3、将门控循环单元中的更新门权重矩阵改进为与谱宽矩阵E相关的权重矩阵,得到改进门控循环单元;步骤4、将预处理后的时序数据输入改进门控循环单元中,得到预测数据;判断当前迭代次数是否大于或等于预设最高迭代次数,若是则转到步骤7,若否则转到步骤4;步骤5、利用预测数据和实际数据计算损失函数;步骤6、判断损失函数是否满足收敛条件,若是则转到步骤7;若否则通过优化算法进行误差的反向传播,更新改进门控循环单元的权重矩阵和偏置矩阵,当前迭代次数加1后转到步骤5;步骤7、输出预测数据。进一步的,所述步骤2中利用多重分形算法计算谱宽的方法具体包括以下步骤:步骤31、将长度为N的时间序列数据,以步长为1,将其划分为(N-w)个窗口长度为w的时间序列,每个窗口的概率测度Pi表示为:其中,Ii(w)为时间标度为w时第i个区间内所有样品值之和(i∈(1,(N-w));如果时间序列具有多重分形特征,则在无标度区间内满足如下幂律关系:Pi(w)∝wα其中,α为第i个区间所对应的标志Pi(w)大小的奇异指数,反映Pi(w)随w变化各区间不同的奇异程度;步骤32、把具有相同α的时间标度为w的区间个数记为Nα(w),随w减少,Nα(w)不断增加,若此时间序列存在多标度关系,则在无标度区间内满足如下幂律关系:Nα(w)∝w-f(α)步骤33、定义多重分形系统的配分函数χq(w)为归一化时序数据的q阶矩:其中,χq(w)是反映归一化后时序数据Pi(w)不均匀性的统计量,q为权重因子;由分形的自相似性可知,χq(w)与w在无标度区间满足如下幂律关系:χq(w)∝wτ(q)对上式两侧求对数即得lnχq(w)~lnw曲线,其中曲线的斜率τ(q)为质量指数,τ(q)可通过lnχq(w)~lnw双对数曲线中的线性点进行最小二乘法拟合来进行估算;步骤34、在已知q~τ(q)曲线的前提下,通过勒让德变换(Legendretransformation),由q和τ(q)可以得到α(q)和f(α);其中,Δα=αmax-αmin为时序数据的多重分形谱的谱宽,f(α)为时序数据的多重分形谱函数。进一步的,所述步骤3的改进门控循环单元的改进方法如下:将门控循环单元中的更新门权重矩阵拆分为两个新的更新门矩阵Wz1,Wz2,分别与已激活的多重分形谱宽矩阵σ(E)和(1-σ(E))相乘得到临时门控输出用以学习非平稳时序数据段中数据的波动变化特征:将临时门控输出相加得到一个整体的更新门zt参与计算,即改进门控循环单元的其它更新规则与门控循环单元保持一致:at=tanh(Wh⊙[rt*ht-1,xt]+ba)ht=ht-1*(1-zt)+zt*at其中,分别代表两个临时更新门,分别代表两个临时更新门矩阵,σ(x)为Sigmoid激活函数,E为输入数据的多重分形谱的谱宽矩阵,zt、rt来表示更新门、重置门在t时刻的计算结果,ht-1和ht分别表示(t-1)时刻和t时刻的输出,*代表表示矩阵对应元素相乘,⊙表示逐点相乘,W*和b*表示网络的权重矩阵和偏置向量。进一步的,改进门控循环单元网络模型包括输入层、隐藏层和输出层,输入层用于时序数据的输入,给定包含n个变量序列的时间序列X=(x1,x2,x3,…,xn)T,T表示时间步长,n表示输入维度,则基于门控权重单元的时序预测模型表示为:y^T+1=F(h1,…,hT-1,x1,…,xT)其中,ht为隐含层状态,ht∈R,F(.)为模型隐藏层需要学习的非线性映射函数,y^T+1是模型的预测目标,为下一个时间点的输出层的预测输出;数据序列X=(x1,x2,x3,…,xn)T在整个输入层的输入矩阵表示为(x1,x2,x3,…,xT)∈Rn*T。进一步的,所述步骤5和步骤6中所述的损失函数为均方根误差损失函数。进一步的,还包括对改进门控循环单元的训练,得到改进门控循环单元的模型参数的步骤,训练方法包括以下步骤:步骤11、从输入时序数据选取一部分数据作为训练集;步骤12、将训练集的数据输入改进门控循环单元,得到训练集的预测数据;步骤13、计算训练集的预测数据和实际数据的平均绝对误差、均方根误差和平均误差百分比,并将平均绝对误差、均方根误差和平均误差百分比作为度量指标对模型进行评估,得到优化后的改进门控循环单元的模型参数,并将优化后的模型参数作为改进门控循环单元的初始模型参数。基于多重分形协同度量门控循环单元的预测模型,包括数据预处理单元、基于多重分形算法的谱宽计算单元和改进门控循环单元,所述数据预处理单元用于对输入数本文档来自技高网...

【技术保护点】
1.基于多重分形协同度量门控循环单元的预测方法,其特征在于,包括以下步骤:/n步骤1、对输入时序数据进行预处理,得到预处理后的时序数据;/n步骤2、利用多重分形算法计算预处理后的时序数据的多重分形谱的谱函数f(α)和谱宽Δα,对于长度为n的时序数据序列X={X

【技术特征摘要】
1.基于多重分形协同度量门控循环单元的预测方法,其特征在于,包括以下步骤:
步骤1、对输入时序数据进行预处理,得到预处理后的时序数据;
步骤2、利用多重分形算法计算预处理后的时序数据的多重分形谱的谱函数f(α)和谱宽Δα,对于长度为n的时序数据序列X={X1,X2,…,Xn},设置滑动时间窗口长度为w,步长为1,利用多重分形算法计算各时间窗口上的多重分形谱的谱宽Δαi,得到多重分形谱的谱宽矩阵E=GT=[Δα1,Δα2,…,Δαn-w]T;
步骤3、将门控循环单元中的更新门权重矩阵改进为与谱宽矩阵E相关的权重矩阵,得到改进门控循环单元;
步骤4、将预处理后的时序数据输入改进门控循环单元模型中,得到预测数据;判断当前迭代次数是否大于或等于预设最高迭代次数,若是则转到步骤7,若否则转到步骤5;
步骤5、利用预测数据和实际数据计算损失函数;
步骤6、判断损失函数是否满足收敛条件,若是则转到步骤7;若否则通过优化算法进行误差的反向传播,更新改进门控循环单元的权重矩阵和偏置矩阵,当前迭代次数加1后转到步骤4;
步骤7、输出预测数据。


2.根据权利要求1所述的基于多重分形协同度量门控循环单元的预测方法,其特征在于,所述步骤2中利用多重分形算法计算谱宽的方法具体包括以下步骤:
步骤31、将长度为N的时间序列数据,以步长为1,将其划分为(N-w)个窗口长度为w的时间序列,每个窗口的概率测度Pi表示为:



其中,Ii(w)为时间标度为w时第i个区间内所有样品值之和(i∈(1,(N-w));
如果时间序列具有多重分形特征,则在无标度区间内满足如下幂律关系:
Pi(w)∝wα
其中,α为第i个区间所对应的标志Pi(w)大小的奇异指数,反映Pi(w)随w变化各区间不同的奇异程度;
步骤32、把具有相同α的时间标度为w的区间个数记为Nα(w),随w减少,Nα(w)不断增加,若此时间序列存在多标度关系,则在无标度区间内满足如下幂律关系:
Nα(w)∝w-f(α)
步骤33、定义多重分形系统的配分函数χq(w)为归一化时序数据的q阶矩:



其中,χq(w)是反映归一化后时序数据Pi(w)不均匀性的统计量,q为权重因子;
由分形的自相似性可知,χq(w)与w在无标度区间满足如下幂律关系:
χq(w)∝wτ(q)
对上式两侧求对数即得lnχq(w)~lnw曲线,其中曲线的斜率τ(q)为质量指数,τ(q)可通过lnχq(w)~lnw双对数曲线中的线性点进行最小二乘法拟合来进行估算;
步骤34、在已知q~τ(q)曲线的前提下,通过勒让德变换(Legendretransformation),由q和τ(q)可以得到α(q)和f(α);



其中,Δα=αmax-αmin为时序数据的多重分形谱的谱宽,f(α)为时序数据的多重分形谱函数。


3.根据权利要求1所述的基于多重分形协同度量门控循环单元的预测方法,其特征在于,所述步骤3的改进门控循环单元的改进方法如下:
将门控循环单元中的更新门权重矩阵拆分为两个新的更新门矩阵Wz1,Wz2,分别与已激活的多重分形谱宽矩阵σ(E)和(1-σ(E))相乘得到临时门控输出用以学习非平稳时序数据段中数据的波动变化特征:

【专利技术属性】
技术研发人员:张冬梅余想李金平
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1