【技术实现步骤摘要】
基于回声状态网络的多维时间序列缺失补全方法
[0001]本专利技术涉及数据补全领域,具体涉及一种基于回声状态网络的多维时间序列缺失补全方法。
技术介绍
[0002]随着物联网的不断普及,数十亿来自环境、建筑和智能设备的嵌入式传感器产生了大量的时间序列数据,为人类生活中的各种应用提供了强大的支持。然而,各种意外事故不可避免地会导致数据丢失,从而影响下游应用的决策能力。因此,对缺失值进行估计以提高数据质量往往是各种应用在数据预处理阶段中非常重要的一环。
[0003]缺失数据估计指的是使用统计或机器学习技术在缺失位置填充估计值的过程。根据考虑的数据相关性的不同,常用的方法大致可分为以下四类:插值法、归算法、基于矩阵的填充和基于深度学习的方法。第一类方法称为插值法,它利用时间序列中观测值之间的时间相关性来估计缺失值,最常见的有线性插值、三次样条插值、模糊插值和谱方法等。插值法的缺点是没有充分考虑影响时间序列的外生变量的跨域相关性。第二类方法称为归算法,它考虑了外生变量与观测值之间的相关性,并通过拟合两者的关系来生成估计值。常 ...
【技术保护点】
【技术特征摘要】
1.一种基于回声状态网络的多维时间序列缺失补全方法,其特征在于,包括以下步骤:步骤S1:构建一个包含输入层、隐藏层和输出层的回声状态网络模型,并初始化;步骤S2:按照时间顺序,向回声状态网络模型的输入层提供每个时刻的外生变量,向输出层提供对应时刻的多维时间序列的观测值,若缺失的观测值尚未预补,则利用基于方向的最近邻策略进行暂时性预补;步骤S3:根据使用的储备池个数的不同,分别构建具有双向反馈的前向或双向回声状态网络,并利用不同的内部状态更新公式计算所有时刻的内部状态;步骤S4:根据无需预补时刻的输入、内部状态和真实输出训练出网络的输出权重;步骤S5:根据需要预补时刻的输入、内部状态和步骤S4得到的输出权重计算输出估计值,并用于对预补值进行更新;步骤S6:重复步骤S3
‑
S5直至,满足预设要求,迭代结束,用最后的预补值填补原始序列的缺失值。2.根据权利要求1所述的基于回声状态网络的多维时间序列缺失补全方法,其特征在于,所述初始化,具体为:随机初始化网络的输入权重、反馈权重和循环权重,其中循环权重要求是稀疏的。3.根据权利要求1所述的基于回声状态网络的多维时间序列缺失补全方法,其特征在于,所述步骤S1具体为:步骤S11:构建一个包含输入层、隐藏层和输出层的回声状态网络,输入层神经元的个数n
i
与影响时间序列的外生变量的个数相同,隐藏层包含前向储备池,反向储备池和融合储备池,它们的神经元个数均为n
r
,输出层神经元的个数n
o
与多维时间序列的维度相同;步骤S12:利用[
‑
1,1]的均匀分布随机生成输入层到前向储备池、反向储备池的输入全连接权重和前一时刻和后一时刻的输出层分别到当前时刻的前向储备池的反馈全连接权重和后一时刻的输出层到当前时刻的反向储备池的反馈全连接权重前一时刻到当前时刻的前向储备池的循环稀疏连接权重其非零元素的个数由稀疏率决定;后一时刻到当前时刻的反向储备池的循环稀疏连接权重其非零元素的个数由稀疏率决定;步骤S13:将权重矩阵W
i1
,W
i2
,W
f1
,W
f2
和W
f3
按照各自的缩放因子s
i1
,s
i2
,s
f1
,s
f2
和s
f3
进行缩放。将W
r1
和W
r2
按照各自的谱半径因子ρ
r1
和ρ
r2
根据公式(1)
‑
(2)进行调整,其中λ
max
(W
r1
)和λ
max
(W
r2
)指的是W
r1
和W
r2
的最大特征值的最大特征值
4.根据权利要求1所述的基于回声状态网络的多维时间序列缺失补全方法,其特征在于,所述利用基于方向的最近邻策略进行暂时性预补,具体为:步骤S21:已知原始时间序列Y={y1,...,y
t
,...,y
l
},l为时间序列的长度,其中根据Y中的缺失情况,定义一个多维时间序列M={m1,...,m
t
,...,m
l
},其中若时刻t的第j维的观测值...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。