一种抑制数据泄露的高精度时间序列预测方法技术

技术编号:34456619 阅读:41 留言:0更新日期:2022-08-06 17:03
一种抑制数据泄露的高精度时间序列预测方法,属于通信技术以及计算机技术领域,以降噪相关理论与深度学习预测模型建模思想为理论基础,考虑时间序列具有噪声高、非平稳和非线性等特点,为降低噪声对时间序列预测的影响,并防止数据发生泄露的情况,通过重叠切片对时间序列进行多次变分模态分解(VMD)处理,并改进降噪阈值函数,对分解后的时间序列进行降噪处理。进一步,引入深度学习建模思想,建立神经网络多步预测模型,从而提高时间序列的预测性能。本方法适用于具有噪声特性的时间序列多步预测系统及装置。多步预测系统及装置。多步预测系统及装置。

【技术实现步骤摘要】
一种抑制数据泄露的高精度时间序列预测方法


[0001]本专利技术属于通信技术以及计算机
,尤其是高精度时间序列预测技术,可以抑制数据泄露,且可实现多步预测。

技术介绍

[0002]生产生活中的诸多应用都涉及时间序列,例如股票价格指数、车流量、空气污染指数、降雨量、脑电图信号和太阳黑子等。利用时间序列预测可揭示复杂系统内部的演化规律,因此,时间序列预测是探究复杂系统机理和建立系统模型的重要手段。然而,由于时间序列通常具有高噪声以及非线性等特点,因此,增加了时间序列预测的难度。时间序列中必然会存在影响因素(简称噪声),其存在不仅会降低时间序列的质量,还会损失有效信息(数据泄露问题,致使预测不符合真实应用,降低了预测模型的适用性),而且,随着预测过程的推进,噪声会被不断放大,导致模型的预测精度和稳定性受到严重干扰。为降低噪声对时间序列预测的影响,降噪处理成为必然。然而,目前方法大都采用将整体时间序列进行平滑或降噪,进而再划分训练集和测试集,从而导致了数据泄露问题,致使预测不符合真实应用,降低了预测模型的适用性。由此可见,构建有效且符合实际应用降本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种抑制数据泄露的高精度时间序列预测方法,其特征在于包括下列步骤:步骤一:采集时间序列;设长度为N的序列x(n)被噪声u(n)所污染,n=1,2,

,N,所采集的含噪序列表示为:y(n)=x(n)+u(n)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
[1];步骤二:对时间序列y(n)进行VMD处理;VMD将输入序列y(n)分解为不同数量的有限带宽的子序列,子序列即为本征模态函数IMF分量,这些IMF分量根据其稀疏性重现原始输入序列,如公式[2]和公式[3]所示,其中Y
w
(n)为分解后的IMF分量,F[
·
]为VMD分解函数,A为包含分解尺度K、惩罚因子α、噪声容限τ和判别精度ε的参数矩阵;Y
w
(n)=F[y(n)]
A
,w=1,2,

,K
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
[2];设置τ=0和ε=1
×
10
‑7,设置K值从小到大取正整数值,当最后一层IMF分量保持相对稳定的中心频率时,认为此时的K值为最佳值,且K∈N
*
;确定K值后,通过观察不同α对VMD运行时间影响,随着α逐渐增大,当运行时间达到第一个时间极小值时的α即为合适的取值,且α∈N
*
;通过设置分解尺度K和惩罚因子α,进行维纳滤波降噪和交替乘法算子处理,得到并更新K个中心频率,再根据不同的中心频率,得到各IMF分量;经过多次计算更新,IMF分量匹配到最佳中心频率,实现原始序列的有效分解;步骤三:通过排列熵确定Y
w
(n)中的低频分量Y
l
(n)和高频分量Y
h
(n);其中,l=1,

,d,h=d+1,

,K,d∈Z;将Y
w
(n)分量进行相空间重构;对于任意一个重构向量都得到一个反映其元素大小顺序的符号序列S(c),如公式[6]所示;m维相空间映射不同的符号序列{j1,j2,

,j
m
}总共有m!种,S(c)是其中的一种排列形式,每个重构分量按照升序排列后更新{j1,j2,

,j
m
};S(c)={j1,j2,

,j
m
},c=1,2,

,R,且R≤m!
ꢀꢀꢀꢀꢀꢀ
[6];计算每一种符号序列出现的次数除以m!种不同的符号序列出现的总次数作为该符号序列出现的概率,即{P1,P2,

,P
R
};利用概率{P1,P2,

,P
R
}对IMF分量进行排列熵计算,如公式[7];排列熵的最大值为ln(m!),将排列熵值进行归一化处理,如公式[8];排列熵值的大小表示IMF分量的随机程度,根据时间序列y(n)的排列熵并结合高低频节点经验值(0.7

0.85)设置阈值,d值为排列熵小于阈值的IMF分量的数量,从而确定低频分量Y1~Y
d
及高频分量Y
d+1
~Y
K
;步骤四:对时间序列y(n)进行重叠切片VMD降噪处理;选择固定阈值,对降噪阈值函数进行改进,构建一种折中阈值函数,如公式[9]所示,其中β为折中因子且β∈[0,1],Y
kt
表示
分解后分量Y
k
在t时刻的值,Y

kt
表示降噪后分量Y

k
在t时刻的值,sign()表示符号函数,Y
k
的阈值Q为切片大小,median()表示中位数函数;利用固定大小的切片对时间序列y(n)按单位时间步进行处理;时间序列y(n)经过切片处理后,进行VMD处理,将低频分量保留,高频分量进行折中阈值降噪;设定切片大小为Q,切片每次移动的步长为1,因此共有M=N

Q+1个切片;将时间序列y(n)分成M个切片,如公式[10]所示,其中b=1,2,

,M;F
b
={y(b),y(b+1),

,y(b+Q

1)}
ꢀꢀꢀꢀ
[10];提取第一组时间序列切片为(y(1),y(2),

,y(Q)),对该序列进行VMD处理,得到第一组分解序列(y1(1),y1(2),

,y1(Q)),保留分解序列的低频分量并对分解序列的高频分量进行降噪处理,得到第一组降噪序列(y
′1(1),y
′1(2),

【专利技术属性】
技术研发人员:刘芳陈立志冯永新
申请(专利权)人:沈阳理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1