System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于VMD的改进LSTM模型的网络流量预测方法技术_技高网
当前位置: 首页 > 专利查询>大连大学专利>正文

一种基于VMD的改进LSTM模型的网络流量预测方法技术

技术编号:41336104 阅读:12 留言:0更新日期:2024-05-20 09:55
本发明专利技术公开了一种基于VMD的改进LSTM模型的网络流量预测方法,包括以下步骤:制备数据集;搭建改进LSTM网络流量预测模型;训练改进LSTM网络流量预测模型。本发明专利技术采用了VMD模块作为改进LSTM网络流量预测模型的输入处理单元,并且重复利用VMD模块对第一次处理的残差项,进行二次分解,不仅可以有效降低复杂时间序列的非平稳性和非线性特征,还充分利用了复杂时间序列的隐藏特征,从而使网络流量预测模型能够更好地理解和捕捉时间序列中的关键特征。这一选择大大提高了改进LSTM网络流量预测模型在网络流量预测任务中的性能和准确性,为相关领域的研究和应用提供了可靠的技术基础。

【技术实现步骤摘要】

本专利技术涉及电信通信领域,具体是一种基于vmd(变分模态分解)与改进lstm(长短期记忆神经网络)模型的网络流量预测方法。


技术介绍

1、在网络数据量较小且应用范围较为有限的早期阶段,学者们倾向于借鉴公共交换电话网的模型,用马尔科夫过程来描述这种网络结构,并使用自回归、自回归移动平均等模型进行序列预测,这些模型参数简单,适用于处理平稳时间序列。随着互联网的不断发展,网络流量特征也变得更为复杂和多样,如混沌特性、长相关性,非线性等,仅用线性模型难以精确拟合预测。一些传统的非线性模型如小波模型、支持向量机、灰色模型等虽然一定程度上能够对复杂非平稳的流量进行预测,但其精度仍需进一步改进。

2、众多研究表明深度学习在时间序列预测中颇具成效,尤其是基于循环神经网络的变体,如长短期记忆单元、门控循环单元等,已经成为典型的时间序列预测模型。这些模型在解决时间序列预测问题时展现出较高的准确性。rnn(循环神经网络)及其变体在时间序列预测中的成功,一方面取决于它们能够学习到时间序列中长时间尺度上的相关性,另一方面在于它们能够捕获比传统线性统计方法更复杂和非线性的特征。这些优势对于网络流量预测尤为关键,因为网络流量序列里已蕴含高度非线性和长相关性。网络流量数据的统计性质中,日益显现的高度非线性和长相关性,越来越难以被捕捉,因而也更为关键。为了解决这一问题,有学者提出一种用小波分析处理流量序列的预测模型,试图通过小波分析观测隐藏于序列之间的关键特性,以此来对网络流量进行预测。因小波基函数对预测准确度影响显著,并在选定之后无法变更,使其应用受限。经验模态分析的提出填补了传统信号处理方法在非线性和非平稳信号分析上的不足,其自适应特性和对信号特征处理的优异表现使其受到广泛应用。尽管emd(经验模态分解)拥有较强的自适应性并且不再局限于基函数,但核心思想是将信号分解为imf(模态分量),而imf的定义相对模糊,没有严格的数学公式来描述,使得其数学支撑相对薄弱,在处理复杂的网络流量信号时,可能导致无意义的分量或者模态混叠等问题。为了应对这一问题,vmd在数学理论支撑更为充分,且具备较强的自适应性,因此在对网络流量这类复杂特性数据进行处理时,能够更加精准的分解以及更有效地处理噪声干扰。将vmd与流量预测模型结合,有望提高预测精度和速度。


技术实现思路

1、为了解决上述分析的现代网络流量序列存在的高度非线性和长相关性的关键问题,本专利技术要提出一种基于vmd的改进lstm模型的网络流量预测方法,实现对复杂流量数据集更加精确的预测。

2、为了达到上述专利技术目的,本专利技术采用如下技术方案:一种基于vmd的改进lstm模型的网络流量预测方法,包括以下步骤:

3、a、制备数据集

4、收集mawi工作组捕获的太平洋骨干节点的真实流量,所述mawi工作组为日本广域互联网测量与分析机构,并按以下步骤制备复杂网络流量数据集:

5、a1、对网络流量进行输入输出统计即进行io统计

6、从mawi工作组下载骨干节点f收集的原始流量数据集,所述原始流量数据集为包含网络各层所有会话信息的网络数据包集合,使用wireshark软件对其进行io统计,得到不少于7200秒的io时序数据集,简称io原始数据集;

7、a2、数据集预处理

8、采用最大最小化方法对所述io原始数据集进行标准化处理,采用平均值法对缺失值进行补足,采用箱线图法对异常值进行替换,并将处理后的io原始数据集简称为网络流量数据集。

9、b、搭建改进lstm网络流量预测模型

10、所述改进lstm网络流量预测模型的整体架构采用分解-预测-融合架构;所述改进lstm网络流量预测模型包括vmd模块和ga-lstm模块。网络流量数据集输入到vmd模块后,得到n个模态分量imf1、imf2、…、imfn,其中,imfn为残差分量;

11、将前n-1个模态分量imf1、imf2、…、imfn-1分别输入到ga-lstm模块的ga-lstm1、ga-lstm2、…、ga-lstmn-1子模块;

12、将残差分量imfn输入到第二vmd模块得到m个模态分量;将m个模态分量分别输入到ga-lstm模块的ga-lstmn1、…、ga-lstmnm子模块;

13、所述ga-lstm模块包括ga模块和lstm模块,负责调整最好的网络状态去训练输入的模态分量,所述lstm模块对得到的各模态分量进行训练,由ga模块负责记录对应的lstm模块的分量训练结果与对应的环境参数;各模态分量经过ga-lstm模块的各子模块训练和调整后输出相应的预测分量,具体为:通过ga-lstm1、ga-lstm2、…、ga-lstmn-1子模块分别输出1到n-1号预测分量,将ga-lstmn1、…、ga-lstmnm输出的n1到nm号预测分量直接采取线性相加的方式得到n号预测分量,最后将1到n号预测分量采取线性相加的方式得到最终的预测结果。所述vmd模块为变分模态分解模块,所述ga模块为遗传算法模块,所述lstm模块为长短期记忆神经网络模块。

14、所述改进lstm网络流量预测模型的预测方法包括以下步骤:

15、b1、在改进lstm网络流量预测模型的输入部分引入vmd模块构建输入分量:

16、设{x(t)}为流量序列,δ(t)为狄拉克分布函数,t为时间,uk为分解的第k个imf,ω为uk的中心频率。

17、首先,利用希尔伯特变换计算每个子序列的流量数据,并将每个子序列的流量数据中心调制到相应基带:

18、

19、其中,j为复数虚部。

20、其次,根据平方范数l2计算各模态分量的带宽,将变分模态分解过程转为如下约束优化问题:

21、

22、通过上述两步得到一个约束优化问题。使用增广拉格朗日方法将该约束优化问题转为如下无约束问题:

23、

24、解上述无约束问题,可得最终各模态分量:

25、

26、式中,α为二次惩罚因子,λ为拉格朗日乘子。

27、b2、对b1步骤得到的残差分量imfn引入第二vmd模块构建输入分量:

28、根据残差分量中心频率的分布情况,设置第二vmd模块初始参数,按照b1步骤将残差分量imfn输入到第二vmd模块进行处理,得到m个模态分量。b3、将ga模块引入到lstm模型中,构成ga-lstm模块:

29、所述ga模块负责记录迭代的lstm模块结构参数,具体方法如下:

30、步骤1:确定迭代次数、染色体数量、交叉和变异概率。选择策略采用轮赌盘规则,交叉操作采用两点交叉,变异策略采用简单变异策略。选择适应度函数为标准误差rmse,其公式如下:

31、

32、式中,n为序列样本个数,yi为样本实际值,y'i为样本预测值。

33、步骤2:将lstm模块的迭代次数和批量大本文档来自技高网...

【技术保护点】

1.一种基于VMD的改进LSTM模型的网络流量预测方法,其特征在于:包括以下步骤:

2.根据权利要求1所述一种基于VMD的改进LSTM模型的网络流量预测方法,其特征在于:步骤B所述改进LSTM网络流量预测模型的预测方法包括以下步骤:

3.根据权利要求2所述一种基于VMD的改进LSTM模型的网络流量预测方法,其特征在于:步骤B3所述GA模块负责记录迭代的LSTM模块结构参数,具体方法如下:

【技术特征摘要】

1.一种基于vmd的改进lstm模型的网络流量预测方法,其特征在于:包括以下步骤:

2.根据权利要求1所述一种基于vmd的改进lstm模型的网络流量预测方法,其特征在于:步骤b所述改进lstm网络...

【专利技术属性】
技术研发人员:魏德宾范中林
申请(专利权)人:大连大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1