一种基于改进ConvLSTM深度学习模型的局域网流量预测方法技术

技术编号:34842947 阅读:10 留言:0更新日期:2022-09-08 07:40
本发明专利技术的公开了一种基于改进ConvLSTM深度学习模型的局域网链路流量预测方法,涉及网络流量预测领域。针对基于传统线性模型和非线性模型的目标网络流量预测方法普遍存在的预测精确度不高、无法同时对目标网络流量空间特征进行预测、无法通过单个模型预测目标网络所有链路流量等问题,本发明专利技术提出一种基于改进ConvLSTM深度学习模型的局域网流量预测方法。通过在模型中加入类残差结构模块和基于注意力机制的Squeeze

【技术实现步骤摘要】
一种基于改进ConvLSTM深度学习模型的局域网流量预测方法


[0001]本专利技术属于计算机网络流量工程、网络孪生和网络仿真
,特别是涉及一种基于改进ConvLSTM深度学习模型的局域网流量预测方法。

技术介绍

[0002]网络仿真和网络孪生是当前计算机网络与通信领域的研究热点。除采用软件模拟(simulation)方法外,也可采用网络仿真(emulation)技术,实现对目标网络中节点、链路及拓扑等关键要素的高逼真度复现。例如,采用云计算平台中的虚拟实例(基于传统主机虚拟化技术的虚拟机或基于轻量级虚拟化技术的容器)实现对目标网络节点的仿真或孪生复现、采用云平台底层虚拟链路和虚拟网络实现对目标网络链路和拓扑的仿真或孪生复现。上述网络仿真技术具有仿真逼真度高、灵活可扩展、支持上层协议及应用程序直接部署等优势。
[0003]网络仿真和网络孪生不仅需实现对目标网络节点、链路和拓扑的高逼真度复现,更需实现对目标网络中传输流量的实时、准确复现。而实现目标网络中链路流量在仿真网络或孪生网络复现的主要方法包括两种:第一种方法是依据目标网络流量日志的方法。可利用tcpdump等抓包工具完整记录目标网络流量,并将其保存为TraceFile文件,再依据此文件将流量复现在仿真网络或者孪生网络中。此类方法虽能精确复现一段时间内目标网络的流量,但无法达到实时性复现的要求。第二种方法是基于目标网络历史流量数据训练(统计、机器学习、深度学习)模型,通过得到的模型预测目标网络未来流量大小,基于此实现仿真网络或孪生网络中的流量复现。此种方法虽牺牲了一定的流量精度,但能较好地满足网络流量孪生和同步的实时性要求。目前,流量预测方法可分为如下两类:
[0004]1)第一类方法:基于线性模型进行网络流量预测;
[0005]2)第二类方法:基于非线性模型进行网络流量预测。
[0006]一方面,第一类方法包括自回归模型、移动平均模型、自回归合成移动平均模型等。适用于短期内网络节点所产生流量的预测,难以采用方法一构建能够准确预测多个网络节点所产生的复杂业务应用流量的综合模型。另一方面,第二类方法包括小波模型、回归分数整合滑动平均模型以及机器学习领域的支持向量机、人工神经网络模型等,能够对网络流量的自相关性,实现对长期流量的预测,但通常无法实现短期流量预测的高逼真度要求。随着近年来深度学习技术的发展,基于深度神经网络模型实现对目标网络流量进行预测,能够达到较好的精确度,逐渐受到相关研究领域的关注。特别是基于循环神经网络(RNN)模型,长短期记忆(LSTM)网络模型的网络流量预测方法已经能够实现对网络链路流量的准确预测。但是,上述基于深度学习的方法通常仅实现了对目标网络链路时间维度的流量预测,无法捕捉目标网络多条链路的空间特征,且通常无法对目标网络中所有链路流量及其空间联系同时进行预测。
[0007]局域网是典型的目标网络中数量最多且流量最为复杂的重要组成部分,因此,在网络仿真和网络孪生应用中,为实现对全网流量准确、实时复现,需进一步研究基于深度学
习的局域网流量精准预测理论方法和实现技术,以有效提升局域网仿真和孪生的逼真度。

技术实现思路

[0008]针对基于传统线性模型和非线性模型的目标网络流量预测方法普遍存在的预测精确度不高、无法同时对目标网络流量空间特征进行预测、无法通过单个模型预测目标网络所有链路流量等问题,本专利技术提出一种基于改进ConvLSTM深度学习模型的局域网流量预测方法。通过在模型中加入类残差结构模块(下文简称RES模板)和基于注意力机制的Squeeze

and

Excitation模块(下文简称SE模块)以最终达到准确、快速仿真和孪生目标网络链路流量的目的。
[0009]本专利技术的技术方案是这样实现的:一种基于改进ConvLSTM深度学习模型的局域网链路流量预测方法,首先设定目标局域网有N个三层节点,其中包括N
c
个客户机节点,N
s
个服务器节点和N
r
个路由器节点;该方法包括以下步骤:
[0010]步骤1:采集局域网流量矩阵序列,并对初始矩阵序列做等间距平均;
[0011]步骤1.1:采集目标网络所有链路的流量,每秒对到达N个采样节点的出入流量进行统计,得到t时刻的流量数据:
[0012][0013]其中:
[0014]D
t
∈R
N
×
N
[0015]元素表示t时刻i节点发往j节点的流量大小,T表示采样总时刻;
[0016]步骤1.2:采集K天的数据,由于局域网流量数据的波动性,对采集数据进行在间隔S
S
内平均,则可知流量序列长度T=(24
×
60
×
60
×
K)/S
S

[0017]步骤2:目标网络流量矩阵转换,将N
×
N的点对点流量矩阵重塑成服务器节点对用户节点的M
×
N的模式流量矩阵;其中M是用户与服务器传输数据的上下行链路数目,即对于N
c
个客户机节点,N
s
个服务器节点和N
r
个路由器节点,M=(N
s
+N
r
)
×
2;转换后流量矩阵如下:
[0018][0019]其中:
[0020]步骤3:对步骤2得到的转换后流量矩阵进行归一化,归一化后加快了梯度下降求最优解的速度,提高预测精度;归一化公式表示为:
[0021][0022]其中:d
max
和d
min
表示D

t
所有时刻的最大值和最小值,表示归一化后的值,归
一化后的流量矩阵表示为D
*t

[0023]步骤4:为防止模型过拟合,损失函数Loss定义为预测的流量矩阵与实际流量矩阵的均方误差加上ε倍的流量矩阵预测每个元素的预测误差的均方差,为:
[0024][0025][0026][0027]其中,ε为可调超参数,是流量矩阵D
*t
中真实值的预测值;
[0028]步骤5:以步骤2得到的模式流量矩阵序列,利用SE

ConvLSTM

Res模型进行时间特征与空间特征信息的提取,SE

ConvLSTM

Res模型包括:Res模块、SE模块和ConvLSTM模块;
[0029]步骤5.1:Res模块运算具体流程为:
[0030]步骤5.1.1:对流量矩阵D
*t
进行拆分:
[0031][0032]其中其中的元素n表示拆分后的元素矩阵总个数;
[0033]步骤5.1.2:对的元素分别与卷积核为2x2的卷积神经网络进行特征提取之后再合并,最后与SE模块本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进ConvLSTM深度学习模型的局域网链路流量预测方法,首先设定目标局域网有N个三层节点,其中包括N
c
个客户机节点,N
s
个服务器节点和N
r
个路由器节点;该方法包括以下步骤:步骤1:采集局域网流量矩阵序列,并对初始矩阵序列做等间距平均;步骤1.1:采集目标网络所有链路的流量,每秒对到达N个采样节点的出入流量进行统计,得到t时刻的流量数据:其中:D
t
∈R
N
×
N
元素表示t时刻i节点发往j节点的流量大小,T表示采样总时刻;步骤1.2:采集K天的数据,由于局域网流量数据的波动性,对采集数据进行在间隔S
S
内平均,则可知流量序列长度T=(24
×
60
×
60
×
K)/S
S
;步骤2:目标网络流量矩阵转换,将N
×
N的点对点流量矩阵重塑成服务器节点对用户节点的M
×
N的模式流量矩阵;其中M是用户与服务器传输数据的上下行链路数目,即对于N
c
个客户机节点,N
s
个服务器节点和N
r
个路由器节点,M=(N
s
+N
r
)
×
2;转换后流量矩阵如下:其中:步骤3:对步骤2得到的转换后流量矩阵进行归一化,归一化后加快了梯度下降求最优解的速度,提高预测精度;归一化公式表示为:其中:d
max
和d
min
表示D

t
所有时刻的最大值和最小值,表示归一化后的值,归一化后的流量矩阵表示为D
*t
;步骤4:为防止模型过拟合,损失函数Loss定义为预测的流量矩阵与实际流量矩阵的均方误差加上ε倍的流量矩阵预测每个元素的预测误差的均方差,为:方误差加上ε倍的流量矩阵预测每个元素的预测误差的均方差,为:
其中,ε为可调超参数,是流量矩阵D
*t
中真实值的预测值;步骤5:以步骤2得到的模式流量矩阵序列,利用SE

ConvLSTM

Res模型进行时间特征与空间特征信息的提取,SE

ConvLSTM

Res模型包括:Res模块、SE模块和ConvLSTM模块;步骤5.1:Res模块运算具体流程为:步骤5.1.1:对流量矩阵D
*t
进行拆分:其中其中的元素n表示拆分后的元素矩阵总个数;步骤5.1.2:对的元素分别与卷积核为2x2的卷积神经网络进行特征提取之后再合并,最后与SE模块的输出相加,过程为:其中,O
RES
为Res模块的输出,ε为可调参数,ω
k
表示卷积神经网络第k层的权重,b
k
表示卷积神经网络的偏差系数;步骤5.2:所述SE模块主要由压缩运算与激励运算组成,具体流程为:步骤5.2.1:压缩运算是由全局平均池化实现,全局平均池化将空间特征进行整体平均压缩为一个全局特征,但保留其通道的信息即时间特征:其中z∈R
C
,C表示通道,z为得到的整个时间序列,为到第j个节点的第i条链路的元素;步骤5.2.2:激励运算是为了捕捉通道之间的非线性关系;通过激活函数与全连接层实现,经过两个全连接层的降维与升维,利用sigmoid的门机制将捕获的通道信息映射到(0,1)之间:s=σ(ω2⊙
ReLU(ω1⊙
z))其中,s表示通道间的门激活值,ω1为全连接FC1层的权重,ω2为全连接FC2层的权重,σ为sigmoid激活函数,ReLU为激活函数;最后将学习到的通道间的门激活值,与x
c
相乘,得到SE模块的输出为时间通道权重...

【专利技术属性】
技术研发人员:陈智勇朱俊宏马万艺赖俊宇余长江皮昌洪
申请(专利权)人:重庆慧发网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1