一种网络流量预测方法、系统、介质、设备及终端技术方案

技术编号:37988813 阅读:9 留言:0更新日期:2023-06-30 10:03
本发明专利技术属于网络流量预测技术领域,公开了一种网络流量预测方法、系统、介质、设备及终端,获取历史网络流量数据以及相关特征数据并对数据进行预处理,得到本征模函数和残余子序列;计算分解后的子序列的样本熵,分别利用LSTM模型和ARIMA模型对本征模函数进行建模,对ARIMA模型和LSTM模型预测后的数据进行重构;构建基于扩张因果卷积的Transformer网络流量预测模型并进行训练,利用训练好的混合模型训练和预测新的数据,得到网络流量的预测值。本发明专利技术将基于统计的模型与基于机器学习的模型相结合,基于扩张因果卷积,提升了网络流量的预测精确值,加强表征网络流量数据之间的时间相关性,增强长周期的特征捕获。增强长周期的特征捕获。增强长周期的特征捕获。

【技术实现步骤摘要】
一种网络流量预测方法、系统、介质、设备及终端


[0001]本专利技术属于网络流量预测
,尤其涉及一种网络流量预测方法、系统、介质、设备及终端。

技术介绍

[0002]目前,随着互联网的发展,如今将迎来物联网时代。物联网是一个新兴领域,有望实现无处不在的互联网连接,将普通的物体变成联网的设备。物联网范式正在改变人们与周遭事物交流的方式,它为创建广泛连接的基础设施以支持创新服务铺平了道路,并承诺更好的灵活性和效率。但是物联网技术的不断进步也带来了一些亟待解决的技术难题,比如接入设备的规模逐渐扩大使得网络变得越来越拥挤,虽然可以通过提高通信线路的带宽,比如使用光纤通信,但是随着物联网规模的扩大,这种方法的代价将巨大。更好的方法是通过设计网络流量的调度算法,如果可以提前获得网络流量的预测值,服务器端就可以引导终端设备均衡使用各路线路,因此网络流量的预测至关重要。
[0003]现如今物联网已经渗入到人们生活的方方面面,无线网络通信技术的发展与人们的生活息息相关,网络流量数据在一定程度上反映了当地人们的生活习惯,其中包含了海量的信息。网络流量预测对于大规模网络容量规划、网络设备设计、网络资源管理及用户行为调节等都有积极意义。流量预测技术,是指根据所检测到的历史数据,通过建立适当的流量模型,对将来的流量数据进行预测。由预测的结果可以得到将来流量的大致趋势,如果给定一个阈值,当预测的结果超出给定阈值时就发出预警,从而网络管理人员可以事先查看网络状态,可以发现潜在的攻击和入侵行为,实现网络入侵检测。通过对网络流量进行预测,可以了解网络之间的流量情况及趋势,从而更有效地进行网络优化,更好地进行路由设计和负载均衡的设计;通过对网络流量进行预测,可以决定网络拥塞控制,降低因网络拥塞带来的信息丢失和延迟,充分利用网络资源,提高服务质量;通过网络流量进行预测,使网络恶意攻击提前告警成为可能。
[0004]然而由于接入物联网的终端设备数量巨大,物联网中的网络流量数据具有更加复杂的特征,包含更加复杂的信息,网络流量具有突变、弱耦合和非线性的特点。因此,无论是单一的线性模型还是非线性模型都不能很好地描述网络流量的特性和变化规律。准确分析网络流量中的线性和非线性因素是提高网络流量预测精度的关键。由于单一模型揭示网络流量中线性和非线性关系的能力有限,因此可以将这两种模型结合起来提取网络流量预测中的线性和非线性关系,提高数据的预测精度。网络流量数据预测精度的提升对网络运营管理、资源分配、路径规划、网络拥塞控制以及预防网络攻击方面都有重要的意义。
[0005]网络流量的预测在近几年是一个计算机网络界非常关注的重要问题。自回归差分移动平均模型(ARIMA)和长短期记忆神经网络一直以来都在网络流量预测研究领域受到研究人员的广泛关注。经验模态分解(EMD)自1998年被提出以来,被大量的投入到各个领域的研究中。2021年苗田等人提出了一种利用经验模式分解对网络流量进行建模,并利用改进的自回归滑动平均模型(ARMA)对网络流量进行预测的方法,他们提出了一个优化函数来减
少网络流量模型的预测误差,结果证明提出方案的可行性。SimaSiami

Namini等人对比了ARIMA模型和LSTM模型的性能和效率。实证研究表明,基于深度学习的算法(如LSTM)优于基于ARIMA模型的传统算法。更具体地说,与ARIMA相比,LSTM获得的错误率平均减少84~87%,表明LSTM优于ARIMA。但是仅使用LSTM模型对网络流量数据进行预测,网络流量数据中现有的线性结构将被浪费。
[0006]流量预测的目标是通过从历史数据中推导出时空模式来预测未来时间的流量。在深度学习时代之前,流量预测一直严重依赖于时间序列分析的方法。传统的统计方法,如自回归综合移动平均(ARIMA)、卡尔曼滤波和矢量自回归(VAR)模型被广泛应用于流量预测,虽然他们模型简单易用,但是传统的基于统计的方法在处理非线性数据方面的不足限制了模型的性能。网络流量数据突变、弱耦合和非线性的特点一度是难以解决的问题。近期,基于深度学习的方法在网络流量的预测方面显示出显著优势。然而,现有的方法仍然存在长期和短期时间依赖性测量不全面的问题。比如大部分深度学习模型在预测时长过长时,会出现模型预测失效的问题。此外,越来越多接入网络的设备具有移动的属性,网络拓扑的变化使得流量数据显现出明显的空间特征,而现有方法没有考虑到空间特征带来的影响。因此,亟需设计一种网络流量预测方法。
[0007]通过上述分析,现有技术存在的问题及缺陷为:
[0008](1)由于接入物联网的终端设备数量巨大,无论是单一的线性模型还是非线性模型都不能很好地描述网络流量的特性和变化规律。
[0009](2)现有技术中,仅使用基于深度学习的算法LSTM模型对网络流量数据进行预测,网络流量数据中现有的线性结构将被浪费。
[0010](3)传统基于统计的方法在处理非线性数据方面的不足限制了模型的性能。
[0011](4)现有的预测方法仍然存在长期和短期时间依赖性测量不全面的问题。
[0012](5)网络拓扑的变化使得流量数据产生明显的空间特征,现有方法没有考虑到空间特征带来的影响。

技术实现思路

[0013]针对现有技术存在的问题,本专利技术提供了一种网络流量预测方法、系统、介质、设备及终端,尤其涉及一种基于扩张因果卷积和ARIMA

LSTM的Transformer网络流量预测方法、系统、介质、设备及终端。
[0014]本专利技术是这样实现的,一种网络流量预测方法,网络流量预测方法包括:获取历史网络流量数据以及相关特征数据并对数据进行预处理,得到本征模函数和残余子序列;计算分解后的子序列的样本熵,分别利用LSTM模型和ARIMA模型对本征模函数进行建模,并对ARIMA模型和LSTM模型预测后的数据进行重构;构建基于扩张因果卷积的Transformer网络流量预测模型并进行训练,利用训练好的混合模型对新的数据进行训练和预测,得到网络流量的预测值。
[0015]进一步,网络流量预测方法包括以下步骤:
[0016]步骤一,针对具有多个终端节点的目标网络,获取历史网络流量数据以及相关特征数据,构建网络流量特征矩阵作为模型输入;
[0017]步骤二,利用经验模式分解对获取的数据进行预处理,得到多个本征模函数和一
个残余子序列,并分别计算分解后的各个子序列的样本熵;
[0018]步骤三,使用LSTM模型对样本熵较高的本征模函数进行建模,并使用ARIMA模型对样本熵较低的本征模函数以及残余子序列进行建模;
[0019]步骤四,计算目标节点和其他节点时间序列的相关系数,表示节点之间的空间影响程度,并构建基于扩张因果卷积的Transformer网络流量预测模型;
[0020]步骤五,训练基于扩张因果卷积的Transformer网络流量预测模型,并对ARIMA模型和LSTM模型预测后的数据进行重构;
[0021]步本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网络流量预测方法,其特征在于,网络流量预测方法包括:获取历史网络流量数据以及相关特征数据并对数据进行预处理,得到本征模函数和残余子序列;计算分解后的子序列的样本熵,分别利用LSTM模型和ARIMA模型对本征模函数进行建模,并对ARIMA模型和LSTM模型预测后的数据进行重构;构建基于扩张因果卷积的Transformer网络流量预测模型并进行训练,利用训练好的混合模型对新的数据进行训练和预测,得到网络流量的预测值。2.如权利要求1所述的网络流量预测方法,其特征在于,网络流量预测方法包括以下步骤:步骤一,针对具有多个终端节点的目标网络,获取历史网络流量数据以及相关特征数据,构建网络流量特征矩阵作为模型输入;步骤二,利用经验模式分解对获取的数据进行预处理,得到多个本征模函数和一个残余子序列,并分别计算分解后的各个子序列的样本熵;步骤三,使用LSTM模型对样本熵较高的本征模函数进行建模,并使用ARIMA模型对样本熵较低的本征模函数以及残余子序列进行建模;步骤四,计算目标节点和其他节点时间序列的相关系数,表示节点之间的空间影响程度,并构建基于扩张因果卷积的Transformer网络流量预测模型;步骤五,训练基于扩张因果卷积的Transformer网络流量预测模型,并对ARIMA模型和LSTM模型预测后的数据进行重构;步骤六,使用训练好的混合模型预测新的数据,得到网络流量的预测值。3.如权利要求2所述的网络流量预测方法,其特征在于,步骤一中的针对具有多个终端节点的目标网络,获取历史网络流量数据以及相关特征数据,构建网络流量特征矩阵作为模型输入包括:(1)针对具有多个终端节点的目标网络,获取历史网络流量数据,包括源IP地址、目的IP地址、传输层协议、源端口和口的端口;获取相关特征数据,包括需求带宽、实际带宽和连接的终端数;(2)将获取的数据构建为特征矩阵,特征矩阵表示为:其中,N表示为目标网络中的节点数,T表示为时间步长数,M表示为网络流量相关特征;(3)将处理好的数据按照7:1:2的比例划分为训练集、验证集以及测试集,训练集用于构建所述模型框架,验证集用于得到所述最优参数,测试集用于评估所述流量预测模型的精度。4.如权利要求2所述的网络流量预测方法,其特征在于,步骤二中的利用经验模式分解对获取的数据进行预处理包括:经验模式分解将采集的网络流量数据分解成包含原信号的不同时间尺度的局部特征信号;其中,局部特征信号为本征模函数,处理后的数据包括许多个本征模函数以及一个残余子序列,具体处理过程为:(1)根据原始信号X(t)上下极值点,分别用三次样条曲线拟合出上、下包络线;(2)求上、下包络线的均值,画出均值包络线e
mean

(3)原始信号X(t)减均值包络线e
mean
,得到中间信号h
n
;(4)判断中间信号是否满足IMF的两个条件,如果满足,则信号为IMF分量;如果不满足,则以信号为基础,重新执行步骤(1)~(4)的分析,利用若干次的迭代获取IMF分量;(5)得到第一个IMF后,用原始信号减IMF1,作为新的原始信号;再通过步骤(1)~(4)的分析,得到IMF2;以此类推,当r
n
变为单调函数或小于预定义阈值时,筛选过程终止,完成EMD分解;分别计算分解后的各个子序列的样本熵包括:样本熵通过度量信号中产生新模式的概率大小来衡量时间序列复杂性,新模式产生的概率越大,则序列的复杂性越大,定义如下:其中,B
m
(r)是两个序列在相似容限r下匹配m个点的概率,A
m
(r)是两个序列匹配m+1个点的概率。5.如权利要求2所述的网络流量预测方法,其特征在于,步骤三中的使用LSTM模型对样本熵较高的本征模函数进行建模,使用ARIMA模型对样本熵较低的本征模函数以及残余子序列进行建模包括:(1)整个神经网络分为输入层、循环层和全连接层三层,全连接层同时作为输出层;神经网络的训练由多个迭代组成,每个迭代中均进行正向传播和反向传播两个步骤;(2)在循环层的正向传播过程中,使用当前时间步骤的输入和上个时间步骤的输出进行运算,得出当前时间步骤的输出,用于建模输入与输出之间的关系,以及输出之间的历史相关性;其中,循环层的正向传播过程如下:f
(t)
=σ(w
f
x
(t)
+u
f
h
(t

1)
+b
f
);i
(t)
=σ(w
i
x
(t)
+u
i
h
(t

1)
+b
i
););o
(t)
=σ(w
o
x
(t)
+u
o
h
(t

1)
+b
o
);h
(t)
=o
(t)
*C
(t)<...

【专利技术属性】
技术研发人员:王建东李紫微董学文章璋赵双睿刘力琳李云豆张日琪薛天琳
申请(专利权)人:西安电子科技大学青岛计算技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1