网络流量分析与预测方法和装置制造方法及图纸

技术编号:9955539 阅读:150 留言:0更新日期:2014-04-23 11:52
本发明专利技术公开了一种网络流量分析与预测方法和装置,先提取各个待测基站的流量时间序列的全局特征;然后根据所提取的全局特征进行聚类;再根据所聚类的结果,采集流量数据的属性特征;最后根据所述流量数据的属性特征和上一时刻的流量,进行流量预测。本发明专利技术提取时间序列的全局特征,用全局特征相似性来反映时间序列的相似性,抓住时间序列随时间变化的动态特征,得到更为合理的结果,同时通过用少量特征来描述大型时间序列,提高判定相似结果的稳健性,降低聚类计算过程中的复杂度;根据聚类结果采集与流量数据相关的各种属性特征,根据流量和属性特征共同预测流量数据,预测的信息量大,相应地提高了预测精度,对网络进行合理的资源配置。

【技术实现步骤摘要】
网络流量分析与预测方法和装置
本专利技术涉及通信
,特别是涉及一种网络流量分析与预测方法和装置。
技术介绍
在通信网络优化中,网络流量分析与预测是非常重要的环节,对网络资源的优化配置具有重要意义。流量预测准确与否,预测结果的可解释性以及预测结果与实际流量数据是否相符,都直接影响网络的投资和建设规模,而对流量的前期分析是流量预测的关键,直接影响着流量预测的准确性。现有技术中利用原始时间序列对流量进行分析,采用欧式距离度量时间序列之间的相似性,然后根据此相似性进行聚类;同时,预测流量时使用历史流量数据来预测未知流量数据,采用传统的回归预测法、时间序列分析等。现有方法只重视时间序列在对应时点上取值的差异;采用欧氏距离度量时间序列之间的相似性,从而导致结果易受到个别时点上取值的影响,丧失了结果的稳健性;只利用了流量数据,从而导致预测的结果性能较差。
技术实现思路
基于上述情况,本专利技术提出了一种网络流量分析与预测方法,能够提高预测精度,对网络进行合理的资源配置。为了实现上述目的,本专利技术的技术方案为:一种网络流量分析与预测方法,包括以下步骤:提取各个待测基站的流量时间序列的全局特征;根据所提取的全局特征进行聚类;根据所聚类的结果,采集流量数据的属性特征;根据所述流量数据的属性特征和上一时刻的流量,进行流量预测。针对现有技术问题,本专利技术还提出了一种网络流量分析与预测装置,改善现有流量分析稳健性差,流量预测精度低的问题,适合实际应用。具体实现方式为:一种网络流量分析与预测装置,包括:提取模块,用于提取各个待测基站的流量时间序列的全局特征;聚类模块,用于根据所提取的全局特征进行聚类;采集模块,用于根据所聚类的结果,采集流量数据的属性特征;预测模块,用于根据所述流量数据的属性特征和上一时刻的流量,进行流量预测。与现有技术相比,本专利技术的有益效果为:本专利技术网络流量分析与预测方法和装置,先提取各个待测基站的流量时间序列的全局特征;然后根据所提取的全局特征进行聚类;再根据所聚类的结果,采集流量数据的属性特征;最后根据所述流量数据的属性特征和上一时刻的流量,进行流量预测。使用本专利技术的技术后,提取时间序列的全局特征,用全局特征相似性来反映时间序列的相似性,抓住时间序列随时间变化的动态特征,得到更为合理的结果,同时通过用少量特征来描述大型时间序列,提高判定相似结果的稳健性,降低聚类计算过程中的复杂度;根据聚类结果采集与流量数据相关的各种属性特征,根据流量和属性特征共同预测流量数据,预测的信息量大,相应地提高了预测精度,对网络进行合理的资源配置。附图说明图1为一个实施例中网络流量分析与预测方法的流程示意图;图2为一个实施例中网络流量分析与预测装置的结构示意图。具体实施方式为使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本专利技术,并不限定本专利技术的保护范围。一个实施例中网络流量分析与预测方法,如图1所示,所述方法包括:步骤S101:提取各个待测基站的流量时间序列的全局特征;步骤S102:根据所提取的全局特征进行聚类;步骤S103:根据所聚类的结果,采集流量数据的属性特征;步骤S104:根据所述流量数据的属性特征和上一时刻的流量,进行流量预测。从以上描述可知,本方法根据流量和属性特征共同预测流量数据,提高网络流量预测精度,对网络进行合理的资源配置。作为一个实施例,所述全局特征包括趋势性特征或季节性特征或峰度特征或偏度特征或自相关系数特征或非线性特征或频谱特征中任一项或多项。作为一个实施例,所述流量时间序列通过按天采集各个待测基站的流量数据,连续采集半年得到。作为一个实施例,所述趋势性特征通过Z统计量来衡量,Z统计量大于零,为上升趋势;Z统计量小于零,为下降趋势;Z统计量的计算公式为:其中S为服从正态分布的统计量,Var(S)为S的方差,S的计算公式为:Var(S)的计算公式为:Var(S)=T(T-1)(2T+5)/18;流量时间序列xt,t=1,2,…T,T为流量时间序列的长度,xj为流量时间序列在j时刻的值,xk为流量时间序列在k时刻的值,符号函数sgn(xj-xk)的计算公式为:所述季节性特征通过平均周期反映,平均周期的计算步骤为:对流量时间序列xt进行快速傅立叶变换,即FFT变换,t=1,2,…T,T为流量时间序列的长度,得到:其中用到的频率为:进一步计算平均频率为:计算平均周期为:所述峰度特征中峰度的计算公式为:其中xt为流量时间序列,t=1,2,…T,T为流量时间序列的长度,为流量时间序列的均值,σ为流量时间序列的样本标准差;所述偏度特征中偏度的计算公式为:其中xt为流量时间序列,t=1,2,…T,T为流量时间序列的长度,为流量时间序列的均值,σ为流量时间序列的样本标准差;所述自相关系数特征用Ljung-Box-Q统计量来衡量,Ljung-Box-Q统计量检测流量时间序列是否为白噪声过程,Ljung-Box-Q统计量的计算公式为:其中T为流量时间序列的长度,p为被考虑的最大滞后阶数,τ为滞后期数,rτ为流量时间序列的自相关系数;rτ的计算公式为:其中xt为流量时间序列,t=1,2,…T,为流量时间序列的均值;所述非线性特征通过BDS检验统计量来反映,BDS检验统计量检测流量时间序列是否为独立同分布,对于流量时间序列xt,t=1,2,…T,时刻s,w的观察值为xs和xw,则所有的观察值(xs,xw)按对构建为:{(xs,xw),(xs+1,xw+1),(xs+2,xw+2),…(xs+m-1,xw+m-1)},其中m是嵌入区间;BDS统计量的计算公式为:其中r为区间大小,C(N,m,r)为相关积分,σ′(N,m,r)为C(N,m,r)-C(N,1,r)m的渐进标准差的估计;C(N,m,r)计算公式为:其中均是m维向量,所述频谱特征为提取的离散傅立叶变换的前二阶系数,频谱特征的提取采用离散傅立叶变换系数,可以提取前n阶系数作为频谱特征,因为一个信号的高频部分并不重要,因此频域空间的大部分能量集中在前几个系数上。作为一个实施例,所述趋势性特征利用线性趋势法得到,采用线性趋势法分离出时间序列的趋势成分,并用线性函数的斜率项作为该时间序列的趋势特征,即建立时间序列xt,t=1,2,…T关于时间t的一元回归模型,xt=α+βt+εt,其中α是截距,β是斜率,ε是误差,β的最小二乘估计为:其中T表示流量时间序列的长度;所述季节性特征利用H-P滤波法得到,通过计算最小化时间序列xt和趋势值yt之间的差值来估计趋势成分:其中,T是流量时间序列的长度,λ是对趋势成分波动的惩罚因子,由此可得周期成分:其中,L是滞后算子,当Ct出现明显的峰值,可以判断时间序列xt具有周期波动成分,峰值所对应的周期即为该时间序列的周期长度;所述非线性特征采用McLeod-Li-检验或Bispectral检验或RESET检验或F检验或神经网络非线性检验统计量来反映。不排除还有其它方法可以得到上述全局特征。作为一个实施例,所述聚类包括Kmeans聚类,将所提取的全局特征作为新的特征向量,各个待测基站的流量时间序列对应一个新的特征向量,对新的特征向量进行K-means聚类。本文档来自技高网...
网络流量分析与预测方法和装置

【技术保护点】
一种网络流量分析与预测方法,其特征在于,包括以下步骤:提取各个待测基站的流量时间序列的全局特征;根据所提取的全局特征进行聚类;根据所聚类的结果,采集流量数据的属性特征;根据所述流量数据的属性特征和上一时刻的流量,进行流量预测。

【技术特征摘要】
1.一种网络流量分析与预测方法,其特征在于,包括以下步骤:提取各个待测基站的流量时间序列的全局特征,所述全局特征包括趋势性特征或季节性特征或峰度特征或偏度特征或自相关系数特征或非线性特征或频谱特征中任一项或多项;根据所提取的全局特征进行聚类;根据所聚类的结果,采集流量数据的属性特征;根据所述流量数据的属性特征和上一时刻的流量,进行流量预测;所述根据所聚类的结果,采集流量数据的属性特征,包括:对聚类后的每一类基站数据根据其特征选择与流量数据相关的属性特征,所述属性特征包括ARPU值、3G渗透率和/或总用户数。2.根据权利要求1所述的网络流量分析与预测方法,其特征在于,所述流量时间序列通过按天采集各个待测基站的流量数据,连续采集半年得到。3.根据权利要求1所述的网络流量分析与预测方法,其特征在于,所述趋势性特征通过Z统计量来衡量,Z统计量的计算公式为:其中S为服从正态分布的统计量,Var(S)为S的方差,S的计算公式为:Var(S)的计算公式为:Var(S)=T(T-1)(2T+5)/18;流量时间序列xt,t=1,2,…T,T为流量时间序列的长度,xj为流量时间序列在j时刻的值,xk为流量时间序列在k时刻的值,符号函数sgn(xj-xk)的计算公式为:所述季节性特征通过平均周期反映,平均周期的计算步骤为:对流量时间序列xt进行快速傅立叶变换,即FFT变换,t=1,2,…T,T为流量时间序列的长度,得到:其中用到的频率为:进一步计算平均频率为:计算平均周期为:所述峰度特征中峰度的计算公式为:其中xt为流量时间序列,t=1,2,…T,T为流量时间序列的长度,为流量时间序列的均值,σ为流量时间序列的样本标准差;所述偏度特征中偏度的计算公式为:其中xt为流量时间序列,t=1,2,…T,T为流量时间序列的长度,为流量时间序列的均值,σ为流量时间序列的样本标准差;所述自相关系数特征用Ljung-Box-Q统计量来衡量,Ljung-Box-Q统计量的计算公式为:其中T为流量时间序列的长度,p为被考虑的最大滞后阶数,τ为滞后期数,rτ为流量时间序列的自相关系数;rτ的计算公式为:其中xt为流量时间序列,t=1,2,…T,为流量时间序列的均值;所述非线性特征通过BDS检验统计量来反映,对于流量时间序列xt,t=1,2,…T,时刻s,w的观察值为xs和xw,则所有的观察值(xs,xw)按对构建为:{(xs,xw),(xs+1,xw+1),(xs+2,xw+2),…(xs+m-1,xw+m-1)},其中m是嵌入区间;BDS统计量的计算公式为:其中r为区间大小,C(N,m,r)为相关积分,σ′(N,m,r)为C(N,m,r)-C(N,1,r)m的渐进标准差的估计;C(N,m,r)计算公式为:其中均是m维向量,所述频谱特征为提取的离散傅立叶变换的前二阶系数。4.根据权利要求1所述的网络流量分析与预测方法,其特征在于,所述聚类包括Kmeans聚类,将所提取的全局特征作为新的特征向量,各个待测基站的流量时间序列对应一个新的特征向量,对新的特征向量进行K-means聚类。5.一种网络流量分析与预测...

【专利技术属性】
技术研发人员:杜翠凤陆蕊蒋仕宝
申请(专利权)人:广州杰赛科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1