基于分布式聚类的网络流量时间序列预测方法技术

技术编号:16038694 阅读:146 留言:0更新日期:2017-08-19 20:33
本发明专利技术公开了一种基于分布式聚类的网络流量时间序列预测方法。该方法基于聚类的时序预测方法融合了分布式聚类算法和自回归模型,通过对时序数据进行分片处理获得时间片元组,并将时间片元组使用分布式K‑平均算法(k‑means)聚类算法进行分布式聚类处理,对聚类结果中的每个簇进行正态分布拟合而获得了正态分布N(μ,σ

【技术实现步骤摘要】
基于分布式聚类的网络流量时间序列预测方法
本专利技术涉及网络流量监控
,具体涉及基于分布式聚类的网络流量时间序列预测方法。
技术介绍
在网络流量监控领域中,对网络流量时序数据进行分析和预测非常重要。目前已有的解决方案包括差分移动平均自回归模型(AutoregressiveIntegratedMovingAveragemodel),多层感知器(MultilayerPerceptron),时间递归神经网络(RecurrentNeuralNetwork),长短期记忆人工神经网络(Long-ShortTermMemory),基于聚类时序预测等技术作为可能的解决方案已经有大量的研究。从使用成本、精度、能耗以及可扩展性进行比较和衡量,我们可以分析得到基于聚类的时序预测方法在线上环境具有更好的优越性,聚类方法是数据挖掘中的一个重要的领域,聚类方法极易扩展到分布式系统上,能够成为低成本高效率的优选方案。主流的时序预测算法包括差分移动平均自回归模型,多层感知器,时间递归神经网络,长短期记忆人工神经网络等技术。这些主流技术在用于时序数据平缓,上升下降稳定的情况下效果较好,在分析预测波动较大,随机性本文档来自技高网...
基于分布式聚类的网络流量时间序列预测方法

【技术保护点】
一种基于分布式聚类的网络流量时序预测方法,其特征在于训练阶段中分布式地将时间序列训练集数据进行预处理,划分成定长的时间片元组,使用K‑平均算法聚类算法将时间片元组进行聚类,将聚类结果进行正态拟合得到正态分布N(μ,σ

【技术特征摘要】
1.一种基于分布式聚类的网络流量时序预测方法,其特征在于训练阶段中分布式地将时间序列训练集数据进行预处理,划分成定长的时间片元组,使用K-平均算法聚类算法将时间片元组进行聚类,将聚类结果进行正态拟合得到正态分布N(μ,σ2);接着在预测阶段中分布式地将待预测的时间序列数据进行处理而得到待预测的时间序列前缀元组,使用欧式距离公式得到前缀元组在聚类结果中最近的聚类中心μ,即是网络流量的初步估计预测值,根据自回归(AR)模型对聚类中心μ进行修正获得最终的预测值。2.根据权利要求1所述的基于分布式聚类的网络流量时序预测方法,其特征在于对网络流量时序数据的训练阶段的预处理,根据给定的元组的长度参数,将时序数据进行划分为定长的时间片,时间片以多元组的形式<t1,t2,…tn>进行保存,并将每个时间片元组对应的下一个时间点的值,记为target,将时间片多元组和对应的tar...

【专利技术属性】
技术研发人员:刘发贵余信威
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1