网络信息的云聚类提取方法技术

技术编号:8489844 阅读:275 留言:0更新日期:2013-03-28 11:57
本发明专利技术提供了一种网络信息的云聚类提取方法,分布式文件系统进行文件写入、数据存储及访问网络信息;SOM、Kmeans聚类算法与云计算的计算模型Map/Reduce进行无缝结合,得到基于云计算的Map/Reduce化的SOM、Kmeans聚类算法,JobTracker负责整个Map/Reduce的控制工作,空闲的TaskTracker来分配这些Map任务或者Reduce任务;TaskTracker执行从JobTracker发来的指令并同时处理Map和Reduce阶段之间数据的移动,每个TaskTracker节点会周期性的报告完成的工作和状态的更新,若其中一个TaskTracker节点保持沉默超过一个预设的时间间隔,则JobTracker记录下这个节点状态为死亡,并把分配给这个节点的数据发到别的节点。本发明专利技术具有良好的特征提取性能,解决现有的网络流量时间序列分析和预测算法中主观性太强的缺点。

【技术实现步骤摘要】

【技术保护点】
一种网络信息的云聚类提取方法,其特征在于,该方法主要包括以下步骤:步骤a:利用分布式文件系统进行文件写入、数据存储及访问网络信息,该分布式文件系统包括一个主节点以及若干个子节点,主节点用以存储该分布式文件系统的元数据,所述元数据包括文件系统的名字空间以及管理文件的存储,所述子节点用以存放数据,由客户端直接与各子节点建立数据通信;步骤b:利用SOM、Kmeans聚类算法与云计算的计算模型Map/Reduce进行无缝结合,得到基于云计算的Map/Reduce化的SOM、Kmeans聚类算法,其采用JobTracker/TaskTrackers的结构实现Map/Reduce计算模式,JobTracker负责整个Map/Reduce的控制工作,首先选择空闲的TaskTracker来分配这些Map任务或者Reduce任务,TaskTracker执行从JobTracker发出的指令并同时处理Map和Reduce阶段之间数据的移动,每个TaskTracker节点会周期性的报告完成的工作及状态的更新,若其中一个TaskTracker节点保持沉默超过一个预设的时间间隔,则JobTracker将这个节点状态记录为死亡,并把分配给这个节点的数据发到别的节点。...

【技术特征摘要】

【专利技术属性】
技术研发人员:吕威
申请(专利权)人:北京师范大学珠海分校
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1