【技术实现步骤摘要】
集群控制方法和集群控制设备
本专利技术涉及集群控制领域,更具体地说,涉及能够监控集群运行健康状况的集群控制方法和集群控制设备。
技术介绍
集群是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高可用性和可缩放性。和传统的高性能计算机技术相比,集群技术可以利用各档次的服务器作为节点,系统造价低,可以实现很高的运算速度,完成大运算量的计算,具有较高的响应能力,能够满足当今日益增长的信息服务的需求。随着大数据的发展,对大数据提供底层支持的分布式运算和存储的集群的稳定性和性能获得了越来越多的关注。需要对集群运行时的信息进行实时监控,如发现异常情况,能够第一时间通知到相应的开发和运维人员进行处理,在用户还没有察觉之前处理完故障和异常,将损失降低到最低。然而,对于与这些机器对应的开发和运维人员来说,即便是每台机器登陆一次,登陆那么多台机器也难以实现,何况还需要进行系统指标的检查。因此,依靠人力不可能完成24小时不间断监控服务器的任务。因此,也诞生了许多进行集群监控的工具 ...
【技术保护点】
一种集群控制方法,应用于一计算机集群,所述方法包括:从日志文件中获取具有除最高优先级和最低优先级之外的中间优先级的错误日志消息以及与之对应的用户信息,其中,所述日志文件在所述计算机集群的任务运行过程中产生,所述日志文件包括具有不同优先级的错误日志消息;对所述中间优先级的错误日志消息以及与之对应的用户信息进行统计分析,以获取统计结果;以及输出所述统计结果。
【技术特征摘要】
1.一种集群控制方法,应用于一计算机集群,所述方法包括:从日志文件中获取具有除最高优先级和最低优先级之外的中间优先级的错误日志消息以及与之对应的用户信息,其中,所述日志文件在所述计算机集群的任务运行过程中产生,所述日志文件包括具有不同优先级的错误日志消息;对所述中间优先级的错误日志消息以及与之对应的用户信息进行统计分析,以获取统计结果;以及输出所述统计结果。2.根据权利要求1所述的集群控制方法,进一步包括:对所述中间优先级的错误日志消息以及与之对应的用户信息进行数据挖掘,以获得主题-关键词聚类;输出所述主题-关键词聚类结果。3.根据权利要求2所述的集群控制方法,其中通过潜在狄利克雷分布算法进行所述数据挖掘。4.根据权利要求1所述的集群控制方法,其中对所述中间优先级的错误日志消息以及与之对应的用户信息进行统计分析,以获取统计结果的步骤包括:统计如下信息中的至少一项:数量最多的出错信息、产生错误的操作、完成操作的用户信息、出现错误最多的用户信息。5.根据权利要求1所述的集群控制方法,其中输出所述统计结果包括:将所述统计结果以可视化图表的形式进行输出。6.一种集群控制设备,应用于一计算机集群,所述集群控制设备包括:处理器;以及存储器,用于在其上存储计算机程序,以便当由所述处理器执行所述计算机程序时,能够执行以下步骤:从所述日志...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。