一种监控集群的方法、装置、设备及可读介质制造方法及图纸

技术编号:35781316 阅读:10 留言:0更新日期:2022-12-01 14:26
本发明专利技术提供了一种监控集群的方法、装置、设备及可读介质,方法包括:在集群的节点中选择主管理节点,将集群中其余节点直接或间接连接到主管理节点以构建节点拓扑结构;采集每个节点的信息,并将采集到的信息汇总到主管理节点中;响应于主管理节点接收到各个节点汇总的信息,将接收到的信息与阈值进行比较;响应于接收到的信息大于阈值,发出相应的警告信息。通过使用本发明专利技术的方案,能够减少集群通信的开销,具有良好的可扩展性,能够快速发现并及时处理集群故障,提高整个集群系统的可用性,能够为集群的系统优化提供数据支持和分析依据。够为集群的系统优化提供数据支持和分析依据。够为集群的系统优化提供数据支持和分析依据。

【技术实现步骤摘要】
一种监控集群的方法、装置、设备及可读介质


[0001]本专利技术涉及计算机领域,并且更具体地涉及一种监控集群的方法、装置、设备及可读介质。

技术介绍

[0002]近年来,随着计算机技术的发展,使用集群构造超级计算机或者服务器成为一种流行趋势。集群的规模已从过去的几个节点扩展到数百甚至数千个节点。集群系统的监控管理变得越来越复杂,集群的管理和监控也越来越成为一项富有挑战性的工作。如何高效地监控集群并快速维护集群系统已成为集群管理者耗时而费力的工作。由于收集的集群监控信息庞大且未经处理,用户无法直观地从这些数据中获得优化集群系统的依据。

技术实现思路

[0003]有鉴于此,本专利技术实施例的目的在于提出一种监控集群的方法、装置、设备及可读介质,通过使用本专利技术的技术方案,能够减少集群通信的开销,具有良好的可扩展性,能够快速发现并及时处理集群故障,提高整个集群系统的可用性,能够为集群的系统优化提供数据支持和分析依据。
[0004]基于上述目的,本专利技术的实施例的一个方面提供了一种监控集群的方法,包括以下步骤:
[0005]在集群的节点中选择主管理节点,将集群中其余节点直接或间接连接到主管理节点以构建节点拓扑结构;
[0006]采集每个节点的信息,并将采集到的信息汇总到主管理节点中;
[0007]响应于主管理节点接收到各个节点汇总的信息,将接收到的信息与阈值进行比较;
[0008]响应于接收到的信息大于阈值,发出相应的警告信息。
[0009]根据本专利技术的一个实施例,在集群的节点中选择主管理节点,将集群中其余节点直接或间接连接到主管理节点以构建节点拓扑结构包括:
[0010]在集群的节点中选择一个节点作为主管理节点,将其余节点定义为普通节点;
[0011]根据主管理节点能够连接其他节点的数量选择对应数量的普通节点连接到主管理节点;
[0012]选择一个与主管理节点连接的普通节点作为一级子管理节点,根据一级子管理节点能够连接其他节点的数量选择对应数量的普通节点连接到一级子管理节点,重复当前步骤,直到与主管理节点连接的普通节点全部成为一级子管理节点;
[0013]选择一个与一级子管理节点连接的普通节点作为二级子管理节点,根据二级子管理节点能够连接其他节点的数量选择对应数量的普通节点连接到二级子管理节点,重复当前步骤直到所有节点连接完成以形成节点拓扑结构。
[0014]根据本专利技术的一个实施例,采集每个节点的信息,并将采集到的信息汇总到主管
理节点中包括:
[0015]采集每个节点的CPU负载信息、内存负载信息、节点的网络负载信息、磁盘容量、CPU温度、电压、风扇转速和用户在线时间的信息,并将采集到的信息发送到节点对应的管理节点中;
[0016]管理节点将接收到的信息以及节点本身采集到的信息发送到上一级管理节点中,直到全部信息汇总到主管理节点中。
[0017]根据本专利技术的一个实施例,还包括:
[0018]将采集到的信息存储到数据库中,并根据需求输出CPU消耗报告和网络流量报告。
[0019]本专利技术的实施例的另一个方面,还提供了一种监控集群的装置,装置包括:
[0020]构建模块,构建模块配置为在集群的节点中选择主管理节点,将集群中其余节点直接或间接连接到主管理节点以构建节点拓扑结构;
[0021]采集模块,采集模块配置为采集每个节点的信息,并将采集到的信息汇总到主管理节点中;
[0022]比较模块,比较模块配置为响应于主管理节点接收到各个节点汇总的信息,将接收到的信息与阈值进行比较;
[0023]告警模块,告警模块配置为响应于接收到的信息大于阈值,发出相应的警告信息。
[0024]根据本专利技术的一个实施例,构建模块还配置为:
[0025]在集群的节点中选择一个节点作为主管理节点,将其余节点定义为普通节点;
[0026]根据主管理节点能够连接其他节点的数量选择对应数量的普通节点连接到主管理节点;
[0027]选择一个与主管理节点连接的普通节点作为一级子管理节点,根据一级子管理节点能够连接其他节点的数量选择对应数量的普通节点连接到一级子管理节点,重复当前步骤,直到与主管理节点连接的普通节点全部成为一级子管理节点;
[0028]选择一个与一级子管理节点连接的普通节点作为二级子管理节点,根据二级子管理节点能够连接其他节点的数量选择对应数量的普通节点连接到二级子管理节点,重复当前步骤直到所有节点连接完成以形成节点拓扑结构。
[0029]根据本专利技术的一个实施例,采集模块还配置为:
[0030]采集每个节点的CPU负载信息、内存负载信息、节点的网络负载信息、磁盘容量、CPU温度、电压、风扇转速和用户在线时间的信息,并将采集到的信息发送到节点对应的管理节点中;
[0031]管理节点将接收到的信息以及节点本身采集到的信息发送到上一级管理节点中,直到全部信息汇总到主管理节点中。
[0032]根据本专利技术的一个实施例,还包括输出模块,输出模块配置为:
[0033]将采集到的信息存储到数据库中,并根据需求输出CPU消耗报告和网络流量报告。
[0034]本专利技术的实施例的另一个方面,还提供了一种计算机设备,该计算机设备包括:
[0035]至少一个处理器;以及
[0036]存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现上述任意一项方法的步骤。
[0037]本专利技术的实施例的另一个方面,还提供了一种计算机可读存储介质,计算机可读
存储介质存储有计算机程序,计算机程序被处理器执行时实现上述任意一项方法的步骤。
[0038]本专利技术具有以下有益技术效果:本专利技术实施例提供的监控集群的方法,通过在集群的节点中选择主管理节点,将集群中其余节点直接或间接连接到主管理节点以构建节点拓扑结构;每个节点采集节点的信息,并将采集到的信息汇总到主管理节点中;响应于主管理节点接收到各个节点汇总的信息,将接收到的信息与阈值进行比较;响应于接收到的信息大于阈值,发出相应的警告信息的技术方案,能够减少集群通信的开销,具有良好的可扩展性,能够快速发现并及时处理集群故障,提高整个集群系统的可用性,能够为集群的系统优化提供数据支持和分析依据。
附图说明
[0039]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
[0040]图1为根据本专利技术一个实施例的监控集群的方法的示意性流程图;
[0041]图2为根据本专利技术一个实施例的监控集群的系统的示意图;
[0042]图3为根据本专利技术一个实施例的节点拓扑结构和信息传递链的示意图;
[0043]图4为根据本专利技术一个实施例的监控本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种监控集群的方法,其特征在于,包括以下步骤:在集群的节点中选择主管理节点,将集群中其余节点直接或间接连接到主管理节点以构建节点拓扑结构;采集每个节点的信息,并将采集到的信息汇总到主管理节点中;响应于主管理节点接收到各个节点汇总的信息,将接收到的信息与阈值进行比较;响应于接收到的信息大于阈值,发出相应的警告信息。2.根据权利要求1所述的方法,其特征在于,在集群的节点中选择主管理节点,将集群中其余节点直接或间接连接到主管理节点以构建节点拓扑结构包括:在集群的节点中选择一个节点作为主管理节点,将其余节点定义为普通节点;根据主管理节点能够连接其他节点的数量选择对应数量的普通节点连接到主管理节点;选择一个与主管理节点连接的普通节点作为一级子管理节点,根据一级子管理节点能够连接其他节点的数量选择对应数量的普通节点连接到一级子管理节点,重复当前步骤,直到与主管理节点连接的普通节点全部成为一级子管理节点;选择一个与一级子管理节点连接的普通节点作为二级子管理节点,根据二级子管理节点能够连接其他节点的数量选择对应数量的普通节点连接到二级子管理节点,重复当前步骤直到所有节点连接完成以形成节点拓扑结构。3.根据权利要求2所述的方法,其特征在于,采集每个节点的信息,并将采集到的信息汇总到主管理节点中包括:采集每个节点的CPU负载信息、内存负载信息、节点的网络负载信息、磁盘容量、CPU温度、电压、风扇转速和用户在线时间的信息,并将采集到的信息发送到节点对应的管理节点中;管理节点将接收到的信息以及节点本身采集到的信息发送到上一级管理节点中,直到全部信息汇总到主管理节点中。4.根据权利要求1所述的方法,其特征在于,还包括:将采集到的信息存储到数据库中,并根据需求输出CPU消耗报告和网络流量报告。5.一种监控集群的装置,其特征在于,所述装置包括:构建模块,所述构建模块配置为在集群的节点中选择主管理节点,将集群中其余节点直接或间接连接到主管理节点以构建节点拓扑结构;采集模块,所述采集模块配置为采集每个节点的信息,并将采...

【专利技术属性】
技术研发人员:赵琰张璐
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1