一种集群的监控方法及系统技术方案

技术编号:16783377 阅读:17 留言:0更新日期:2017-12-13 02:04
本申请公开了一种集群的监控方法,包括:配置主节点下发的监控项、各所述监控项对应的阈值以及阈值处理信息;获取所述监控项对应监控对象的实时参数;判断所述实时参数是否超过所述阈值,若超过,则根据所述阈值处理信息执行去异常操作。该监控方法其能够在总负荷不变的情况下,充分利用各分节点的计算资源,使主节点负荷较小,显著提高了异常状态发生时的响应速度,简化了集群监控的流程。本申请还同时公开了一种集群的监控系统,具有上述有益效果。

【技术实现步骤摘要】
一种集群的监控方法及系统
本申请涉及集群管理
,特别涉及一种集群的监控方法及系统。
技术介绍
在当今社会,分布式海量存储越来越广泛应用在各个行业,集群规模越来越大,并且对存储的可靠性要求越来越高,所以如何能够及时获取集群软硬件状态,并采取相应措施是保证存储可靠性的重要手段。当前主流的监控方案为主节点周期到各个从节点收集软硬件数据进行分析和呈现,统一在主节点进行数据分析,并由主节点向各分节点下发处理动作指令。随着集群规模的增大,周期收据和分析数据的动作势必会大量占用集群的网络带宽和主节点的计算资源,从而影响集群的正常业务,甚至会影响集群的可靠性。所以,如何提供一种主节点负荷较小、各分节点计算资源利用率更高、处理异常状况更及时的集群监控机制是本领域技术人员亟待解决的问题。
技术实现思路
本申请的目的是提供一种集群的监控方法及系统,其能够在总负荷不变的情况下,充分利用各分节点的计算资源,使主节点负荷较小,显著提高了异常状态发生时的响应速度,简化了集群监控的流程。为解决上述技术问题,本申请提供一种集群的监控方法,该监控方法包括:配置主节点下发的监控项、各所述监控项对应的阈值以及阈值处理信息;获取所述监控项对应监控对象的实时参数;判断所述实时参数是否超过所述阈值,若超过,则根据所述阈值处理信息执行去异常操作。可选的,在配置主节点下发的监控项、各所述监控项对应的阈值以及阈值处理信息前,还包括:根据输入的信息确定所述监控项的内容;根据所述监控对象为对应监控项设置相应的阈值;根据所述监控对象以及对应的阈值生成相应的阈值处理信息。可选的,根据所述阈值处理信息执行去异常操作,包括:各所述分节点确定所述实时参数超过对应的阈值的监控项;根据所述阈值处理信息判断所述监控项的维护是否需要人工排障;若不需要,则各所述分节点执行所述阈值处理信息中提供的去异常操作;若需要,则各所述分节点向所述主节点发送告警信息,以使所述主节点接收到所述告警信息后,安排相应维护人员对所述监控对象进行维护。可选的,还包括:当所述监控项、所述阈值以及所述阈值处理操作被更新时,所述主节点将最新监控项、最新阈值以及最新阈值处理操作下发并配置到所述分节点。本申请还提供了一种集群的监控系统,该监控包括:配置单元,用于配置主节点下发的监控项、各所述监控项对应的阈值以及阈值处理信息;实时参数获取单元,用于获取所述监控项对应监控对象的实时参数;判断处理单元,用于判断所述实时参数是否超过所述阈值,若超过,则根据所述阈值处理信息执行去异常操作。可选的,该监控系统还可以包括:监控项内容确定单元,用于根据输入的信息确定所述监控项的内容;阈值设定单元,用于根据所述监控对象为对应监控项设置相应的阈值;阈值处理信息生成单元,用于根据所述监控对象以及对应的阈值生成相应的阈值处理信息。可选的,所述判断处理单元包括:异常监控项确定子单元,用于各所述分节点确定所述实时参数超过对应的阈值的监控项;人工处理判别子单元,用于根据所述阈值处理信息判断所述监控项的维护是否需要人工排障;第一处理子单元,用于各所述分节点执行所述阈值处理信息中提供的去异常操作;第二处理子单元,用于各所述分节点向所述主节点发送告警信息,以使所述主节点接收到所述告警信息后,安排相应维护人员对所述监控对象进行维护。可选的,该监控系统还可以包括:更新单元,用于所述主节点将最新监控项、最新阈值以及最新阈值处理操作下发并配置到所述分节点。本申请所提供的一种集群的监控方法,通过配置主节点下发的监控项、各所述监控项对应的阈值以及阈值处理信息;获取所述监控项对应监控对象的实时参数;判断所述实时参数是否超过所述阈值,若超过,则根据所述阈值处理信息执行去异常操作。显然,本申请所提供的技术方案,各分节点首先配置确定的监控项、监控项的阈值以及到达该阈值时对应的阈值处理信息,紧接着实时监控各监控项对应的监控对象的实时参数,并在判断该实时参数超过为其设置的阈值时,自动根据配置的阈值处理信息执行去异常操作。该监控方法其能够在集群总负荷不变的情况下,充分利用各分节点的计算资源,使主节点负荷较小,显著提高了异常状态发生时的响应速度,简化了集群监控的流程。本申请同时还提供了一种集群的监控系统,具有上述有益效果,在此不再赘述。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例所提供的一种集群的监控方法的流程图;图2为本申请实施例所提供的另一种集群的监控方法的流程图;图3为本申请实施例所提供的又一种集群的监控方法的流程图;图4为本申请实施例所提供的另一种集群的监控系统的结构框图。具体实施方式本申请的核心是提供一种集群的监控方法及系统,其能够在集群总负荷不变的情况下,充分利用各分节点的计算资源,使主节点负荷较小,显著提高了异常状态发生时的响应速度,简化了集群监控的流程。为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。以下结合图1,图1为本申请实施例所提供的一种集群的监控方法的流程图。其具体包括以下步骤:S101:配置主节点下发的监控项、各监控项对应的阈值以及阈值处理信息;本步骤旨在将主节点下发的监控项、各监控项对应的阈值以及阈值处理信息配置在各个分节点上,以便于后续步骤中各个分节点根据配置的这些信息自己进行是否到达阈值的判断,从而通过分布式的方式,将监控工作均衡到各个子节点来进行,提高了集群的利用率,减轻了主节点的负荷。具体怎样配置这些信息的方式多种多样,方向也不尽相同,例如,可以简单的将其分为并行或串行两大类来进行配置,串行配置的方式,即按照各个分节点之间的排布顺序,依次进行下发和配置;并行配置的方式,即对所有分节点同时进行统一的下发和配置。前者可以有效降低整个分布式系统的负载,后者则可以明显加快配置的速度。当然,也会存在其它的方式来进行配置,此处不并做具体限定,应视实际情况下各节点设备型号、处理性能以及管理员配置习惯等等来综合制定方案。S102:获取监控项对应监控对象的实时参数;在S101的基础上,本步骤旨在由各分节点根据配置的监控项,来确定在分布式系统内与该监控项对应的监控对象的实时参数,也可以说是该监控项的执行主体,以便在后续步骤中利用该监控对象的实时参数与为该监控项设置的阈值进行对比判断。具体的,怎样获取到该监控项对应的监控对象的实时参数的方式也存在很多,例如,可以在监控对象上合适的位置放置相关的传感器来获取到想要的监控参数,也可以其它的对象中获取跟该监控对象有关的参数,并进行一些处理和运算来得到该监控对应的实时参数,还可以根据其它的方式来获取到想要的实时参数,此处并不做具体限定,应视实际情况中采用的技术条件来具体选择。S103:判断实时参数是否超过阈值;在S10本文档来自技高网...
一种集群的监控方法及系统

【技术保护点】
一种集群的监控方法,其特征在于,包括:配置主节点下发的监控项、各所述监控项对应的阈值以及阈值处理信息;获取所述监控项对应监控对象的实时参数;判断所述实时参数是否超过所述阈值,若超过,则根据所述阈值处理信息执行去异常操作。

【技术特征摘要】
1.一种集群的监控方法,其特征在于,包括:配置主节点下发的监控项、各所述监控项对应的阈值以及阈值处理信息;获取所述监控项对应监控对象的实时参数;判断所述实时参数是否超过所述阈值,若超过,则根据所述阈值处理信息执行去异常操作。2.根据权利要求1所述的监控方法,其特征在于,在配置主节点下发的监控项、各所述监控项对应的阈值以及阈值处理信息前,还包括:根据输入的信息确定所述监控项的内容;根据所述监控对象为对应监控项设置相应的阈值;根据所述监控对象以及对应的阈值生成相应的阈值处理信息。3.根据权利要求1或2所述的监控方法,其特征在于,根据所述阈值处理信息执行去异常操作,包括:各所述分节点确定所述实时参数超过对应的阈值的监控项;根据所述阈值处理信息判断所述监控项的维护是否需要人工排障;若不需要,则各所述分节点执行所述阈值处理信息中提供的去异常操作;若需要,则各所述分节点向所述主节点发送告警信息,以使所述主节点接收到所述告警信息后,安排相应维护人员对所述监控对象进行维护。4.根据权利要求3所述的监控方法,其特征在于,还包括:当所述监控项、所述阈值以及所述阈值处理操作被更新时,所述主节点将最新监控项、最新阈值以及最新阈值处理操作下发并配置到所述分节点。5.一种集群的监控系统,其特征在...

【专利技术属性】
技术研发人员:史宗华
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1