本发明专利技术提供一种高可用集群资源监控的方法,其具体监控过程为:资源初始化:完成高可用集群资源监控的初始化工作,将初始化的资源向逻辑调度进行注册,逻辑调度会根据注册的信息来确定后续的监控工作;注册定时器:向逻辑调度进行定时器注册;定时器计时:定时器注册后,触发器开始计时工作;到达指定时间时,启动监控;监控的资源出现异常时,进行异常处理,直至资源正常;进入下阶段监控。该一种高可用集群资源监控的方法和现有技术相比,当集群中有多种类型的资源存在的时候,能够方便、统一、及时的对资源进行监控,在对资源进行监控的时候降低系统资源的消耗,提高对资源监控的稳定性。
【技术实现步骤摘要】
一种高可用集群资源监控的方法
本专利技术涉及计算机数据通信
,具体的说是一种可构建自己的监控资源、完成异常处理的高可用集群资源监控方法。
技术介绍
高可用集群系统是指能够保证业务7×24小时不中断,在系统出现故障或者应用软件出现故障时能够快速恢复业务,尽可能把业务中断时间控制在分钟级别的系统。高可用集群系统由下至上主要包括以下几个模块:心跳模块、资源监控模块、资源管理模块、分布式控制台模块和web服务模块。其中,资源监控模块负责集群中业务组及业务组中资源的监控,并根据所监控对象的状态进行及时的处理,如发送异常通知,把监控对象恢复到正常状态。目前针对资源的监控主要采用基于网络协议的监控,如基于简单网络管理协议SNMP的监控技术、基于代理的监控技术,这些技术都依赖于TCP/IP协议的实现。由于TCP/IP协议本身存一定的稳定性(如丢包)和较大的性能损耗,无法实时发现监控资源的异常,不能满足高可用集群系统中资源监控的方法。因此,需要一种能够适用于高可用集群的资源监控的方法,能够保证在资源出现异常时及时发现异常,并进行快速的处理。
技术实现思路
本专利技术的技术任务是解决现有技术的不足,提供一种高可用集群资源监控的方法。本专利技术的技术方案是按以下方式实现的,该一种高可用集群资源监控的方法,包括五个模块:逻辑调度模块、与逻辑调度模块相连通的资源管理模块、定时器、状态监控模块和异常处理模块,其具体监控过程为:1)资源初始化:完成高可用集群资源监控的初始化工作,将初始化的资源向逻辑调度进行注册,逻辑调度会根据注册的信息来确定后续的监控工作;2)注册定时器:向逻辑调度进行定时器注册;3)定时器计时:定时器注册后,触发器开始计时工作;4)到达指定时间时,启动监控;5)监控的资源出现异常时,进行异常处理,直至资源正常;6)进入下阶段监控。所述逻辑调度模块完成高可用集群资源监控的逻辑调度,启动监控、停止监控,对定时器、状态监控、异常处理部分进行逻辑调度,并对定时器、状态监控、异常处理的反馈信息进行处理。所述资源管理模块完成集群资源的创建、销毁工作,并完成向逻辑调度模块注册工作。所述步骤2)与步骤3)中的定时器注册和计时都是由定时器完成。状态监控模块完成对具体资源的监控工作,该具体资源包括服务资源、网卡资源、应用程序资源、IP资源、网卡资源、磁盘资源,并把监控资源的状态实施反馈给逻辑调度模块,并由逻辑调度模块决策下一步的处理。所述异常处理模块提供异常处理功能:当监控的资源出现异常时,在状态监控把异常信息上报给逻辑调度模块之后,逻辑调度要求异常处理模块进行异常的处理。所述处理方式包括对异常的资源进行恢复、请求其它集群中其它节点进行处理、向用户发送紧急通知。本专利技术与现有技术相比所产生的有益效果是:本专利技术的一种高可用集群资源监控的方法能够满足于高可用集群的资源监控的方法,能够保证在资源出现异常时及时发现异常,并进行快速的处理,从而最大限度的降低业务的中断时间;当集群中有多种类型的资源存在的时候,能够方便、统一、及时的对资源进行监控,在对资源进行监控的时候降低系统资源的消耗,提高对资源监控的稳定性。附图说明附图1是本专利技术的监控部分结构框图。附图2是本专利技术的监控过程流程图。具体实施方式下面结合附图对本专利技术的一种高可用集群资源监控的方法作以下详细说明。为使集群中有多种类型的资源存在的时候,能够方便、统一、及时的对资源进行监控。在对资源进行监控的时候降低系统资源的消耗,提高对资源监控的稳定性。如附图1、图2所示,现提供一种高可用集群资源监控的方法,包括五个模块:逻辑调度模块、与逻辑调度模块相连通的资源管理模块、定时器、状态监控模块和异常处理模块,其具体监控过程为:1)资源初始化:完成高可用集群资源监控的初始化工作,将初始化的资源向逻辑调度进行注册,逻辑调度会根据注册的信息来确定后续的监控工作。资源的初始化主要初始化在逻辑调度过程中需要用到的确定运行状态的信息,包括出现异常的处理方式、要进行监控的对象、监控的时间间隔,启动资源监控的具体时间点。2)注册定时器:向逻辑调度进行定时器注册。3)定时器计时:定时器注册后,触发器开始计时工作。4)到达指定时间时,启动监控。5)监控的资源出现异常时,进行异常处理,直至资源正常。6)进入下阶段监控。所述逻辑调度模块完成高可用集群资源监控的逻辑调度,启动监控、停止监控,对定时器、状态监控、异常处理部分进行逻辑调度,并对定时器、状态监控、异常处理的反馈信息进行处理。所述资源管理模块完成集群资源的创建、销毁工作,并完成向逻辑调度模块注册工作。所述步骤2)与步骤3)中的注册定时器、计时工作由定时器部分完成。一个定时器注册成功之后,逻辑调度会启动定时器的计时工作。当定时器发现已经到达了预定时间,定时器会主动反馈给逻辑调度,逻辑调度启动监控完成对资源的本次监控,如果在本次监控中发现了资源异常,状态监控部分会反馈异常信息给逻辑调度部分,逻辑调度部分会根据资源注册时的信息来决策对资源的异常处理,具体的异常处理工作由异常处理部分进行。状态监控模块完成对具体资源的监控工作,该具体资源包括服务资源、网卡资源、应用程序资源、IP资源、网卡资源、磁盘资源,并把监控资源的状态实施反馈给逻辑调度模块,并由逻辑调度模块决策下一步的处理。所述异常处理模块提供异常处理功能:当监控的资源出现异常时,在状态监控把异常信息上报给逻辑调度模块之后,逻辑调度要求异常处理模块进行异常的处理。所述处理方式包括对异常的资源进行恢复、请求其它集群中其它节点进行处理、向用户发送紧急通知。通过上述结构和方法,可以满足高可用集群的资源监控,能够保证在资源出现异常时及时发现异常,并进行快速的处理。从而最大限度的降低业务的中断时间。本文档来自技高网...

【技术保护点】
一种高可用集群资源监控的方法,其特征在于:包括五个模块:逻辑调度模块、与逻辑调度模块相连通的资源管理模块、定时器、状态监控模块和异常处理模块,其具体监控过程为:1)资源初始化:完成高可用集群资源监控的初始化工作,将初始化的资源向逻辑调度进行注册,逻辑调度会根据注册的信息来确定后续的监控工作;2)注册定时器:向逻辑调度进行定时器注册;3)定时器计时:定时器注册后,触发器开始计时工作;4)到达指定时间时,启动监控;5)监控的资源出现异常时,进行异常处理,直至资源正常;6)进入下阶段监控。
【技术特征摘要】
1.一种高可用集群资源监控的方法,其特征在于:包括五个模块:逻辑调度模块、与逻辑调度模块相连通的资源管理模块、定时器、状态监控模块和异常处理模块,其具体监控过程为:1)资源初始化:完成高可用集群资源监控的初始化工作,将初始化的资源向逻辑调度模块进行注册,逻辑调度模块会根据注册的信息来确定后续的监控工作;2)注册定时器:向逻辑调度模块进行定时器注册;3)定时器计时:定时器注册后,触发器开始计时工作;4)到达指定时间时,启动监控;5)监控的资源出现异常时,进行异常处理,直至资源正常;6)进入下阶段监控;所述逻辑调度模块完成高可用集群资源监控的逻辑调度,启动监控、停止监控,对定时器、状态监控模...
【专利技术属性】
技术研发人员:陈宇龙,孟宪伟,
申请(专利权)人:浪潮电子信息产业股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。