一种分区集群系统的监测方法及装置制造方法及图纸

技术编号:14233112 阅读:75 留言:0更新日期:2016-12-20 22:57
本发明专利技术涉及一种分区集群系统的监测方法及装置,本发明专利技术通过对分区集群系统的每个节点进行应用服务配置,使每个应用服务在节点上都是交错备份处理的,以保证每个应用服务都有主备服务存在;在集群系统每个节点上部署用于存储集群系统对应节点配置信息的sysmoni实时库,同时在每个节点上部署用于根据配置信息来管理节点各级元素的appmanager服务;各应用服务的应用进程在启动时向对应节点上的appmanager服务进行注册,并定时向其发送自身的状态信息,以实现对各节点应用服务进程的监视。本发明专利技术实现了对集群系统的运行状态的全面监测,大大提高了集群系统运行的透明度,增强了集群系统的可靠性。

Method and device for monitoring partition cluster system

The present invention relates to a method and device for monitoring a partition of the cluster system, the invention of application service configuration through each node of the partition of the cluster system, so that each application services are staggered backup processing on the node, to ensure that each application services are the main service in preparation; deployed on each node for cluster system sysmoni real time database corresponding to node configuration information storage cluster system, at the same time on each node deployment for managing node elements at all levels according to the configuration information of appmanager services; the application process of application services to register the corresponding node on the appmanager service at startup, and status information sent to the timing of their own, to realize the application of node service process monitoring. The invention realizes the comprehensive monitoring of the running state of the cluster system, greatly improves the transparency of the operation of the cluster system, and enhances the reliability of the cluster system.

【技术实现步骤摘要】

本专利技术涉及一种分区集群系统的监测方法及装置,属于软件系统设计

技术介绍
随着科技的发展,各种信息量也在爆炸式的增长,同时人们对这些信息的监控需求也在不断增大,海量数据监视成为了当今的热点,为了解决这个问题,分布式集群监控系统就应运而生。但是,人们在解决了如何采集这些海量数据的问题后,如何管理并监视分布式集群系统成为了一个难题,如何保证集群系统的强壮性、可靠性并透明化的了解系统的运行状态成为了目前的迫切需求。
技术实现思路
本专利技术的目的是提供一种分区集群系统的监测方法及装置,以实现对分区集群系统运行状态的全面实时监测。本专利技术为解决上述技术问题而提供一种分区集群系统的监测方法,该监测方法包括以下步骤:1)对分区集群系统的每个节点进行应用服务配置,使每个应用服务在节点上都是交错备份处理的,以保证每个应用服务都有主备服务存在;2)在集群系统每个节点上部署用于存储集群系统对应节点配置信息的sysmoni实时库,同时在每个节点上部署用于根据配置信息来管理节点各级元素的appmanager服务;3)每个应用服务的应用进程在启动时向对应节点上的appmanager服务进行注册,并定时向其发送自身的状态信息,以实现对各节点应用服务进程的监视。分区集群系统中各节点的appmanager服务根据预定义优先级确定一个主appmanager服务,其它为从appmanager服务,主appmanager服务会根据初始配置信息,将各个应用服务的主备角色发送给从appmanager服务,使每个应用都会有一个主角色一个备角色,从appmanager服务定时将本节点的应用状态信息发送给主appmanager服务。所述主appmanager服务和从appmanager服务之间采用心跳报文进行通信。当备appmanager服务超过设定时间没有心跳时,主appmanager服务将该节点上原来处理的应用主服务切换到其它相应节点上处理;当主appmanager服务超过设定时间没有心跳时,根据预先的优先级配置信息,选取其它从appmanager服务优先级较高的作为新的主appmanager服务,并将原来主appmanager服务上处理的应用主服务切换到其它相应节点上处理。当某个节点的资源占用率超过设定值时,主appmanager服务会自动将该节点上处理的应用切换到其它节点上,以到达负载均衡的目的。当某个集群元素发生故障时,appmanager服务会产生报警信息,用于提示管理人员进行及时处理。每个应用服务均配置有一个对应的关键进程,用来判断该应用服务的运行状态,当某个节点的关键进程出现问题时,则说明该节点对应的应用服务出现异常。本专利技术还提供了一种分区集群系统的监测装置,该监测装置包括部署在集群系统每个节点上的appmanager服务和sysmoni实时库,所述sysmoni实时库用于存储集群系统对应节点的配置信息,所述appmanager服务用于根据配置信息来管理各级元素,并对其进行监视,分区集群系统的每个节点在进行应用服务配置时,每个应用服务在节点上都是交错备份处理的,以保证每个应用服务都有主备服务存在;每个应用服务的应用进程在启动时向对应节点上的appmanager服务进行注册,并定时向其发送自身的状态信息,以实现对各节点应用服务进程的监视。所述sysmoni实时库中存储的配置信息包括集群节点信息、集群应用信息和应用进程信息,是通过专属集群配置工具clustercfg所建立的。分区集群系统中各节点的appmanager服务根据预定义优先级确定一个主appmanager服务,其它为从appmanager服务,主appmanager服务会根据sysmoni实时库中存储的初始配置信息,将各个应用服务的主备角色发送给从appmanager服务,使每个应用都会有一个主角色一个备角色,从appmanager服务定时将本节点的应用状态信息发送给主appmanager服务。本专利技术的有益效果是:本专利技术通过对分区集群系统的每个节点进行应用服务配置,使每个应用服务在节点上都是交错备份处理的,以保证每个应用服务都有主备服务存在;在集群系统每个节点上部署用于存储集群系统对应节点配置信息的sysmoni实时库,同时在每个节点上部署用于根据配置信息来管理节点各级元素的appmanager服务;各应用服务的应用进程在启动时向对应节点上的appmanager服务进行注册,并定时向其发送自身的状态信息,以实现对各节点应用服务进程的监视。本专利技术实现了对集群系统的运行状态的全面监测,大大提高了集群系统运行的透明度,增强了集群系统的可靠性。附图说明图1是本专利技术分区集群系统监测方法的原理示意图;图2是本专利技术所采用的集群配置工具示意图。具体实施方式下面结合附图对本专利技术的具体实施方式做进一步的说明。本专利技术的一种分区集群系统的监测方法的实施例本专利技术通过对分区集群系统的每个节点进行应用服务配置,使每个应用服务在节点上都是交错备份处理的,以保证每个应用服务都有主备服务存在;在集群系统每个节点上部署用于存储集群系统对应节点配置信息的sysmoni实时库,同时在每个节点上部署用于根据配置信息来管理节点各级元素的appmanager服务;每个应用服务的应用进程在启动时向对应节点上的appmanager服务进行注册,并定时向其发送自身的状态信息,以实现对各节点应用服务进程的监视。下面以电力系统配电网的分布式集群系统为例进行说明,该方法的具体实现过程如下。1.对分区集群系统的每个节点进行应用服务配置,使每个应用服务在节点上都是交错备份处理的,以保证每个应用服务都有主备服务存在。本实施例中的分区集群系统进行三节点三应用配置,如图1所示,每个节点运行两个应用,保证每个应有都有主备服务。集群节点A上配置有节点应用服务1和节点应用服务2,集群节点B上配置有节点应用服务1和节点应用服务3,集群节点C上配置有节点应用服务2和节点应用服务3,可见每个节点应用服务都存在两个集群节点上,使得每个应用服务既有主服务也有备服务。2.在集群系统每个节点上部署sysmoni实时库,同时在每个节点上部署appmanager服务。本实施例使用专属集群配置工具clustercfg建立集群系统配置信息,如图2所示,并将其导入进sysnomi实时库中,包括集群节点信息、集群应用信息和应用进程信息等,每个集群节点部署的sysmoni实时库用于存储基本的集群系统配置信息(比如系统有哪些节点、哪些应用,每个应用都在哪些节点上,每个应用都有哪些进程等),当appmanager服务启动时,会从该sysnomi实时库中读取这些配置信息,同时sysnomi实时库还对外提供访问接口,方便监视程序读取相应的监视信息数据,以展现监视信息。3.启动每个节点上的appmanager服务,各个服务之间会根据预先定义的优先级决定出一个主服务、其它的都为从appmanager服务,各个从服务从sysnomi实时库中读取配置信息。本实施例中集群节点A上部署的为主appmanager服务,集群节点B和C上部署的均为从appmanager服务。集群节点上的appmanager服务在启动之初都会有一个静态的优先级配置信息,每个节点的优先级高低都不一样,当主ap本文档来自技高网...
一种分区集群系统的监测方法及装置

【技术保护点】
一种分区集群系统的监测方法,其特征在于,该监测方法包括以下步骤:1)对分区集群系统的每个节点进行应用服务配置,使每个应用服务在节点上都是交错备份处理的,以保证每个应用服务都有主备服务存在;2)在集群系统每个节点上部署用于存储集群系统对应节点配置信息的sysmoni实时库,同时在每个节点上部署用于根据配置信息来管理节点各级元素的appmanager服务;3)每个应用服务的应用进程在启动时向对应节点上的appmanager服务进行注册,并定时向其发送自身的状态信息,以实现对各节点应用服务进程的监视。

【技术特征摘要】
1.一种分区集群系统的监测方法,其特征在于,该监测方法包括以下步骤:1)对分区集群系统的每个节点进行应用服务配置,使每个应用服务在节点上都是交错备份处理的,以保证每个应用服务都有主备服务存在;2)在集群系统每个节点上部署用于存储集群系统对应节点配置信息的sysmoni实时库,同时在每个节点上部署用于根据配置信息来管理节点各级元素的appmanager服务;3)每个应用服务的应用进程在启动时向对应节点上的appmanager服务进行注册,并定时向其发送自身的状态信息,以实现对各节点应用服务进程的监视。2.根据权利要求1所述的分区集群系统的监测方法,其特征在于,分区集群系统中各节点的appmanager服务根据预定义优先级确定一个主appmanager服务,其它为从appmanager服务,主appmanager服务会根据初始配置信息,将各个应用服务的主备角色发送给从appmanager服务,使每个应用都会有一个主角色一个备角色,从appmanager服务定时将本节点的应用状态信息发送给主appmanager服务。3.根据权利要求2所述的分区集群系统的监测方法,其特征在于,所述主appmanager服务和从appmanager服务之间采用心跳报文进行通信。4.根据权利要求3所述的分区集群系统的监测方法,其特征在于,当备appmanager服务超过设定时间没有心跳时,主appmanager服务将该节点上原来处理的应用主服务切换到其它相应节点上处理;当主appmanager服务超过设定时间没有心跳时,根据预先的优先级配置信息,选取其它从appmanager服务优先级较高的作为新的主appmanager服务,并将原来主appmanager服务上处理的应用主服务切换到其它相应节点上处理。5.根据权利要求2所述的分区集群系统的监测方法,其特征在于,当某个节点的资源占用率超过设定值时,主appman...

【专利技术属性】
技术研发人员:王建章余海溶罗开明康振全刘岩张新坡张妮
申请(专利权)人:许继集团有限公司国家电网公司许昌许继软件技术有限公司
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1