一种对分布式集群系统进行告警服务的方法及装置制造方法及图纸

技术编号:16473965 阅读:21 留言:0更新日期:2017-10-29 01:37
本发明专利技术实施例中公开了一种对分布式集群系统进行告警服务的方法及装置,应用于自动检测告警服务项模块,所述方法包括:自动检测并识别分布式集群系统中集群节点的软硬件服务项;从所述软硬件服务项中确定目标软硬件服务项;将所述目标软硬件服务项填充到告警管理模块的配置文件中的告警服务项列表中,以使所述告警管理模块启动后根据所述配置文件中的告警服务项列表对所述分布式集群系统进行告警服务。上述方法及装置能够避免系统管理员手动在分布式集群系统中各个服务器节点的配置文件中添加告警服务列表,减小了人工操作的失误率,增强了告警管理模块的可靠性,提高了分布式集群系统的部署效率。

Method and device for alarm service of distributed cluster system

The embodiment of the invention discloses a method and a device for alarm service for distributed cluster system, applied to automatic detection and alarm service module, the method includes: hardware and software services to automatically detect and identify the cluster nodes in distributed cluster system; determine the target hardware and software services from the hardware and software services; the target of hardware and software services to fill alarm service list alarm management module in the configuration file, so that the alarm management module after the start of the service according to the alarm list in the configuration file of the distributed cluster system for alarm service. The method and the device can avoid the system administrator manually add alarm service list in a distributed cluster system of each server node in the configuration file, reduce the artificial operation error rate, enhances the reliability of alarm management module, improve the efficiency of the deployment of distributed cluster system.

【技术实现步骤摘要】
一种对分布式集群系统进行告警服务的方法及装置
本专利技术涉及分布式集群系统相关
,具体涉及一种对分布式集群系统进行告警服务的方法及装置。
技术介绍
分布式集群系统一般包含多台服务器(Server)节点,这些服务器节点组成一个集群统一对外提供服务。告警管理模块是分布式集群系统中很重要的模块,该模块可以实时的检测分布式集群系统中各个服务器节点的软硬件的健康和运行状态,一旦检测到异常,可立即上报给系统管理员,方便系统管理员能及时获知分布式集群系统中的异常。由于分布式集群的服务器节点个数不是固定的,并且每个服务器节点上的软硬件配置也有差异,比如电源、风扇或网卡的个数不相同等,在利用传统的分布式集群系统内的告警管理模块进行告警服务时,首先需要系统管理员手动在分布式集群系统中各个服务器节点的配置文件中添加告警服务项列表,告警管理模块通过读取各个服务器节点的配置文件中的告警服务列表得知分布式集群系统中需要进行告警服务的服务项,进而对各服务项进行实时监控,若检测到某一服务项出现异常或故障,则会通过一些方式(邮件、短信、微信等)向系统管理员上报该服务项的告警信息。但是,利用传统的分布式集群系统内的告警管理模块进行告警服务时,需要系统管理员手动在分布式集群系统中各个服务器节点的配置文件中添加告警服务列表,比较繁琐且容易出现失误,降低了告警管理模块的可靠性,影响了分布式集群系统的部署效率。
技术实现思路
有鉴于此,本专利技术实施例提供一种对分布式集群系统进行告警服务的方法及装置,能够避免系统管理员手动在分布式集群系统中各个服务器节点的配置文件中添加告警服务列表,减小了人工操作的失误率,增强了告警管理模块的可靠性,提高了分布式集群系统的部署效率。为实现上述目的,本专利技术实施例提供如下技术方案:一种对分布式集群系统进行告警服务的方法,应用于自动检测告警服务项模块,所述方法包括:自动检测并识别分布式集群系统中集群节点的软硬件服务项;从所述软硬件服务项中确定目标软硬件服务项;将所述目标软硬件服务项填充到告警管理模块的配置文件中的告警服务项列表中,以使所述告警管理模块启动后根据所述配置文件中的告警服务项列表对所述分布式集群系统进行告警服务。可选的,所述自动检测并识别分布式集群系统中集群节点的软硬件服务项,包括:通过系统服务模块和硬件管理模块自动检测并识别分布式集群系统中服务器节点的软硬件服务项。可选的,所述从所述软硬件服务项中确定目标软硬件服务项,包括:确定所述软硬件服务项都为所述目标软硬件服务项。可选的,所述从所述软硬件服务项中确定目标软硬件服务项,包括:将所述软硬件服务项通过简单网络管理协议获取类接口发送至简单网络管理协议客户端;通过简单网络管理协议获取类接口接收用户在简单网络管理协议客户端选取的软硬件服务项;将所述用户在简单网络管理协议客户端选取的软硬件服务项作为目标软硬件服务项。可选的,如果所述分布式集群系统中集群节点添加了新的软硬件服务项,则所述自动检测并识别分布式集群系统中集群节点的软硬件服务项,包括:自动检测并识别分布式集群系统中集群节点添加的新的软硬件服务项。一种对分布式集群系统进行告警服务的装置,应用于自动检测告警服务项模块,所述装置包括:检测单元,用于自动检测并识别分布式集群系统中集群节点的软硬件服务项;确定单元,用于从所述软硬件服务项中确定目标软硬件服务项;填充单元,用于将所述目标软硬件服务项填充到告警管理模块的配置文件中的告警服务项列表中,以使所述告警管理模块启动后根据所述配置文件中的告警服务项列表对所述分布式集群系统进行告警服务。可选的,所述检测单元具体用于:通过系统服务模块和硬件管理模块自动检测并识别分布式集群系统中服务器节点的软硬件服务项。可选的,所述确定单元具体用于:确定所述软硬件服务项都为所述目标软硬件服务项。可选的,所述确定单元具体用于:将所述软硬件服务项通过简单网络管理协议获取类接口发送至简单网络管理协议客户端;通过简单网络管理协议获取类接口接收用户在简单网络管理协议客户端选取的软硬件服务项;将所述用户在简单网络管理协议客户端选取的软硬件服务项作为目标软硬件服务项。可选的,如果所述分布式集群系统中集群节点添加了新的软硬件服务项,则所述检测单元还用于:自动检测并识别分布式集群系统中集群节点添加的新的软硬件服务项。基于上述技术方案,本专利技术实施例中公开了一种对分布式集群系统进行告警服务的方法及装置,应用于自动检测告警服务项模块,所述方法包括:自动检测并识别分布式集群系统中集群节点的软硬件服务项;从所述软硬件服务项中确定目标软硬件服务项;将所述目标软硬件服务项填充到告警管理模块的配置文件中的告警服务项列表中,以使所述告警管理模块启动后根据所述配置文件中的告警服务项列表对所述分布式集群系统进行告警服务。上述方法及装置能够避免系统管理员手动在分布式集群系统中各个服务器节点的配置文件中添加告警服务列表,减小了人工操作的失误率,增强了告警管理模块的可靠性,提高了分布式集群系统的部署效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例公开的一种对分布式集群系统进行告警服务的方法的流程示意图;图2为本专利技术实施例公开的一种告警管理模块的结构示意图;图3为本专利技术实施例公开的一种对分布式集群系统进行告警服务的装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅附图1,图1为本专利技术实施例公开的一种对分布式集群系统进行告警服务的方法的流程示意图,所述方法包括如下步骤:步骤S100,自动检测并识别分布式集群系统中集群节点的软硬件服务项;需要说明的是,本专利技术中公开的对分布式集群系统进行告警服务的方法,执行主体是自动告警服务项模块,该自动告警服务项模块具体可以为在分布式集群系统的集群节点上添加的自动检测告警服务项(本专利技术后续说明中用Auto_check指代)进程。目前,分布式集群系统能够实现选择自动化部署,在自动化部署脚本中添加启动Auto_check进程的命令,在初始化部署分布式集群系统时,Auto_check进程在分布式集群系统的各个服务器节点上被启动,并在分布式集群系统后台实时运行。在启动自动检测告警服务项模块之后,自动检测告警服务项模块自动检测并识别分布式集群系统中集群节点的软硬件服务项。具体的,可以通过系统服务模块和硬件管理模块自动检测并识别分布式集群系统中服务器节点的软硬件服务项。需要说明的是,硬件管理模块具体可以为ipmi(IntelligentPlatformManagementInterface智能平台管理接口)工具。步骤S110,从所述软硬件服务项中确定目标软硬件服务项。具体的,所述从所述软硬件服务项中确定目标软硬件服务项,包括:确定所本文档来自技高网...
一种对分布式集群系统进行告警服务的方法及装置

【技术保护点】
一种对分布式集群系统进行告警服务的方法,其特征在于,应用于自动检测告警服务项模块,所述方法包括:自动检测并识别分布式集群系统中集群节点的软硬件服务项;从所述软硬件服务项中确定目标软硬件服务项;将所述目标软硬件服务项填充到告警管理模块的配置文件中的告警服务项列表中,以使所述告警管理模块启动后根据所述配置文件中的告警服务项列表对所述分布式集群系统进行告警服务。

【技术特征摘要】
1.一种对分布式集群系统进行告警服务的方法,其特征在于,应用于自动检测告警服务项模块,所述方法包括:自动检测并识别分布式集群系统中集群节点的软硬件服务项;从所述软硬件服务项中确定目标软硬件服务项;将所述目标软硬件服务项填充到告警管理模块的配置文件中的告警服务项列表中,以使所述告警管理模块启动后根据所述配置文件中的告警服务项列表对所述分布式集群系统进行告警服务。2.根据权利要求1所述的方法,其特征在于,所述自动检测并识别分布式集群系统中集群节点的软硬件服务项,包括:通过系统服务模块和硬件管理模块自动检测并识别分布式集群系统中服务器节点的软硬件服务项。3.根据权利要求1或2所述的方法,其特征在于,所述从所述软硬件服务项中确定目标软硬件服务项,包括:确定所述软硬件服务项都为所述目标软硬件服务项。4.根据权利要求1或2所述的方法,其特征在于,所述从所述软硬件服务项中确定目标软硬件服务项,包括:将所述软硬件服务项通过简单网络管理协议获取类接口发送至简单网络管理协议客户端;通过简单网络管理协议获取类接口接收用户在简单网络管理协议客户端选取的软硬件服务项;将所述用户在简单网络管理协议客户端选取的软硬件服务项作为目标软硬件服务项。5.根据权利要求1所述的方法,其特征在于,如果所述分布式集群系统中集群节点添加了新的软硬件服务项,则所述自动检测并识别分布式集群系统中集群节点的软硬件服务项,包括:自动检测并...

【专利技术属性】
技术研发人员:张大帅周龙飞
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1