一种基于Nagios和BMC的服务器监控管理方法技术

技术编号:10171152 阅读:225 留言:0更新日期:2014-07-02 12:30
本发明专利技术提出一种基于Nagios和BMC的服务器监控管理方法,实现了Nagios对服务器带外监控信息的交互访问,扩展服务器监控管理的路径,提高了服务器的可用性。本发明专利技术主要包括:服务器节点安装及配置Nagios、面向BMC的Nagios扩展插件实现、基于IPMI协议编写python脚本实现、Nagios和BMC间硬件通信接口实现、服务器远程监控管理客户端等部分。通过Nagios工具与BMC控制器的信息交互,在原有的基于Nagios的带内监控管理系统基础上扩展了面向BMC功能插件,在原有基于BMC的带外监控管理系统基础上增加了面向Nagios的信息获取,通过两系统的关键信息交互提高服务器系统可用性。

【技术实现步骤摘要】
一种基于Nagios和BMC的服务器监控管理方法
本专利技术设计一种服务器技术,具体地说是一种基于Nagios和BMC的服务器监控管理方法。
技术介绍
当今社会的各个方面服务器都发挥着重要的作用,无论是国防、科技、金融保险,还是银行、能源、政府企业,几乎所有方面都有服务器的存在。为保障上述各项工作的稳定运行,如果实时有效的对服务器进行监控管理工作就成了关键的前提。对于服务器监控的工具很多种,诸如开源工具Ganglia、Nagios、Zabbix,及专业工具Pingdom、interSeptorPro、Nimsoft等,这些工具可以监控到服务器方方面面的信息,从运行时间、性能到安全,甚至到服务器所处的物理环境指数。Ganglia用于测量数以千计的服务器节点,提供系统静态数据以及重要的性能度量数据,尤其适用于云计算系统;Nagios是一种服务器级和网络监控程序,它检测主机和服务,当异常发生和解除时能提醒用户。Zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能源解决方案;Pingdom可以监测运行时间和整体性能,并生成便于阅读的表格和图表,interSeptor是以太网数据中心和机架监控系统,它可以监控机房和机架的环境状况,一旦出现系统故障或可能危及业务连续性的其他情况就会发出预警;NMS可以监控服务器的核心资源,能够集中管理远程进程和服务。基本上通过这些工具可以了解到服务器可能会出现什么问题,并在问题出现之前解决它们。单一的开源工具功能有限,需要多种工具组合才能发挥有效的作用,而且无法得到专业的技术支持,但可以免费获得,而企业级专业工具功能强大并配有专业技术支持,但是价格却很昂贵。近年来采用开源工具对服务器系统进行监控和维护的就成了主流的解决方案,但由于这些开源监控工具各有特点和侧重点,在实际监控及维护过程很难将所有的工具都安装,即使能够安装系统管理人员也很难有精力处理所有工具的工作情况,这样就给监控管理带来了很大的问题。因此,如何既能有效的统合开源工具解决方案,简化监控管理流程,又能全面准确地对服务器系统乃至服务器集群系统场合下服务器进行监控管理就成了亟需解决的问题。
技术实现思路
针对如何既能有效的统合开源工具解决方案,简化监控管理流程,又能全面准确地对服务器系统进行监控管理,本专利技术提出了一种基于Nagios和BMC的服务器监控管理方法。本专利技术包括:服务器节点安装及配置Nagios、面向BMC的Nagios扩展插件实现、基于IPMI协议的编写python脚本实现、Nagios和BMC间硬件通信接口实现、服务器远程监控管理客户端等部分。其中,服务器节点安装及配置Nagios,需要在管理和被管理服务器节点上都安装并进行必要的配置,使Nagios能正常工作,即管理节点能通过Nagios获得被管理节点的监控管理信息;其中,面向BMC的Nagios扩展插件,主要目的是在Nagios和IPMI规范间建立交互接口文件,Nagios官网可以下载基于C语言编写nagios_ipmi_monitor扩展插件,本专利技术利用跨平台性更好的脚本语言python实现,并且在原有基础上增加了面向BMC获取Nagios监控信息的接口文件。1.Nagios获取BMC信息用monitor_nagios_to_bmc_plugins插件组主要包括电源、风扇、电压、温度传感器状态获取,以及能耗管理、日志信息导出等操作;monitor_bmc_fan.py、monitor_bmc_temp.py、monitor_bmc_psu.py、monitor_bmc_psu_control.py、monitor_bmc_voltage.py、monitor_bmc_logs.py;2.BMC获取Nagios信息用get_nagios_to_bmc_plugins插件组主要包括CPU利用率、内存使用率、硬盘利用率、进程状态、网络性能指标等状态信息:get_nagios_cpu_usgage.py、get_nagios_mem_usgage.py、get_nagios_ps_status.py、get_nagios_hdd_status.py、get_nagios_net_status.py;其中,Nagios和BMC间硬件通信接口是基于LPC协议的KCS接口,适用于IntelX86平台的CPU;其中,服务器远程监控管理客户端是安装在BMC的Webserver中,用户通过WebBrowser可以登录访问;其中,服务器远程监控管理客户端部署在BMC端,其具备基本的带外监控管理功能,即资产信息检测、远程控制维护、系统日志信息、事件告警等,另外基于Nagios提供的关键带内信息,增加了带内信息监控;其中,本专利技术通过Nagios工具与BMC控制器的信息交互,在原有的基于Nagios的带内监控管理系统基础上扩展了面向BMC功能插件,在原有基于BMC的带外监控管理系统基础上增加了面向Nagios的信息获取;本专利技术的有益效果是:无需在客户服务器端安装特定的Agent端,只需要在已经客户已经安装的Nagios监控管理工具上安装面向BMC的基于标准IPMI协议的扩展插件,这样即保障了客户信息安全性也降低了系统维护的难度。使客户在原有的监控管理方法上增加了信息互备,无论从带内系统还是从带外系统都可以获得系统关键信息,增加了系统运行的安全性和可用性。既能有效的统合开源工具解决方案,简化监控管理流程,又能全面准确地对服务器系统乃系统场合下服务器进行监控管理。附图说明图1是根据本专利技术的基于Nagios和BMC的服务器监控管理架构图;图2是根据本专利技术的服务器监控管理实施流程图。具体实施方式以下结合附图对本专利技术的实施例进行说明,应当理解,以此所描述的实施例仅用于说明和理解本专利技术,并不用于限定本专利技术。图1:是根据本专利技术的基于Nagios和BMC的服务器监控管理架构图。主要包括带内监控管理工具、操作系统OS层、硬件平台层、BMC层、以及带外监控管理工具,如图1所示,具体工作过程描述如下:1)带内监控管理工具,可以是Nagios服务端,具体可以安装在中心监控服务器端,实时获取有Nagios客户端发送来的报警信息;2)在被管理节点的本地操作系统同上安装Nagios;3)在安装Nagios客户端的基础上配置Nagios的扩展插件,即Nagios获取BMC信息用monitor_nagios_to_bmc_plugins插件组和BMC获取Nagios信息用get_nagios_to_bmc_plugins插件组,其中插件的具体实现包括以下两部分,以monitor_bmc_psu.py为例;1.Nagios配置文件Defineservice{hostnamehostnameservice_descriptionpowersupplyunitprivilegegeneric-servicecommandmonitor_bmc_pus!192.168.1.99!root!superuser}2.具体python代码#!/usr/bin/pythonfromosimportpath,systemimportsys,getpassmonitor_bmc_psu="/usr/lib/nag本文档来自技高网
...
一种基于Nagios和BMC的服务器监控管理方法

【技术保护点】
一种基于Nagios和BMC的服务器监控管理方法,其特征在于包括:基于Nagios和BMC的服务器监控管理架构及接口设计;面向BMC的Nagios扩展插件实现方法;基于IPMI协议的python命令脚本内容;服务器远程监控管理客户端的特征。

【技术特征摘要】
1.一种基于Nagios和BMC的服务器监控管理方法,包括:基于Nagios和BMC的服务器监控管理架构及接口设计;面向BMC的Nagios扩展插件实现方法;基于IPMI协议的python命令脚本内容;服务器远程监控管理客户端的特征;所述管理架构及接口设计,架构包括服务器、交互接口层、基板控制器BMC及远程管理客户端;所述管理架构及接口设计,其带内与带外管理系统的交互接口层包括但不限于I2C总线接口、基于LPC协议的KCS接口、CPU资源共享,使用LPC的KCS接口;所述面向BMC的Nagios扩展插件实现方法,Nagios支持通过perl、shell、python及PHP语言编写插件来扩展监控服务,面向BMC的插件扩展即面向标准IPMI协议的功能扩展,包括标准IPMI命令及第三方OEM的IPMI命令,采用Python脚本语言;所述BMC至少支持ipmitool、openIPMI工具中的一种和至少支持perl、shell、python及PHP语言中的一种;其特征在于,所述IPMI协议的python命令脚本内容,即服务器端python命令脚本,完成系统带内及带外监控管理信息的交互,其包括:(1)Nagios获取BMC信息:Nagios通过脚本解析后向BMC发送IPMI命令获取服务器风扇转速信息、电源工作状态、温度及电压的传感器信息、系统事件日志信息、RAID控制器信息,并...

【专利技术属性】
技术研发人员:陈刚
申请(专利权)人:浪潮电子信息产业股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1