一种通过IPMI远程监控数据中心节点健康状态的方法技术

技术编号:17883968 阅读:38 留言:0更新日期:2018-05-06 04:30
本发明专利技术提供一种通过IPMI远程监控数据中心节点健康状态的方法,通过IPMI协议,监控服务器的运行状态,包括CPU、硬盘、风扇、内存、电源、主板等,通过监控终端即可远程监控所有服务器的状态,能够实时的监控服务器的负载,CPU以及内存的使用情况,网络的波动情况等,并根据管理员设置的安全参数警戒线进行判断,当出现超过阀值情况,自动根据管理员设置的策略进行处理,并自动向管理人员发送消息推送。该方法在日常维护服务器运行时,可以节省大量的人力,避免数据中心由于各种运行隐患导致宕机或其他异常。会大大的减少了数据中心节点宕机风险,保证数据中心的可靠性。

A method to monitor the health status of data center nodes remotely through IPMI

This invention provides a way to monitor the health state of data center nodes by IPMI, and monitor the running state of the server through the IPMI protocol, including CPU, hard disk, fan, memory, power supply, main board and so on. It can monitor the state of all servers remotely by monitoring terminal, and can monitor the load of the server in real time. The use of CPU and memory, the fluctuation of the network, and so on, are judged according to the security parameter warning line set by the administrator. When the threshold situation exceeds the threshold, the policy is automatically processed according to the administrator set up, and the message is sent to the manager automatically. This method can save a lot of manpower in daily maintenance of servers, and avoid data center's outage or other anomalies due to various operational risks. This will greatly reduce the downtime risk of data center nodes and ensure the reliability of data centers.

【技术实现步骤摘要】
一种通过IPMI远程监控数据中心节点健康状态的方法
本专利技术涉及服务器领域,尤其涉及一种通过IPMI远程监控数据中心节点健康状态的方法。
技术介绍
当前在云计算的大数据世代下,数据中心服务器节点的稳定性对数据安全起到决定性作用,一般在大型的数据中心,服务器365x24小时在不停机持续工作,当前系统在运行过程中,不可避免地会出现各种部件故障、高负载运行、温度过高等情况发生,当这些问题发生时,会影响服务器的正常使用,严重的会影响整个系统的使用,出现宕机或数据丢失。
技术实现思路
为了克服上述现有技术中的不足,本专利技术提供一种通过IPMI远程监控数据中心节点健康状态的方法,包括:监控终端,其特征在于,方法包括:监控终端与数据中心远程接入同一局域网络内,使监控终端与数据中心各个节点进行通信连接;监控终端通过IPMI协议访问数据中心的各个节点;监控终端获取各个节点的温度信息、风扇信息、电压信息、网卡工作情况以及操作系统工作情况;监控终端将获取的信息与对应的阈值进行比较,当获取的数据信息中,有超出阈值的,在数据中心中发出报警信息,提示维护人员。优选地,方法包括:监控终端每经过一预设时间间隔,对各个节点的温度信息、风扇信息、电压信息、网卡工作情况以及操作系统工作情况进行监控。优选地,监控终端对接收的数据信息进行解析,将并解析后的数据信息通过相应的告警参数进行分类,对超过阈值的数据形成相应的数据信息,在数据中心中发出报警信息,提示维护人员,同时将报警信息形成报警日志;监控终端将获取到的数据信息以及报警信息呈现给维护人员,同时接收维护人员对监控终端的控制指令;监控终端提供了统一的CUI接口,供维护人员对历史日志、报警信息的查询和浏览以及对报警参数进行设置。优选地,温度信息包括CPU温度,主板温度,背板温度、热插拔模组温度;电压信息包括CPU电压,主板电压,SCSI背板电压,热插拔模组电压风扇信息包括CPU风扇,主板风扇,背板风扇,热插拔模组风扇。优选地,监控终端具有I2C设备接口,在各个节点设置有I2CSlave接口;监控终端通过I2C设备接口产生时钟向各个节点的I2CSlave接口发起通信,各个节点通过I2CSlave接口做出响应监控终端的I2C设备接口与各个节点的I2CSlave接口通过IPMI协议传输数据。优选地,步骤监控终端通过IPMI协议访问数据中心的各个节点还包括:监控终端对报警信息进行配置,包括:节点名称,节点设备名称,节点报警事件名称,节点报警描述,节点报警触发值;监控终端对报警信息类型进行配置,包括:报警供配电类、报警环境类、报警安防类;监控终端配置报警屏蔽控制,节点报警屏蔽、节点设备报警屏蔽和节点报警事件屏蔽,通过配置屏蔽方式和屏蔽时间段来屏蔽节点报警,配置解除屏蔽控制;监控终端配置报警级别,配置节点级别;配置节点CPU,硬盘,主板的报警为高级报警,配置节点温度报警为中级报警,配置节点软件类报警为低级报警;配置节点供配电类为高级报警,配置节点环境类报警为中级报警,配置节点安防类为低级报警;监控终端根据报警规则,当多个报警产生时,根据配置的报警级别,优先发出报警级别高的报警;或在同一时间段获取多个报警,根据配置的报警级别,优先发出报警级别高的报警;当多个报警产生时,级别低的报警缓存预设时间后,发出;当某节点在预设时间段内多次报警,则认为是高频次报警,在经过预设时间段后发出高频次报警提示。优选地,监控终端筛选报警关键字,将属于同一时间区间内,同一报警关键字合并,统计报警发生的频度,按照时间区间统计出报警发生的频度,展示给维护人员。优选地,步骤监控终端通过IPMI协议访问数据中心的各个节点还包括:监控终端将配置后的报警信息,报警信息类型,报警屏蔽控制信息进行封装,形成封装信息发送至数据中心的各个节点封装信息包括:配置报警信息MAC地址层,配置报警信息数据处理终端IP层,配置报警信息数据帧段;配置报警信息数据帧段中当该帧段的最低位为0时表示请求/回复响应的组件的地址码,当最低位为1时表示请求/回复响应的软件ID;该字节的高7位表示具体的地址码和软件ID;在配置报警信息数据帧段中设有奇偶信息编码,当奇偶信息编码为偶数时表示此消息是一条请求,当奇偶信息编码为奇数时表示此消息是一条响应;当消息是一条基本的控制请求或状态响应时该字节为00h和01h;在配置报警信息数据帧段中还设有请求者自行生成的一序列号,当监控终端需要发出多条请求时用以标识不同的请求;序列号是响应/接收该消息的组件的子组件号或子地址号。从以上技术方案可以看出,本专利技术具有以下优点:通过IPMI远程监控数据中心节点健康状态的方法通过IPMI协议,监控服务器的运行状态,包括CPU、硬盘、风扇、内存、电源、主板等,通过监控终端即可远程监控所有服务器的状态,能够实时的监控服务器的负载,CPU以及内存的使用情况,网络的波动情况等,并根据管理员设置的安全参数警戒线进行判断,当出现超过阀值情况,自动根据管理员设置的策略进行处理,并自动向管理人员发送消息推送。该方法在日常维护服务器运行时,可以节省大量的人力,避免数据中心由于各种运行隐患导致宕机或其他异常。会大大的减少了数据中心节点宕机风险,保证数据中心的可靠性。附图说明为了更清楚地说明本专利技术的技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为通过IPMI远程监控数据中心节点健康状态的方法流程图;图2为本专利技术实施例示意图。具体实施方式为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将运用具体的实施例及附图,对本专利技术保护的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部的实施例。基于本专利中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利保护的范围。本实施例提供一种通过IPMI远程监控数据中心2节点3健康状态的方法,如图1和图2所示,监控终端1,方法包括:S1,监控终端1与数据中心2远程接入同一局域网络内,使监控终端1与数据中心2各个节点3进行通信连接;S2,监控终端1通过IPMI协议访问数据中心2的各个节点3;S3,监控终端1获取各个节点3的温度信息、风扇信息、电压信息、网卡工作情况以及操作系统工作情况;S4,监控终端1将获取的信息与对应的阈值进行比较,当获取的数据信息中,有超出阈值的,在数据中心2中发出报警信息,提示维护人员。本实施例中,方法包括:监控终端1每经过一预设时间间隔,对各个节点3的温度信息、风扇信息、电压信息、网卡工作情况以及操作系统工作情况进行监控。本实施例中,监控终端1对接收的数据信息进行解析,将并解析后的数据信息通过相应的告警参数进行分类,对超过阈值的数据形成相应的数据信息,在数据中心2中发出报警信息,提示维护人员,同时将报警信息形成报警日志;监控终端1将获取到的数据信息以及报警信息呈现给维护人员,同时接收维护人员对监控终端1的控制指令;监控终端1提供了统一的CUI接口,供维护人员对历史日志、报警信息的查询和浏览以及对报警参数进行设置。本实施例中,本文档来自技高网...
一种通过IPMI远程监控数据中心节点健康状态的方法

【技术保护点】
一种通过IPMI远程监控数据中心节点健康状态的方法,包括:监控终端,其特征在于,方法包括:监控终端与数据中心远程接入同一局域网络内,使监控终端与数据中心各个节点进行通信连接;监控终端通过IPMI协议访问数据中心的各个节点;监控终端获取各个节点的温度信息、风扇信息、电压信息、网卡工作情况以及操作系统工作情况;监控终端将获取的信息与对应的阈值进行比较,当获取的数据信息中,有超出阈值的,在数据中心中发出报警信息,提示维护人员。

【技术特征摘要】
1.一种通过IPMI远程监控数据中心节点健康状态的方法,包括:监控终端,其特征在于,方法包括:监控终端与数据中心远程接入同一局域网络内,使监控终端与数据中心各个节点进行通信连接;监控终端通过IPMI协议访问数据中心的各个节点;监控终端获取各个节点的温度信息、风扇信息、电压信息、网卡工作情况以及操作系统工作情况;监控终端将获取的信息与对应的阈值进行比较,当获取的数据信息中,有超出阈值的,在数据中心中发出报警信息,提示维护人员。2.根据权利要求1所述的通过IPMI远程监控数据中心节点健康状态的方法,其特征在于,方法包括:监控终端每经过一预设时间间隔,对各个节点的温度信息、风扇信息、电压信息、网卡工作情况以及操作系统工作情况进行监控。3.根据权利要求1所述的通过IPMI远程监控数据中心节点健康状态的方法,其特征在于,监控终端对接收的数据信息进行解析,将并解析后的数据信息通过相应的告警参数进行分类,对超过阈值的数据形成相应的数据信息,在数据中心中发出报警信息,提示维护人员,同时将报警信息形成报警日志;监控终端将获取到的数据信息以及报警信息呈现给维护人员,同时接收维护人员对监控终端的控制指令;监控终端提供了统一的CUI接口,供维护人员对历史日志、报警信息的查询和浏览以及对报警参数进行设置。4.根据权利要求1所述的通过IPMI远程监控数据中心节点健康状态的方法,其特征在于,温度信息包括CPU温度,主板温度,背板温度、热插拔模组温度;电压信息包括CPU电压,主板电压,SCSI背板电压,热插拔模组电压风扇信息包括CPU风扇,主板风扇,背板风扇,热插拔模组风扇。5.根据权利要求1所述的通过IPMI远程监控数据中心节点健康状态的方法,其特征在于,监控终端具有I2C设备接口,在各个节点设置有I2CSlave接口;监控终端通过I2C设备接口产生时钟向各个节点的I2CSlave接口发起通信,各个节点通过I2CSlave接口做出响应监控终端的I2C设备接口与各个节点的I2CSlave接口通过IPMI协议传输数据。6.根据权利要求1所述的通过IPMI远程监控数据中心节点健康状态的方法,其特征在于,步骤监控终端通过IPMI协议访问数据中心的各个节点还包括:监控终端对报警信息进行配置,包...

【专利技术属性】
技术研发人员:张希伟
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1