一种服务器故障检测的方法、装置、设备及存储介质制造方法及图纸

技术编号:18621240 阅读:48 留言:0更新日期:2018-08-08 00:22
本申请公开了一种服务器故障检测的方法,包括在触发系统启动时启动IPMI Wathdog,并判断IPMI Wathdog在预设时长后是否为开启状态;若是,则获取设备的寄存器数据;然后根据预设的分析规则对寄存器数据进行分析以获得异常设备的信息。可见,利用IPMI Wathdog判断当前是否存在异常设备,若是,则通过分析设备的寄存器数据从而获得异常设备的信息,避免了通过人工排查的方式找出异常设备的信息,从而提高服务器故障检测的便捷性。本申请还公开了一种服务器故障检测的装置、设备及计算机可读存储介质,均具有上述有益效果。

A method, device, device and storage medium for server fault detection

The present application discloses a method of server fault detection, which includes starting IPMI Wathdog when the trigger system starts and judging whether the IPMI Wathdog is open after the preset time; if then, the register data of the device is obtained; then the register data is analyzed in accordance with the preset analysis rules to get the exception set. Information prepared. It can be seen that IPMI Wathdog is used to judge whether there is an abnormal device at present. If, the information of abnormal equipment is obtained by analyzing the register data of the equipment, so as to avoid the information of the abnormal equipment through manual investigation, thus improving the convenience of the server fault detection. The application also discloses a server fault detection device, equipment and computer readable storage medium, all of which have the above beneficial effects.

【技术实现步骤摘要】
一种服务器故障检测的方法、装置、设备及存储介质
本专利技术涉及设备检测领域,特别涉及一种服务器故障检测的方法、装置、设备及计算机可读存储介质。
技术介绍
随着信息技术的飞速发展以及云计算和物联网的落地,用户对服务器的可靠性和信息处理能力有了更高的要求。与传统服务器相比,基于Purley平台的新一代服务器在计算性能和可靠性上与传统服务器相比具有很大的优势,因此基于Purley平台的服务器应用越来越广泛。随着服务器中的设备越来越多,因此导致各设备发生故障的因素也越来越多,对服务器中设备的故障检测工作也日益重要。现有技术中基于Purley平台的服务器的故障检测方式是机柜内采用集中管理和分级管理的策略,通过整机柜对服务器中的所有设备统一进行故障监控、故障管理和故障记录,在检测到设备异常的信息以后,发出提示信息以便提示操作人员对服务器中的设备进行排查,找出异常的设备。但是这种方式是在检测出有设备异常后通过人工排查的方式找出故障发生的位置,需要耗费大量的人力物力。因此,如何提高服务器故障检测的便捷性是本领域技术人员目前需要解决的技术问题。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种服务器故障检测的方法,能够提高服务器故障检测的便捷性;本专利技术的另一目的是提供一种服务器故障检测的装置、设备及计算机可读存储介质,均具有上述有益效果。为解决上述技术问题,本专利技术提供一种服务器故障检测的方法,包括:在触发系统启动时启动IPMIWathdog,并判断所述IPMIWathdog在预设时长后是否为开启状态;若是,则获取设备的寄存器数据;根据预设的分析规则对所述寄存器数据进行分析以获得异常设备的信息。优选地,进一步包括:将所述异常设备的信息记录在故障日志中。优选地,判断出所述IPMIWathdog在预设时长后为开启状态之后进一步包括:暂停所述IPMIWathdog的定时器时间。优选地,在所述将所述异常设备的信息记录在故障日志中之后进一步包括:通过网页显示所述故障日志的内容。优选地,在所述将所述异常设备的信息记录在故障日志中之后进一步包括:利用警示器报警。优选地,所述警示器具体为蜂鸣器和/或指示灯。优选地,所述警示器包括多种报警信号,且各所述报警信号分别对应不同的故障情况。为解决上述技术问题,本专利技术还提供一种服务器故障检测的装置,包括:判断模块,用于在触发系统启动时启动IPMIWathdog,并判断所述IPMIWathdog在预设时长后是否为开启状态;获取模块,用于若是,则获取设备的寄存器数据;分析模块,用于根据预设的分析规则对所述寄存器数据进行分析以获得异常设备的信息。为解决上述技术问题,本专利技术还提供一种服务器故障检测的设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述任一种服务器故障检测的方法的步骤。为解决上述技术问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种服务器故障检测的方法的步骤。本专利技术提供的服务器故障检测的方法,包括在触发系统启动时启动IPMIWathdog,并判断IPMIWathdog在预设时长后是否为开启状态;若是,则获取设备的寄存器数据;然后根据预设的分析规则对寄存器数据进行分析以获得异常设备的信息。可见,在判断出IPMIWathdog在预设时长后仍为开启状态时,说明当前服务器中存在异常设备,因此获取设备的寄存器数据,并根据预设的分析规则对寄存器数据进行分析以获得异常设备的信息。也就是说,利用IPMIWathdog判断当前是否存在异常设备,若是,则通过分析设备的寄存器数据从而获得异常设备的信息,避免了通过人工排查的方式找出异常设备的信息,从而提高服务器故障检测的便捷性。为解决上述技术问题,本专利技术还提供了一种服务器故障检测的装置、设备及计算机可读存储介质,均具有上述有益效果。附图说明为了更清楚地说明本专利技术实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例提供的一种服务器故障检测的方法的流程图;图2为本专利技术实施例提供的另一种服务器故障检测的方法的流程图;图3为本专利技术实施例提供的一种服务器故障检测的装置的结构图;图4为本专利技术实施例提供的一种服务器故障检测的设备的结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例的核心是提供一种服务器故障检测的方法,能够提高服务器故障检测的便捷性;本专利技术的另一核心是提供一种服务器故障检测的装置、设备及计算机可读存储介质,均具有上述有益效果。为了使本领域技术人员更好地理解本专利技术方案,下面结合附图和具体实施方式对本专利技术作进一步的详细说明。图1为本专利技术实施例提供的一种服务器故障检测的方法的流程图,如图所示,一种服务器故障检测的方法具体包括:S10:在触发系统启动时启动IPMIWathdog;S20:判断IPMIWathdog在预设时长后是否为开启状态。可以理解的是,为了防止主应用程序因为不明的原因无故死掉或者程序跑飞,一般可以通过IPMIWathdog程序保证系统能够重启。IPMIWathdog是服务器BMC(BaseboardManagementController,基板管理控制器)定义的一组定时器逻辑,对外提供三个IPMI(智能平台管理接口)命令接口:SetWDT,GetWDT和ResetWDT。在具体实施中,BIOS(BasicInputOutputSystem,基本输入输出系统)、OS(OperatingSystem,操作系统/计算机管理控制程序)和其他OEM(原始设备制造商)应用程序都可以使用BMC的IPMI命令接口设置WDT(WatchdogTimer,看门狗)的定时器时间、时间到期后的动作、WDT开启或关闭。在触发系统启动时,同时启动IPMIWathdog,然后判断IPMIWathdog在预设时长后是否为开启状态。一般的,在系统正常启动后,将WDT关闭;但是若当前服务器中出现异常设备,则将导致不能通过SetWDT关闭WDT,因此通过判断IPMIWathdog在预设时长后是否为开启状态来判断当前是否存在异常设备。也就是说,IPMIWathdog通过监控BIOS、OS和其他OEM应用程序的POST的过程来判断当前是否存在异常设备。例如,在触发OS启动时,使用SetWDT接口设置定时器时间和到期后的动作,并同时启动IPMIWathdog,OS启动完成后再使用SetWDT关闭IPMIWathdog,目的是监控OS启动过程是否会出现宕机的情况。如果当前服务器中的设备存在异常,那么OS启动过程将会出现宕机的情况,宕机后OS没有机会使用SetWDT关闭IPMIWathdog,在IPMIWathdog定时器时间到期时,将触发WDT对服务器执行相本文档来自技高网...

【技术保护点】
1.一种服务器故障检测的方法,其特征在于,包括:在触发系统启动时启动IPMI Wathdog,并判断所述IPMI Wathdog在预设时长后是否为开启状态;若是,则获取设备的寄存器数据;根据预设的分析规则对所述寄存器数据进行分析以获得异常设备的信息。

【技术特征摘要】
1.一种服务器故障检测的方法,其特征在于,包括:在触发系统启动时启动IPMIWathdog,并判断所述IPMIWathdog在预设时长后是否为开启状态;若是,则获取设备的寄存器数据;根据预设的分析规则对所述寄存器数据进行分析以获得异常设备的信息。2.根据权利要求1所述的方法,其特征在于,进一步包括:将所述异常设备的信息记录在故障日志中。3.根据权利要求1所述的方法,其特征在于,判断出所述IPMIWathdog在预设时长后为开启状态之后进一步包括:暂停所述IPMIWathdog的定时器时间。4.根据权利要求2所述的方法,其特征在于,在所述将所述异常设备的信息记录在故障日志中之后进一步包括:通过网页显示所述故障日志的内容。5.根据权利要求2所述的方法,其特征在于,在所述将所述异常设备的信息记录在故障日志中之后进一步包括:利用警示器报警。6.根据权利要求5所述的方法,其特征...

【专利技术属性】
技术研发人员:袁传博
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1