一种服务器故障检测的方法、装置、设备及存储介质制造方法及图纸

技术编号:18458613 阅读:42 留言:0更新日期:2018-07-18 12:38
本申请公开了一种服务器故障检测的方法,包括接收由上电自检程序在检测到异常设备时发送的触发信息;然后根据触发信息获取异常设备对应的寄存器数据;并根据预设的分析规则对寄存器数据进行分析并得出分析结果。可见,本方法通过上电自检程序检测服务器的设备,并在检测到异常设备时发送触发信息;通过触发信息获取异常设备对应的寄存器数据,并对异常设备的寄存器数据进行分析得出分析结果,从而不仅快速准确地获取异常设备的异常情况,还能快速准确地获取发生异常的设备的位置信息,进而提高服务器故障检测的便捷性。本申请还公开了一种服务器故障检测的装置、设备及计算机可读存储介质,均具有上述有益效果。

A method, device, device and storage medium for server fault detection

A method of server fault detection is disclosed in the present application, including receiving the trigger information sent by the power self checking program when the abnormal device is detected; then the register data corresponding to the abnormal device is obtained according to the trigger information; and the number of registers is analyzed according to the preset analysis rules and the analysis results are obtained. It can be seen that this method detects the equipment of the server and sends the trigger information when the abnormal device is detected, and the register data corresponding to the abnormal device is obtained by triggering information, and the analysis results are obtained by analyzing the register data of the abnormal equipment, and the abnormal equipment is obtained not only quickly and accurately. The abnormal situation can also get the location information of the abnormal equipment quickly and accurately, thus improving the convenience of server fault detection. The application also discloses a device for detecting server failures, a device and a computer readable storage medium, all having the beneficial effects.

【技术实现步骤摘要】
一种服务器故障检测的方法、装置、设备及存储介质
本专利技术涉及设备检测领域,特别涉及一种服务器故障检测的方法、装置、设备及计算机可读存储介质。
技术介绍
随着信息技术的飞速发展以及云计算和物联网的落地,用户对服务器的可靠性和信息处理能力有了更高的要求。与传统服务器相比,基于Purley平台的新一代服务器在计算性能和可靠性上与传统服务器相比具有很大的优势,因此基于Purley平台的服务器应用越来越广泛。随着服务器中的设备越来越多,因此导致各设备发生故障的因素也越来越多,对服务器中设备的故障检测工作也日益重要。现有技术中基于Purley平台的服务器的故障检测方式是机柜内采用集中管理和分级管理的策略,通过整机柜对服务器中的所有设备统一进行故障监控、故障管理和故障记录,在检测到设备异常的信息以后,发出提示信息以便提示操作人员对服务器中的设备进行排查,找出异常的设备。但是这种方式是在检测出有设备异常后通过人工排查的方式找出故障发生的位置,需要耗费大量的人力物力。因此,如何提高服务器故障检测的便捷性是本领域技术人员目前需要解决的技术问题。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种服务器故障检测的方法,能够提高服务器故障检测的便捷性;本专利技术的另一目的是提供一种服务器故障检测的装置、设备及计算机可读存储介质,均具有上述有益效果。为解决上述技术问题,本专利技术提供一种服务器故障检测的方法,包括:接收由上电自检程序在检测到异常设备时发送的触发信息;根据所述触发信息获取所述异常设备对应的寄存器数据;根据预设的分析规则对所述寄存器数据进行分析并得出分析结果。优选地,进一步包括:将所述分析结果记录在故障日志中。优选地,在所述将所述分析结果记录在故障日志中之后进一步包括:通过网页显示所述故障日志的内容。优选地,在所述将所述分析结果记录在故障日志中之后进一步包括:利用警示器报警。优选地,所述警示器具体为蜂鸣器和/或指示灯。优选地,所述警示器包括多种报警信号,且各所述报警信号分别对应不同的故障情况。优选地,其特征在于,在所述接收由上电自检程序在检测到异常设备时发送的触发信息之后进一步包括:判断所述触发信息的格式是否与预设的格式相同;若是,则进入所述根据所述触发信息获取所述异常设备对应的寄存器数据步骤;若否,则结束进程。为解决上述技术问题,本专利技术还提供一种服务器故障检测的装置,包括:接收模块,用于接收由上电自检程序在检测到异常设备时发送的触发信息;获取模块,用于根据所述触发信息获取所述异常设备对应的寄存器数据;分析模块,用于根据预设的分析规则对所述寄存器数据进行分析并得出分析结果。为解决上述技术问题,本专利技术还提供一种服务器故障检测的设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述任一种服务器故障检测的方法的步骤。为解决上述技术问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种服务器故障检测的方法的步骤。本专利技术提供的服务器故障检测的方法,通过接收由上电自检程序在检测到异常设备时发送的触发信息;然后根据触发信息获取异常设备对应的寄存器数据;再根据预设的分析规则对寄存器数据进行分析并得出分析结果。可见,本方法通过上电自检程序对服务器的设备进行检测,在检测到异常设备时发送触发信息;在接收到触发消息后,根据触发信息获取异常设备对应的寄存器数据,再根据预设的分析规则分析寄存器数据并得出分析结果。也就是说,通过触发信息获取异常设备对应的寄存器数据,通过对异常设备的寄存器数据进行分析得出分析结果,从而不仅快速准确地获取异常设备的异常情况,还能快速准确地获取发生异常的设备的位置信息,进而提高服务器故障检测的便捷性。为解决上述技术问题,本专利技术还提供了一种服务器故障检测的装置、设备及计算机可读存储介质,均具有上述有益效果。附图说明为了更清楚地说明本专利技术实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例提供的一种服务器故障检测的方法的流程图;图2为本专利技术实施例提供的另一种服务器故障检测的方法的流程图;图3为本专利技术实施例提供的一种服务器故障检测的装置的结构图;图4为本专利技术实施例提供的一种服务器故障检测的设备的结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例的核心是提供一种服务器故障检测的方法,能够提高服务器故障检测的便捷性;本专利技术的另一核心是提供一种服务器故障检测的装置、设备及计算机可读存储介质,均具有上述有益效果。为了使本领域技术人员更好地理解本专利技术方案,下面结合附图和具体实施方式对本专利技术作进一步的详细说明。图1为本专利技术实施例提供的一种服务器故障检测的方法的流程图。请参考图1,服务器故障检测的方法包括:S10:接收由上电自检程序在检测到异常设备时发送的触发信息。需要说明的是,上电自检程序(POST,Power-On-Self-Test)是BIOS(BasicInputOutputSystem,基本输入输出系统)功能的一个主要部分,主要完成对CPU、主板、内存、软硬盘子系统、显示子系统(包括显示缓存)、串并行接口、键盘、CD-ROM光驱等硬件设备的检测。具体的,在服务器主板接通电源的时候,上电自检程序将会对服务器上的设备进行检查。通过对服务器上的设备进行故障检测,判断设备是否正常工作,从而保障服务器的正常工作。在具体实施中,当上电自检程序检测到某个设备异常时,也就是检测到存在异常设备时,发送触发信息。可以理解的是,触发信息用于触发开始后续的进程以及携带异常设备的信息。本实施例对触发信息的具体类型不做限定,作为优选的实施方式,触发信息可以是SEL日志(SystemEventLog,访问系统事件日志)。另外需要说明的是,本实施例以Intel平台的服务器架构为例进行说明,但本实施例不限于Intel平台的服务器,还可以应用于其它平台的服务器与计算机平台。S20:根据触发信息获取异常设备对应的寄存器数据。具体的,服务器接收到触发信息后,根据触发信息获取异常设备对应的寄存器数据。需要说明的是,在本实施例中,在检测到异常设备时,发送SEL日志到服务器BMC(BaseboardManagementController,基板管理控制器),服务器BMC根据PECI协议读取对应的寄存器数据。也就是说,根据触发信息携带的异常设备的信息,并根据PECI协议获取异常设备对应的寄存器数据。可以理解的是,一些设备的寄存器数据分别存在于多个不同的寄存器中,因此需要根据触发信息获取异常设备对应的所有的寄存器数据。具体的,寄存器包括但不限于MCA寄存器、AER寄存器以及PCIEROOTPORT寄存器等。需要说明的是,还可以进一步将获取到的寄存器本文档来自技高网...

【技术保护点】
1.一种服务器故障检测的方法,其特征在于,包括:接收由上电自检程序在检测到异常设备时发送的触发信息;根据所述触发信息获取所述异常设备对应的寄存器数据;根据预设的分析规则对所述寄存器数据进行分析并得出分析结果。

【技术特征摘要】
1.一种服务器故障检测的方法,其特征在于,包括:接收由上电自检程序在检测到异常设备时发送的触发信息;根据所述触发信息获取所述异常设备对应的寄存器数据;根据预设的分析规则对所述寄存器数据进行分析并得出分析结果。2.根据权利要求1所述的方法,其特征在于,进一步包括:将所述分析结果记录在故障日志中。3.根据权利要求2所述的方法,其特征在于,在所述将所述分析结果记录在故障日志中之后进一步包括:通过网页显示所述故障日志的内容。4.根据权利要求2所述的方法,其特征在于,在所述将所述分析结果记录在故障日志中之后进一步包括:利用警示器报警。5.根据权利要求4所述的方法,其特征在于,所述警示器具体为蜂鸣器和/或指示灯。6.根据权利要求4所述的方法,其特征在于,所述警示器包括多种报警信号,且各所述报警信号分别对应不同的故障情况。7.根据权利要求1至6任一项所述的方法,其特征在于,在所述接收由...

【专利技术属性】
技术研发人员:袁传博
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1