一种服务器故障检测方法、系统及电子设备和存储介质技术方案

技术编号:22308088 阅读:34 留言:0更新日期:2019-10-16 08:12
本申请公开了一种服务器故障检测方法、系统及一种电子设备和计算机可读存储介质,该方法包括:检测所述服务器是否发生故障;若是,则触发截屏功能,并将截屏图片保存至非易失性存储器中。本申请提供的服务器故障检测方法,通过自动收集故障发生时的屏幕内容,更准确更高效的定位故障原因,从而可以更及时更有效的处理服务器管理过程中发生的故障,大大降低服务器的维护成本,提高产品竞争力,满足新一代平台的要求。

A server fault detection method, system, electronic equipment and storage medium

【技术实现步骤摘要】
一种服务器故障检测方法、系统及电子设备和存储介质
本申请涉及计算机
,更具体地说,涉及一种服务器故障检测方法、系统及一种电子设备和一种计算机可读存储介质。
技术介绍
随着信息技术的飞速发展以及云计算和物联网的落地,用户对服务器的可靠性和信息处理能力有了更高的要求。与传统服务器相比,基于Whitely平台的新一代服务器在计算性能和可靠性上与传统服务器相比具有很大的优势,并在对实时性、可靠性和可用性要求苛刻的领域中应用越来越广泛。同时基于Whitely平台的新一代服务器在机柜内采用集中管理和分级管理的策略,整机柜统一进行故障监控、故障管理和故障记录,故障发生的原因更加复杂,分析更加困难。目前服务器对故障的监控并不充分,对故障发生原因的分析并不精准,尤其是在发生系统故障时,很难得到发生故障时的具体信息,因此需要更多的信息来帮助进行故障分析。因此,如何确定发生故障时的具体信息是本领域技术人员需要解决的技术问题。
技术实现思路
本申请的目的在于提供一种服务器故障检测方法、系统及一种电子设备和一种计算机可读存储介质,通过自动收集故障发生时的屏幕内容,更准确更高效的定位故障原因,从而可以更及时更有效的处理服务器管理过程中发生的故障。为实现上述目的,本申请提供了一种服务器故障检测方法,包括:检测所述服务器是否发生故障;若是,则触发截屏功能,并将截屏图片保存至非易失性存储器中。其中,所述非易失性存储器包括Flash、TF卡、BMCconf分区中的任一项。其中,所述触发截屏功能之前,还包括:确定所述故障的故障类型;相应的,所述将截屏图片保存至非易失性存储器中,包括:将截屏图片保存至所述故障类型对应的非易失性存储器中。其中,所述故障类型包括IERR故障和/或MCE故障。其中,所述检测所述服务器是否发生故障,包括:获取所述服务器的GPIO信号,并通过所述GPIO信号检测所述服务器是否发生故障;相应的,所述确定所述故障的故障类型,包括:通过所述GPIO信号中各电平的电平状态确定所述故障的故障类型。其中,所述IERR故障对应的非易失性存储器中保存最近m个截屏图片;所述MCE故障对应的非易失性存储器中保存最近n个截屏图片。为实现上述目的,本申请提供了一种服务器故障检测系统,包括:检测模块,用于检测所述服务器是否发生故障;若是,则启动截屏模块的工作流程;所述截屏模块,用于触发截屏功能,并将截屏图片保存至非易失性存储器中。其中,还包括:确定模块,用于确定所述故障的故障类型;相应的,所述截屏模块具体为触发截屏功能,并将截屏图片保存至所述故障类型对应的非易失性存储器中的模块。为实现上述目的,本申请提供了一种电子设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上述服务器故障检测方法的步骤。为实现上述目的,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述服务器故障检测方法的步骤。通过以上方案可知,本申请提供的一种服务器故障检测方法,包括:检测所述服务器是否发生故障;若是,则触发截屏功能,并将截屏图片保存至非易失性存储器中。本申请提供的服务器故障检测方法,通过自动收集故障发生时的屏幕内容,更准确更高效的定位故障原因,从而可以更及时更有效的处理服务器管理过程中发生的故障,大大降低服务器的维护成本,提高产品竞争力,满足新一代平台的要求。本申请还公开了一种服务器故障检测系统及一种电子设备和一种计算机可读存储介质,同样能实现上述技术效果。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:图1为根据一示例性实施例示出的一种服务器故障检测方法的流程图;图2为根据一示例性实施例示出的另一种服务器故障检测方法的流程图;图3为根据一示例性实施例示出的又一种服务器故障检测方法的流程图;图4为根据一示例性实施例示出的一种服务器故障检测系统的结构图;图5为根据一示例性实施例示出的一种电子设备的结构图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请实施例公开了一种服务器故障检测方法,通过自动收集故障发生时的屏幕内容,更准确更高效的定位故障原因,从而可以更及时更有效的处理服务器管理过程中发生的故障。参见图1,根据一示例性实施例示出的一种服务器故障检测方法的流程图,如图1所示,包括:S101:检测所述服务器是否发生故障;若是,则进入S102;本实施例的执行主体可以为服务器中的BMC(中文全称:基板管理控制器,英文全称:BaseboardManagementController),当检测到本机服务器发生故障时进入S102。此处的故障可以包括IERR(internalerror)故障、MCE(MachineCheckException)故障等,在此不进行具体限定。需要说明的是,本实施例及本文以下实施例中的服务器可以是Intel平台的服务器,如基于Purley平台的服务器,当然,同样可以是其他平台的服务器,本申请在此不做任何限制,只要符合本申请实施例所公开服务器故障检测方法中的服务器架构即可。S102:触发截屏功能,并将截屏图片保存至非易失性存储器中。在本步骤中,当检测到服务器发生故障时,触发截屏功能,并将截屏图片保存至非易失性存储器中,本实施例中的非易失性存储器可以包括Flash、TF卡、BMCconf分区等,在此不进行具体限定。运维人员可以在Web界面上查看截屏内容、截屏时间、触发条件等,截屏图片可以在发生故障时提供的具体信息。运维人员也可以在Web界面和IPMI(中文全称:智能平台管理接口,英文全称:IntelligentPlatformManagementInterface)命令设置截屏功能是否开启。本申请实施例提供的服务器故障检测方法,通过自动收集故障发生时的屏幕内容,更准确更高效的定位故障原因,从而可以更及时更有效的处理服务器管理过程中发生的故障,大大降低服务器的维护成本,提高产品竞争力,满足新一代平台的要求。本申请实施例公开了一种服务器故障检测方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:参见图2,根据一示例性实施例示出的另一种服务器故障检测方法的流程图,如图2所示,包括:S201:检测所述服务器是否发生故障;若是,则进入S202;S202:确定所述故障的故障类型,并触发截屏功能;S203:将截屏图片保存至所述故障类型对应的非易失性存储器中。在本实施例中,当检测到服务器发生故障时,本文档来自技高网...

【技术保护点】
1.一种服务器故障检测方法,其特征在于,包括:检测所述服务器是否发生故障;若是,则触发截屏功能,并将截屏图片保存至非易失性存储器中。

【技术特征摘要】
1.一种服务器故障检测方法,其特征在于,包括:检测所述服务器是否发生故障;若是,则触发截屏功能,并将截屏图片保存至非易失性存储器中。2.根据权利要求1所述服务器故障检测方法,其特征在于,所述非易失性存储器包括Flash、TF卡、BMCconf分区中的任一项。3.根据权利要求1或2所述服务器故障检测方法,其特征在于,所述触发截屏功能之前,还包括:确定所述故障的故障类型;相应的,所述将截屏图片保存至非易失性存储器中,包括:将截屏图片保存至所述故障类型对应的非易失性存储器中。4.根据权利要求3所述服务器故障检测方法,其特征在于,所述故障类型包括IERR故障和/或MCE故障。5.根据权利要求4所述服务器故障检测方法,其特征在于,所述检测所述服务器是否发生故障,包括:获取所述服务器的GPIO信号,并通过所述GPIO信号检测所述服务器是否发生故障;相应的,所述确定所述故障的故障类型,包括:通过所述GPIO信号中各电平的电平状态确定所述故障的故障类型。6.根据权利要...

【专利技术属性】
技术研发人员:袁传博
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1