一种服务器故障恢复方法、装置、设备、存储介质制造方法及图纸

技术编号:36290025 阅读:47 留言:0更新日期:2023-01-13 10:02
本申请公开了一种服务器故障恢复方法、装置、设备、存储介质,涉及服务器技术领域,包括:当检测到第一服务器与第二服务器之间存在绑定关系时,监测第一服务器的第一平台管理控制器与第二服务器的第二平台管理控制器之间的心跳报文发送操作;若监测到第一服务器未收到心跳报文的响应信息,则判断第二服务器出现故障问题;检测第二服务器的智能平台管理接口是否正常,若不正常,则控制复杂可编程逻辑器件重启第二服务器,完成故障恢复。可见,首先检测就近的两台服务器是否存在绑定关系,若存在,则证明两台服务器能够通过硬件接口联通后相互检测和控制,在发生故障时,通过复杂可编程逻辑器件发起重启活动,完成故障恢复。完成故障恢复。完成故障恢复。

【技术实现步骤摘要】
一种服务器故障恢复方法、装置、设备、存储介质


[0001]本专利技术涉及服务器
,特别涉及一种服务器故障恢复方法、装置、设备、存储介质。

技术介绍

[0002]当前,服务器是整个网络系统和计算平台的核心,许多重要的数据都保存在服务器上。BMC(Baseboard Management Controller,基板管理控制器)又是服务器的管家,它利用传感器来监视一台计算机、网络服务器,或者是其他硬件驱动设备的状态。掌握着服务器的控制权。并且BMC还可以控制BIOS(Basic Input Output System,基本输入输出系统)的刷新,BIOS作为服务器启动的最前线,掌握着服务器的最高话语权。所以保障BMC的稳健工作,就相当于保障了服务器的稳健工作。而当服务器出现故障时,如果仅靠人工监测并基于管理员的自身经验进行服务器故障的发现和解决的方式,自动化程度低,并且由人为手动处理服务器故障操作还容易引发二次故障。
[0003]综上,如何实现服务器的故障自动检查,并主动完成故障恢复是本领域有待解决的技术问题。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种服务器故障恢复方法、装置、设备、存储介质,能够实现服务器的故障自动检查,并主动完成故障恢复。其具体方案如下:
[0005]第一方面,本申请公开了一种服务器故障恢复方法,包括:
[0006]当检测到第一服务器与第二服务器之间存在绑定关系时,监测所述第一服务器的第一平台管理控制器与所述第二服务器的第二平台管理控制器之间的心跳报文发送操作;
[0007]若监测到所述第一服务器未收到所述心跳报文的响应信息,则判断所述第二服务器出现故障问题;
[0008]检测所述第二服务器的智能平台管理接口是否正常,若不正常,则控制复杂可编程逻辑器件重启所述第二服务器,完成故障恢复。
[0009]可选的,所述当检测到第一服务器与第二服务器之间存在绑定关系时,监测所述第一服务器的第一平台管理控制器与所述第二服务器的第二平台管理控制器之间的心跳报文发送操作,包括:
[0010]当检测到第一服务器与第二服务器之间通过预设通信接口存在绑定关系时,控制所述第一基板管理控制器与所述第二基板管理控制器每隔预设时间间隔发送心跳报文和/或接收针对心跳报文的响应信息;
[0011]监测所述第一服务器的第一平台管理控制器与所述第二服务器的第二平台管理控制器之间的心跳报文发送操作和/或响应信息接收操作。
[0012]可选的,所述若监测到所述第一服务器未收到所述心跳报文的响应信息,则判断所述第二服务器出现故障问题,包括:
[0013]若监测到所述第一服务器未收到所述心跳报文的响应信息,则判断所述第二服务器的第二平台管理控制器出现挂死故障。
[0014]可选的,所述监测所述第一服务器的第一平台管理控制器与所述第二服务器的第二平台管理控制器之间的心跳报文发送操作之后,还包括:
[0015]若监测到所述第二服务器未收到所述心跳报文的响应信息,则判断所述第一服务器出现故障问题;
[0016]相应的,所述检测所述第二服务器的智能平台管理接口是否正常,若不正常,则控制复杂可编程逻辑器件重启所述第二服务器,完成故障恢复,包括:
[0017]检测所述第一服务器的智能平台管理接口是否正常,若不正常,则控制复杂可编程逻辑器件重启所述第一服务器,完成故障恢复。
[0018]可选的,所述检测所述第二服务器的智能平台管理接口是否正常,若不正常,则控制复杂可编程逻辑器件重启所述第二服务器,完成故障恢复过程中,还包括:
[0019]若检测到所述第二服务器的智能平台管理接口不正常,记录现场日志,以便用于分析故障原因。
[0020]可选的,所述检测所述第二服务器的智能平台管理接口是否正常之后,还包括:
[0021]利用第一服务器通过预设通信接口对所述第二服务器进行访问,并控制所述第二服务器进行重启操作,完成故障恢复。
[0022]可选的,所述控制复杂可编程逻辑器件重启所述第二服务器,完成故障恢复,包括:
[0023]通过GPIO控制复杂可编程逻辑器件重启所述第二服务器,完成故障恢复。
[0024]第二方面,本申请公开了一种服务器故障恢复装置,包括:
[0025]报文发送模块,用于当检测到第一服务器与第二服务器之间存在绑定关系时,监测所述第一服务器的第一平台管理控制器与所述第二服务器的第二平台管理控制器之间的心跳报文发送操作;
[0026]故障判断模块,用于若监测到所述第一服务器未收到所述心跳报文的响应信息,则判断所述第二服务器出现故障问题;
[0027]故障恢复模块,用于检测所述第二服务器的智能平台管理接口是否正常,若不正常,则控制复杂可编程逻辑器件重启所述第二服务器,完成故障恢复。
[0028]第三方面,本申请公开了一种电子设备,包括:
[0029]存储器,用于保存计算机程序;
[0030]处理器,用于执行所述计算机程序,以实现前述公开的服务器故障恢复方法的步骤。
[0031]第四方面,本申请公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的服务器故障恢复方法的步骤。
[0032]由此可见,本申请公开了一种服务器故障恢复方法,包括:当检测到第一服务器与第二服务器之间存在绑定关系时,监测所述第一服务器的第一平台管理控制器与所述第二服务器的第二平台管理控制器之间的心跳报文发送操作;若监测到所述第一服务器未收到所述心跳报文的响应信息,则判断所述第二服务器出现故障问题;检测所述第二服务器的智能平台管理接口是否正常,若不正常,则控制复杂可编程逻辑器件重启所述第二服务器,
完成故障恢复。可见,首先检测就近的两台服务器是否存在绑定关系,若存在,则证明两台服务器能够互相检测对方和控制对方,检测对方是否存在故障,控制对方进行故障恢复等;并通过发送心跳报文的方式互相检测对方是否存在故障,若检测到某一方无心跳报文的响应信息,则说明另一台服务器存在故障问题,则立刻控制复杂可编程逻辑器件重启存在故障的服务器,因此,通过硬件接口联通后相互检测和控制,在发生故障时,通过复杂可编程逻辑器件发起重启活动,完成故障恢复。
附图说明
[0033]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0034]图1为本申请公开的一种服务器故障恢复方法流程图;
[0035]图2为本申请公开的一种具体的服务器故障恢复方法流程图;
[0036]图3为本申请公开的一种两台服务器交互控制方法流程图;
[0037]图4为本申请公开的一种服务器故障恢复装置结构示意图;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种服务器故障恢复方法,其特征在于,包括:当检测到第一服务器与第二服务器之间存在绑定关系时,监测所述第一服务器的第一平台管理控制器与所述第二服务器的第二平台管理控制器之间的心跳报文发送操作;若监测到所述第一服务器未收到所述心跳报文的响应信息,则判断所述第二服务器出现故障问题;检测所述第二服务器的智能平台管理接口是否正常,若不正常,则控制复杂可编程逻辑器件重启所述第二服务器,完成故障恢复。2.根据权利要求1所述的服务器故障恢复方法,其特征在于,所述当检测到第一服务器与第二服务器之间存在绑定关系时,监测所述第一服务器的第一平台管理控制器与所述第二服务器的第二平台管理控制器之间的心跳报文发送操作,包括:当检测到第一服务器与第二服务器之间通过预设通信接口存在绑定关系时,控制所述第一基板管理控制器与所述第二基板管理控制器每隔预设时间间隔发送心跳报文和/或接收针对心跳报文的响应信息;监测所述第一服务器的第一平台管理控制器与所述第二服务器的第二平台管理控制器之间的心跳报文发送操作和/或响应信息接收操作。3.根据权利要求1所述的服务器故障恢复方法,其特征在于,所述若监测到所述第一服务器未收到所述心跳报文的响应信息,则判断所述第二服务器出现故障问题,包括:若监测到所述第一服务器未收到所述心跳报文的响应信息,则判断所述第二服务器的第二平台管理控制器出现挂死故障。4.根据权利要求1所述的服务器故障恢复方法,其特征在于,所述监测所述第一服务器的第一平台管理控制器与所述第二服务器的第二平台管理控制器之间的心跳报文发送操作之后,还包括:若监测到所述第二服务器未收到所述心跳报文的响应信息,则判断所述第一服务器出现故障问题;相应的,所述检测所述第二服务器的智能平台管理接口是否正常,若不正常,则控制复杂可编程逻辑器件重启所述第二服务器,完成故障恢复,包括:检测所述第一服务器的...

【专利技术属性】
技术研发人员:曹卫国
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1