一种服务器中管理控制器故障保护的方法及系统技术方案

技术编号:16557110 阅读:20 留言:0更新日期:2017-11-14 16:43
一种服务器中管理控制器故障保护的方法及系统,首先将服务器的管理控制器调试信号输出端、复位信号输入端分别与管理控制器连接;然后故障保护装置根据管理控制器发来的数据进行判断,当发来的是管理控制器的初始化信息时,则不做处理;当发来的是管理控制器间隔发送的指定的数据,则故障保护装置开始计时,并在下次收到相同的所述指定的数据时,将故障保护装置计时的值清零;当计时的值达到预设值时,故障保护装置未接收到管理控制器发送的指定的数据,则发送复位信号将管理控制器复位。通过本发明专利技术的方法及系统可以缩短管理控制器出现故障时,对其进行复位恢复所需要的时间;增加的管理控制器正常工作的时间,提升服务器的可靠性。

Method and system for fault protection of management controller in server

A method and a system controller fault protection management server, the server management controller debugging signal output end, a reset signal input end are respectively connected with the management controller; then a fault protection device according to the data sent by the management controller to determine when is sent to the initialization information management controller, then do not handle; when is sent to the controller sends the specified interval management data, then the fault protection device start time, and the next received the same the specified data, zero value will fault protection time; when the time reaches the preset value, the fault protection device does not receive a management controller sends the specified the data is sent to management controller reset reset signal. The method and system of the invention can shorten management controller failure, reset the time needed for recovery of the normal work; management controller to increase the time, enhance the reliability of server.

【技术实现步骤摘要】
一种服务器中管理控制器故障保护的方法及系统
本专利技术涉及一种服务器保护系统,属于计算机
,尤其涉及一种服务器中管理控制器故障保护的方法及系统
技术介绍
服务器中的可编程控制器工作时,可能会发生功能异常、无法执行预定程序等问题。遇到这种情况,需要对可编程控制器进行复位。现有技术的处理方式如下所示:将可编程控制器的复位信号连接到看门狗watchdog电路或设备上,可编程控制器不断向watchdog电路发送脉冲信号,当可编程控制器出现故障时,程序无法执行脉冲信号无法发出。Watchdog电路不断进行计时,并在收到脉冲信号后清零计时的值。当计时时间达到预设值时,由于脉冲信号没发出来,计时器没有及时清零导致计时时间到达预定值,watchdog电路向可编程控制器发出复位信号,保证可编程控制器正常工作。在服务器设计中,经常会用到管理控制器对服务器的风扇、电压、功耗、错误信息等进行监控和控制。管理控制器也是上述可编程控制器的一种,为保证服务器可靠性,也需要在管理控制器出现故障的时候复位管理控制器。管理控制器在上电启动的时候需要进行初始化,其初始化需要一段时间,一般在1分钟以上。如果采用上述现有技术对管理控制器进行监控和复位,其计时时间一定要超过管理控制器初始化需要的时间,否则会导致管理控制器在上电启动时,未完成初始化,就在watchdog电路控制下进行复位,因而无法启动的现象。而计时时间过长的缺点在于,在管理控制器出现故障的时候,需要等很长时间才能复位恢复正常工作。这会导致管理控制器在很长时间内无法监控服务器的重要信息,对服务器的可靠性来说是不利的。
技术实现思路
专利技术提供一种服务器中管理控制器故障保护的方法及系统,用以解决现有技术中管理控制器watchdog的计时时间过长,需要较长时间才能复位恢复正常工作,使管理控制器发生无法监控服务器的安全隐患。本专利技术通过以下技术方案予以实现:一种服务器中管理控制器故障保护的方法,包括以下步骤:S1.将服务器的管理控制器调试串口信号输出端接到故障保护装置的信号输入端,故障保护装置的复位信号输出端连接管理控制器的复位信号输入端,用以通过故障保护装置控制管理控制器复位。S2.当管理控制器出现故障进行初始化时,管理控制器通过调试串口信号输出端连续向故障保护装置发送当前的初始化状态信息,用于指示管理控制器初始化程度;当管理控制器初始化正常工作时,管理控制器会间隔通过调试串口信号输出端向故障保护装置发送指定的数据。S3.故障保护装置根据管理控制器调试串口信号输出端发来的数据进行判断,当调试串口信号输出端发来的是管理控制器的初始化信息时,则不做处理;当调试串口信号输出端发来的是管理控制器间隔发送的指定的数据,则故障保护装置开始计时,并在下次收到相同的所述指定的数据时,将故障保护装置计时的值清零;当计时的值达到预设值时,故障保护装置未接收到管理控制器调试串口信号输出端发送的指定的数据,则发送复位信号将管理控制器复位。如上所述的一种服务器中管理控制器故障保护的方法,所述步骤S3故障保护装置计时的预设值为20~40秒。如上所述的一种服务器中管理控制器故障保护的方法,所述故障保护装置为复杂可编程逻辑器件CPLD或现场可编程门阵列FPGA。如上所述的一种服务器中管理控制器故障保护的方法,所述故障保护装置为watchdog电路。一种服务器中管理控制器故障保护的系统,包括服务器,所述服务器的管理控制器调试串口信号输出端接到故障保护装置的信号输入端,故障保护装置的复位信号输出端连接管理控制器的复位信号输入端,所述故障保护装置设置有比较模块和计时模块,所述比较模块用于对管理控制器调试串口信号输出端发来的数据进行判断,当调试串口信号输出端发来的是管理控制器的初始化信息时,则不做处理;当调试串口信号输出端发来的是管理控制器间隔发送的指定的数据,则将所述计时模块启动计时,并在下次收到所述指定的数据时,将计时模块计时的值清零;当计时的值达到预设值时,故障保护装置未接收到管理控制器调试串口信号输出端发送的指定的数据,则发送复位信号将管理控制器复位。如上所述的一种服务器中管理控制器故障保护的系统,所述故障保护装置为复杂可编程逻辑器件CPLD或现场可编程门阵列FPGA。如上所述的一种服务器中管理控制器故障保护的系统,所述计时模块计时的预设值为20~40秒。与现有技术相比,本专利技术的优点是:本专利技术针对现有技术中管理控制器watchdog的计时时间过长的缺点,采用管理控制器在初始化过程中和正常工作过程中向CPLD/FPGA发送不同的串口信息,CPLD/FPGA对该信息进行判断,并根据判断结果决定是否复位。通过本专利技术的方法及系统可以缩短管理控制器出现故障时,对其进行复位恢复所需要的时间;增加的管理控制器正常工作的时间,提升服务器的可靠性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍。图1是本专利技术系统的电气原理图。图2是本专利技术方法的流程图。附图标记:1-管理控制器,2-串口数据线,3-复位数据线,4-故障保护装置,41-比较模块,42-计时模块。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。如图1所示,本实施例一种服务器中管理控制器故障保护的系统,包括服务器,服务器的管理控制器1调试信号输出端通过串口数据线2与故障保护装置4的信号输入端连接,故障保护装置4的复位信号输出端通过复位数据线3与管理控制器的复位信号输入端连接,从而可以通过故障保护装置4对管理控制器1进行复位。管理控制器4设置有比较模块41和计时模块42,比较模块41用于对管理控制器1调试串口发来的数据进行判断,当调试串口发来的是管理控制器1的初始化信息时,则不做处理;当调试串口发来的是管理控制器1初始化完成后间隔发送的指定数据,则将所述计时模块42启动计时,并在下次收到所述指定数据时,将计时模块42计时的值清零;当计时的值达到预设值时,故障保护装置4未接收到管理控制器发送的指定数据,则通过复位信号将管理控制器1复位。进一步的,计时模块42计时的预设值为30秒。本专利技术还提供了一种服务器中管理控制器故障保护的方法,包括以下步骤:首先将服务器的管理控制器1调试信号输出端接到故障保护装置4的信号输入端,故障保护装置4的复位信号输出端连接管理控制器1的复位信号输入端,用以通过故障保护装置4控制管理控制器1复位。当管理控制器1出现故障进行初始化时,管理控制器1通过调试串口连续向故障保护装置4发送当前的初始化状态信息,用于指示管理控制器1初始化程度;当管理控制器1初始化正常工作时,管理控制器1会间隔通过调试串口向故障保护装置4发送指定的数据。然后故障保护装置4通过管理控制器1调试串口发来的数据进行判断,当调试串口发来的是管理控制器1的初始化信息时,则不做处理;当调试串口发来的是管理控制器1初始化完成后间隔发送的指定数据,则故障保护装置4开始计时,并在下次收到相同的所述指定数据时,将故障保护装置4计时的值清零;当计时的值达到预设值时,故障保护装本文档来自技高网...
一种服务器中管理控制器故障保护的方法及系统

【技术保护点】
一种服务器中管理控制器故障保护的方法,其特征在于,包括以下步骤:S1.将服务器的管理控制器调试串口信号输出端接到故障保护装置的信号输入端,故障保护装置的复位信号输出端连接管理控制器的复位信号输入端,用以通过故障保护装置控制管理控制器复位;S2.当管理控制器出现故障进行初始化时,管理控制器通过调试串口信号输出端连续向故障保护装置发送当前的初始化状态信息,用于指示管理控制器初始化程度;当管理控制器初始化正常工作时,管理控制器会间隔通过调试串口信号输出端向故障保护装置发送指定的数据;S3.故障保护装置根据管理控制器调试串口信号输出端发来的数据进行判断,当调试串口信号输出端发来的是管理控制器的初始化信息时,则不做处理;当调试串口信号输出端发来的是管理控制器间隔发送的指定的数据,则故障保护装置开始计时,并在下次收到相同的所述指定的数据时,将故障保护装置计时的值清零;当计时的值达到预设值时,故障保护装置未接收到管理控制器调试串口信号输出端发送的指定的数据,则发送复位信号将管理控制器复位。

【技术特征摘要】
1.一种服务器中管理控制器故障保护的方法,其特征在于,包括以下步骤:S1.将服务器的管理控制器调试串口信号输出端接到故障保护装置的信号输入端,故障保护装置的复位信号输出端连接管理控制器的复位信号输入端,用以通过故障保护装置控制管理控制器复位;S2.当管理控制器出现故障进行初始化时,管理控制器通过调试串口信号输出端连续向故障保护装置发送当前的初始化状态信息,用于指示管理控制器初始化程度;当管理控制器初始化正常工作时,管理控制器会间隔通过调试串口信号输出端向故障保护装置发送指定的数据;S3.故障保护装置根据管理控制器调试串口信号输出端发来的数据进行判断,当调试串口信号输出端发来的是管理控制器的初始化信息时,则不做处理;当调试串口信号输出端发来的是管理控制器间隔发送的指定的数据,则故障保护装置开始计时,并在下次收到相同的所述指定的数据时,将故障保护装置计时的值清零;当计时的值达到预设值时,故障保护装置未接收到管理控制器调试串口信号输出端发送的指定的数据,则发送复位信号将管理控制器复位。2.根据权利要求1所述的一种服务器中管理控制器故障保护的方法,其特征在于,所述步骤S3故障保护装置计时的预设值为20~40秒。3.根据权利要求1所述的一种服务器中管理控制器故障保护的方法,其特...

【专利技术属性】
技术研发人员:程万前
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1