服务器故障检测方法及装置制造方法及图纸

技术编号:15762850 阅读:127 留言:0更新日期:2017-07-05 23:07
本发明专利技术涉及通信技术领域,公开了一种服务器故障检测方法,包括将主板上的GPIO信号连接至记录芯片;记录芯片与基板管理控制器相连接;基板管理控制器实时读取记录芯片中GPIO信号的状态;判断GPIO信号的状态是否发生变化,如果是,基板管理控制器对应记录一条日志,如果否,则基板管理控制器继续读取记录芯片中GPIO信号的状态。本发明专利技术还公开了一种服务器故障检测装置,包括连接配置模块、GPIO信号状态读取模块和判断模块。本发明专利技术在主板上GPIO信号发生变化时,能够实时记录GPIO信号状态的变化和GPIO信号状态发生变化的时间,便于快速的确认故障原因。

Server fault detection method and device

The present invention relates to the technical field of communication, and discloses a server fault detection method, including the GPIO signal on the motherboard connected to the recording chip; recording the chip and the substrate management controller is connected; the substrate management controller reads real-time recording GPIO signal chip in the state; judging the state of the GPIO signal is changed or not, if it is, the substrate management the controller corresponding to record a log, if not, then the substrate management controller to continue reading the recording GPIO signal chip state. The invention also discloses a server fault detection device, which comprises a connection configuration module, a GPIO signal state reading module and a judgment module. When the GPIO signal changes on the mainboard, the invention can record the change of the GPIO signal state and the time of the change of the GPIO signal status in real time, so as to quickly confirm the cause of the fault.

【技术实现步骤摘要】
服务器故障检测方法及装置
本专利技术涉及通信
,特别是涉及一种服务器故障检测方法及装置。
技术介绍
随着大数据时代的到来,互联网业务量出现猛烈增长,计算量及计算频率随之增大;在服务器系统中,业务计算量的增加,使得服务器的运载压力变大,其核心部件如CPU(中央处理器:CentralProcessingUnit)、内存、硬盘等发热量变大,机器内部温度升高,核心部件所能承受的温度是有一定限制的,如果达到承受点,性能会降低,元器件的寿命会降低,甚至服务器不能使用。主板上有一些重要的GPIO(通用输入/输出:GeneralPurposeInputOutput)信号,这些GPIO信号的状态直接决定了服务器的运行状态,如CPUError信号、风扇状态监控信号、内存Error信号等,当服务器运行发生故障时,可以通过这些信号的状态以及信号状态发生变化的时间来定位故障原因。如图1所示,为优化前GPIO信号控制主板状态的示意图。假定主板上有4组重要的GPIO信号,4组GPIO信号通过电平的高低变化,都可以实现对主板工作状态的控制;信号的高低电平一旦发生变化,主板将会处于异常工作状态,有的会导致服务器性能降低,严重的甚至会导致服务器宕机。但是,当服务器处于异常工作状态的情况下,我们并不能及时的了解具体是哪一组GPIO信号的电平状态发生了变化,什么时间发生的变化,这就不利于我们及时的处理故障及分析故障原因。
技术实现思路
本专利技术目的是提供一种服务器故障检测方法及装置,在主板上GPIO信号发生变化时,能够实时记录GPIO信号状态的变化和GPIO信号状态发生变化的时间,便于快速的确认故障原因。为了实现上述目的,本专利技术采用以下的技术方案:本专利技术提供一种服务器故障检测方法,包括以下步骤:A.将主板上的GPIO信号连接至记录芯片;B.记录芯片与基板管理控制器相连接;C.基板管理控制器实时读取记录芯片中GPIO信号的状态;D.判断GPIO信号的状态是否发生变化,如果是,基板管理控制器对应记录一条日志;如果否,则转步骤C。优选地,在步骤B之后还包括:记录芯片实时记录GPIO信号的状态。优选地,所述日志包括GPIO信号状态的变化和GPIO信号状态发生变化的时间。优选地,在步骤D之后,还包括:通过基板管理控制器中记录的日志进行故障的定位以及分析。优选地,将主板上的GPIO信号连接至记录芯片的GPIO端口。优选地,步骤B具体包括:记录芯片的I2C总线端口与基板管理控制器的I2C端口相连接。本专利技术还提供一种服务器故障检测装置,包括:连接配置模块,用于将主板上的GPIO信号连接至记录芯片以及记录芯片与基板管理控制器相连接;GPIO信号状态读取模块,用于基板管理控制器实时读取记录芯片中GPIO信号的状态;判断模块,用于判断GPIO信号的状态是否发生变化。优选地,还包括:GPIO信号状态记录模块,用于记录芯片实时记录GPIO信号的状态。优选地,还包括:故障定位及分析模块,用于通过基板管理控制器中记录的日志进行故障的定位以及分析。与现有技术相比,本专利技术具有以下优点:本专利技术在原有设计的基础上,增加了对GPIO信号实时监控记录的设计,将主板上的GPIO信号连接至记录芯片,记录芯片与基板管理控制器相连接,记录芯片会实时记录GPIO信号的高低电平变化,同时基板管理控制器会实时读取记录芯片中GPIO信号的状态,当发现GPIO信号的高低电平发生变化,基板管理控制器会详细记录GPIO信号的电平变化以及GPIO信号电平发生变化的时间,便于快速的确认故障原因;与此同时,这种设计还提高了产品的可维护性及产品的市场竞争力。上述服务器故障检测方法的有益效果与服务器故障检测装置的有益效果类似,此处不再赘述。附图说明图1是优化前GPIO信号控制主板状态的示意图;图2是本专利技术一种服务器故障检测方法的流程示意图;图3是本专利技术一种服务器故障检测装置的结构示意图;图4是本专利技术优化后GPIO信号控制主板状态及实时监控原理图。具体实施方式为了便于理解,对本专利技术中出现的部分名词作以下解释说明:BMC:基板管理控制器(BaseboardManagementController),服务器系统中,我们通常使用BMC来对主板的健康状况进行监控和管理,主板上的一些重要的参数如电压、温度、功耗等都是通过BMC监控记录的。下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述:本实施例提供一种服务器故障检测方法,包括以下步骤:A.将主板上的GPIO信号连接至记录芯片;B.记录芯片与基板管理控制器相连接;C.基板管理控制器实时读取记录芯片中GPIO信号的状态;D.判断GPIO信号的状态是否发生变化,如果是,基板管理控制器对应记录一条日志;如果否,则转步骤C。请参考图2,图2是本专利技术一种服务器故障检测方法的流程示意图,本实施例提供一种服务器故障检测方法,包括以下步骤:步骤S201,将主板上的GPIO信号连接至记录芯片;在本实施例中,将主板上的GPIO信号连接至记录芯片的GPIO端口。步骤S202,记录芯片与基板管理控制器相连接;在本实施例中,记录芯片的I2C(Inter-IntegratedCircuit)总线端口和BMC上的I2C端口相连接。步骤S203,记录芯片实时记录GPIO信号的状态;在本实施例中,记录芯片实时记录GPIO信号的高低电平变化。步骤S204,基板管理控制器实时读取记录芯片中GPIO信号的状态;在本实施例中,BMC通过I2C总线实时读取记录芯片中GPIO信号的状态。步骤S205,判断GPIO信号的状态是否发生变化,如果是,则转步骤S206;如果否,则转步骤S204;在本实施例中,判断GPIO信号的高低电平是否发生变化,如果发生变化,BMC会实时记录一条日志,该日志包括GPIO信号状态的变化和GPIO信号状态发生变化的时间,最多可以记录4组GPIO信号状态的变化。步骤S206,基板管理控制器对应记录一条日志;步骤S207,通过基板管理控制器中记录的日志进行故障的定位以及分析。请参考图4,本专利技术在原有设计的基础上,增加了对GPIO信号实时监控记录的设计,将主板上的GPIO信号控制主板状态的同时,连接至记录芯片的GPIO端口,记录芯片与基板管理控制器相连接,记录芯片会实时记录GPIO信号的高低电平变化,同时基板管理控制器会实时读取记录芯片中GPIO信号的状态,当发现GPIO信号的高低电平发生变化,基板管理控制器会详细记录GPIO信号的电平变化以及GPIO信号电平发生变化的时间,便于快速的确认故障原因;与此同时,这种设计还提高了产品的可维护性及产品的市场竞争力。本专利技术实施例还提供一种服务器故障检测装置,包括:连接配置模块,用于将主板上的GPIO信号连接至记录芯片以及记录芯片与基板管理控制器相连接;GPIO信号状态读取模块,用于基板管理控制器实时读取记录芯片中GPIO信号的状态;判断模块,用于判断GPIO信号的状态是否发生变化。请参考图3,图3是本专利技术一种服务器故障检测装置的结构示意图;本实施例提供一种服务器故障检测装置,包括:连接配置模块301、GPIO信号状态记录模块302、GPIO信号状态读取模块303、判断模块304和故障定位及分析模块305,连接配置模块301依次顺序与GPIO本文档来自技高网...
服务器故障检测方法及装置

【技术保护点】
一种服务器故障检测方法,其特征在于,包括以下步骤:A.将主板上的GPIO信号连接至记录芯片;B.记录芯片与基板管理控制器相连接;C.基板管理控制器实时读取记录芯片中GPIO信号的状态;D.判断GPIO信号的状态是否发生变化,如果是,基板管理控制器对应记录一条日志;如果否,则转步骤C。

【技术特征摘要】
1.一种服务器故障检测方法,其特征在于,包括以下步骤:A.将主板上的GPIO信号连接至记录芯片;B.记录芯片与基板管理控制器相连接;C.基板管理控制器实时读取记录芯片中GPIO信号的状态;D.判断GPIO信号的状态是否发生变化,如果是,基板管理控制器对应记录一条日志;如果否,则转步骤C。2.根据权利要求1所述的服务器故障检测方法,其特征在于,在步骤B之后还包括:记录芯片实时记录GPIO信号的状态。3.根据权利要求1所述的服务器故障检测方法,其特征在于,所述日志包括GPIO信号状态的变化和GPIO信号状态发生变化的时间。4.根据权利要求3所述的服务器故障检测方法,其特征在于,在步骤D之后,还包括:通过基板管理控制器中记录的日志进行故障的定位以及分析。5.根据权利要求1所述的服务器故障检测方法,其特征在于,将主板...

【专利技术属性】
技术研发人员:张锋
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1