一种故障信息管理方法及系统技术方案

技术编号:11213664 阅读:89 留言:0更新日期:2015-03-27 00:14
本发明专利技术提供一种故障信息管理方法及系统,上述方法包括以下步骤:可编程设备获取各种类型工作信号并将分析出的异常信号发送至控制设备;所述控制设备通过显示设备将所述异常信号进行显示并将所述异常信号存储至安全数码设备;本发明专利技术实现了故障信息的有效管理,对于后续快速定位硬件故障问题尤其是时序问题和电源问题,创造了有利条件。

【技术实现步骤摘要】
一种故障信息管理方法及系统
本专利技术属于故障定位领域,尤其涉及一种故障信息管理方法及系统。
技术介绍
飞速发展的业务需求带动了服务器行业巨大的技术变革,当服务器出现故障不能正常运行时,快速定位问题是快速解决问题的基本条件。传统的问题定位方法主要是通过光路诊断、系统日志等方法来定位故障产生的原因,但是传统方法都有些弊端:例如,光路诊断在断电后会丢失故障信息,而系统日志更多是定位软件故障,对于硬件问题定位尤其是时序问题和电源问题没有一种有效的故障信息管理方法,这对于后续的故障准确定位造成了一定的困难。
技术实现思路
本专利技术提供一种故障信息管理方法及系统,以解决上述问题。本专利技术提供一种故障信息管理方法,上述方法包括以下步骤:可编程设备获取各种类型工作信号并将分析出的异常信号发送至控制设备;所述控制设备通过显示设备将所述异常信号进行显示并将所述异常信号存储至安全数码设备。本专利技术还提供了一种故障信息管理系统,包括可编程设备、控制设备、显示设备、安全数码设备;其中,所述可编程设备通过所述控制设备分别与所述显示设备、所述安全数码设备相连;所述可编程设备,用于获取各种类型工作信号并将分析出的异常信号发送至所述控制设备;所述控制设备,用于通过所述显示设备将所述异常信号进行显示并将所述异常信号存储至所述安全数码设备;所述显示设备,用于显示所述控制设备发送的所述异常信号;所述安全数码设备,用于存储所述控制设备发送的所述异常信号。相较于先前技术,根据本专利技术提供的一种故障信息管理方法及系统,实现了故障信息的有效管理,对于后续快速定位硬件故障问题尤其是时序问题和电源问题,创造了有利条件。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1所示为本专利技术实施例1的故障信息管理方法流程图;图2所示为本专利技术实施例2的故障信息管理系统结构图。具体实施方式下文中将参考附图并结合实施例来详细说明本专利技术。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。图1所示为本专利技术实施例1的故障信息管理方法流程图,包括以下步骤:步骤101:可编程设备获取各种类型工作信号并将分析出的异常信号发送至控制设备;所述可编程设备是指现场可编程门阵列设备FPGA(Field-ProgrammableGateArray);所述控制设备是指主板管理控制器BMC(BaseboardManagementController)。工作信号类型包括:直流电信号、时序信号、电源信号即powergood信号、复位信号即reset信号、极限温度信号即thermaltrip信号。可编程设备获取各种类型工作信号后,实时监控获取的所述各种类型工作信号是否处于正常工作状态,并对分析出的异常信号进行记录;所述可编程设备将记录的异常信号发送至控制设备。例如:当电源接通之后.如果输入交流电压在额定工作范围之内.且各路直流输出电压也已达到它们的最低检测电平(+5V输出为4.75V以上).那么经过100ms~500m的延时.PowerGood电路发出“电源正常”的信号(PowerGood为高电平);当电源输入交流电压降至安全工作范围以下或+5电压低于4.75V时.电源送出“电源故障信号”(PowerFall,低电平)。步骤102:所述控制设备通过显示设备将所述异常信号进行显示并将所述异常信号存储至安全数码设备。所述显示设备是指液晶显示器LCD(LiquidCrystalDisplay);所述安全数码设备是指安全数码卡SDCARD(SecureDigitalMemoryCard)。例如:主板管理控制器通过显示设备将所述异常信号进行显示并将所述异常信号存储至安全数码卡SDCARD。下面进行具体说明:1.系统开机时,直流电信号、时序信号、电源信号即powergood信号、复位信号即reset信号、极限温度信号即thermaltrip信号是按照时序逻辑的,当FPGA设备发现某个信号处于正常工作状态,然后对应的下一个信号却始终不能处于正常工作状态,那么FPGA设备会将不能处于正常工作状态的信号记录下来作为异常信号,发送给主板管理控制器BMC并将该异常信号存储到SD卡中,同时也会在LCD显示屏上显示,从而通知用户或者研发人员问题产生的信号。2.系统处于正常工作状态时突然重启或者关机时,FPGA设备可以发现某个信号最先处于不正常的工作状态并作为异常信号,发送给主板管理控制器BMC并将该异常信号存储到SD卡中,同时也会在LCD显示屏上显示,从而让用户和研发人员知道产生问题的信号。所述控制设备定时统计预设时段内同一类型异常信号发生次数,根据异常信号发生次数范围与报警信息对照表,发送对应的报警信息至终端。其中,所述控制设备预先存储异常信号发生次数范围与报警信息对照表或者从第三方实体中获取异常信号发生次数范围与报警信息对照表。其中,所述终端是指管理员终端。定时时间、预设时段可以根据实际情况进行灵活设置,在此不限定本专利技术的保护范围。异常信号发生次数与报警信息对照表表1如表1所示,异常电源信号发生次数在1≤X<3范围内,则向终端发出“电源修复报警”;异常电源信号发生次数大于或等于3,则向终端发出“电源更换报警”。异常极限温度信号发生次数在1≤X<3范围内,则向终端发出“关机报警”;异常极限温度信号发生次数大于或等于3,则向终端发出“更换CPU报警”。图2所示为本专利技术实施例2的故障信息管理系统结构图,包括可编程设备、控制设备、显示设备、安全数码设备;其中,所述可编程设备通过所述控制设备分别与所述显示设备、所述安全数码设备相连;所述可编程设备,用于获取各种类型工作信号并将分析出的异常信号发送至所述控制设备;所述控制设备,用于通过所述显示设备将所述异常信号进行显示并将所述异常信号存储至所述安全数码设备;所述显示设备,用于显示所述控制设备发送的所述异常信号;所述安全数码设备,用于存储所述控制设备发送的所述异常信号。相较于先前技术,根据本专利技术提供的一种故障信息管理方法及系统,实现了故障信息的有效管理,对于后续快速定位硬件故障问题尤其是时序问题和电源问题,创造了有利条件。以上所述仅为本专利技术的优选实施例而已,并不用于限制本专利技术,对于本领域的技术人员来说,本专利技术可以有各种更改和变化。凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网...
一种故障信息管理方法及系统

【技术保护点】
一种故障信息管理方法,其特征在于,包括以下步骤:可编程设备获取各种类型工作信号并将分析出的异常信号发送至控制设备;所述控制设备通过显示设备将所述异常信号进行显示并将所述异常信号存储至安全数码设备。

【技术特征摘要】
1.一种故障信息管理方法,其特征在于,用于后续快速定位硬件故障问题,所述硬件故障问题包括时序问题和电源问题,包括以下步骤:可编程设备获取系统开机时按照时序逻辑的各种类型工作信号后,实时监控获取的所述各种类型工作信号是否处于正常工作状态,当发现某个信号处于正常工作状态,然后对应的下一个信号却始终不能处于正常工作状态时,将不能处于正常工作状态的信号作为异常信号,并对分析出的异常信号进行记录;所述各种类型工作信号包括:直流电信号、时序信号、电源信号、复位信号和极限温度信号;所述可编程设备将记录的异常信号发送至控制设备;所述控制设备通过显示设备将所述异常信号进行显示并将所述异常信号存储至安全数码设备;所述控制设备定时统计预设时段内同一类型异常信号发生次数,根据异常信号发生次数范围与报警信息对照表,发送对应的报警信息至终端;其中,异常电源信号发生次数在1≤X<3范围内,则向终端发出电源修复报警;异常电源信号发生次数大于或等于3,则向终端发出电源更换报警;异常极限温度信号发生次数在1≤X<3范围内,则向终端发出关机报警;异常极限温度信号发生次数大于或等于3,则向终端发出更换CPU报警。2.根据权利要求1所述的方法,其特征在于:所述可编程设备是指现场可编程门阵列设备FPGA;所述控制设备是指主板管理控制器BMC;所述显示设备是指液晶显示器LCD;所述安全数码设备是指安全数码卡SDCARD。3.根据权利要求1所述的方法,其特征在于:所述控制设备预先存储异常信号发生次数范围与报警信息对照表或者从第三方实体中获取异常信号发生次...

【专利技术属性】
技术研发人员:王永欢薛广营
申请(专利权)人:浪潮北京电子信息产业有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1