一种故障处理方法、装置及设备制造方法及图纸

技术编号:43705906 阅读:20 留言:0更新日期:2024-12-18 21:18
本申请涉及一种故障处理方法、装置及设备,应用于基板管理控制器BMC,该方法包括:接收目标服务器发生故障时触发的中断消息,获取与故障对应的目标内存库Bank的目标数量;以预设位置为起点,从故障文件读取目标数量的第一寄存器的存储数据,并分别基于各第一寄存器的存储数据,确定包括第一寄存器的目标Bank;故障文件为在目标服务器发生故障时生成的,用于存储与目标服务器的当前故障相关的信息;预设位置为与故障相关的第一寄存器的存储数据在故障文件中的起始位置;针对每个目标Bank,从故障文件中查询与目标Bank对应的故障信息,并基于目标Bank对应的故障信息生成故障日志,提高了RAS故障检测的全面性和准确性。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及一种故障处理方法、装置及设备


技术介绍

1、目前,服务器不仅在传统应用中占据核心地位,还在云计算、大数据分析和人工智能等新兴领域中发挥着至关重要的作用。其中服务器因卓越性能受到广泛应用,但同时其故障诊断以及维护的问题逐渐出现。

2、相关技术中,在服务器发生ras(reliability,availability andserviceability,可靠性、可用性以及可维护性)故障导致重启时,触发bios(basic inputoutput system,基本输入输出系统)读取寄存器信息,并通过ipmi(intellingentplatform management interface,智能平台管理接口)协议将寄存器信息传输到bmc(board management controller,基板管理控制器)以进行故障解析。

3、但服务器发生ras故障时,可能存在除服务器重启之外的其他情况,如挂起等,在这种情况下,无法触发bios来获取寄存器信息,进而无法进行故障检测。


<p>技术实现思本文档来自技高网...

【技术保护点】

1.一种故障处理方法,其特征在于,应用于基板管理控制器BMC,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取与故障对应的目标Bank的目标数量,包括:

3.根据权利要求1所述的方法,其特征在于,所述第一寄存器的存储数据为高位地址存储的数据;所述分别基于各第一寄存器的存储数据,确定包括所述第一寄存器的目标Bank,包括:

4.根据权利要求1所述的方法,其特征在于,所述目标Bank还包括至少一个第二寄存器;所述目标Bank对应的故障信息包括各第二寄存器的存储数据;所述从所述故障文件中查询与所述目标Bank对应的故障信息,包括:

<...

【技术特征摘要】

1.一种故障处理方法,其特征在于,应用于基板管理控制器bmc,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取与故障对应的目标bank的目标数量,包括:

3.根据权利要求1所述的方法,其特征在于,所述第一寄存器的存储数据为高位地址存储的数据;所述分别基于各第一寄存器的存储数据,确定包括所述第一寄存器的目标bank,包括:

4.根据权利要求1所述的方法,其特征在于,所述目标bank还包括至少一个第二寄存器;所述目标bank对应的故障信息包括各第二寄存器的存储数据;所述从所述故障文件中查询与所述目标bank对应的故障信息,包括:

5.根据权利要求1~4任一所述的方法,其特征在于,所述方...

【专利技术属性】
技术研发人员:代炎罗青松黄洪胡远明秦晓宁
申请(专利权)人:宁畅信息技术杭州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1