实现RAID卡故障自动转存的方法、装置及存储介质制造方法及图纸

技术编号:32164805 阅读:24 留言:0更新日期:2022-02-08 15:19
本发明专利技术提供一种实现RAID卡故障自动转存的方法及装置,所述方法步骤如下:RAID卡固件及BMC对同时RAID卡运行状态进行检测,判断RAID卡运行状态是否正常;当RAID卡固件检测到RAID卡报错信息时,主动收集RAID卡信息,并保存在缓存里,通过BMC转发到指定位置,形成第一故障信息;当BMC无法获取到RAID卡运行信息时,判断故障类型,并通过底层接口获取RAID卡信息,并转存到指定位置,形成第二故障信息;本发明专利技术通过第一和第二故障信息定位故障,并分析故障原因。通过RAID卡固件和BMC,实现及时有效的收集到疑难问题的RAID卡日志,防止RAID卡日志被清掉或被大量重复报错信息覆盖掉。被清掉或被大量重复报错信息覆盖掉。被清掉或被大量重复报错信息覆盖掉。

【技术实现步骤摘要】
实现RAID卡故障自动转存的方法、装置及存储介质


[0001]本专利技术属于RAID卡检测
,具体涉及一种实现RAID卡故障自动转存的方法、装置及存储介质。

技术介绍

[0002]RAID作为服务器的核心部件之一,其可靠性和稳定性在单台服务器或存储的应用中至关重要。RAID卡故障可能会导致服务器整机重启、宕机或者掉盘灯异常,而快速分析和定位问题的关键,是获取到故障时刻的日志信息或者关键打印信息。
[0003]当前RAID卡故障分析的手段,停留在系统下收集RAID卡日志和系统日志的阶段,手动收集所需日志,存在日志收集不全,日志被冲掉或清掉的问题,且对于系统宕机、崩溃以及RAID卡挂死等故障,只能在试验时复现问题收集串口日志来分析,时效性差,宕机问题更是经常由于无关键日志而无法分析。
[0004]此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种实现RAID卡故障自动转存的方法、装置及存储介质,是非常有必要的。

技术实现思路

[0005]针对现有技术的上述客户端发生宕机、自动重启及RAID卡挂死等严重本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种实现RAID卡故障自动转存的方法,其特征在于,包括如下步骤:S1.RAID卡固件及BMC同时对RAID卡运行状态进行检测,判断RAID卡运行状态是否正常;S2.当RAID卡固件检测到RAID卡报错信息或系统故障信息时,RAID卡固件主动收集RAID卡信息,并将收集的RAID卡信息保存在缓存里,通过BMC转发到指定位置,形成第一故障信息;S3.当BMC无法获取到RAID卡运行信息时,BMC判断故障类型,并通过底层接口获取RAID卡信息,并将RAID卡信息转存到指定位置,形成第二故障信息;S4.通过第一故障信息和第二故障信息定位故障,并分析故障原因。2.如权利要求1所述的实现RAID卡故障自动转存的方法,其特征在于,步骤S1具体步骤如下:S11.配置RAID卡和BMC通过基于设备管理协议的PCIE进行通信,同时为RAID卡配置备用电源;S12.RAID卡固件定期进行校验和训读操作,对RAID自身运行状态进行自检,并对操作系统运行状态进行检测;S13.BMC实时访问RAID卡,获取RAID卡运行数据,检测RAID卡固件运行状态,并定期收集RAID卡日志。3.如权利要求2所述的实现RAID卡故障自动转存的方法,其特征在于,步骤S12具体步骤如下:S121.RAID卡固件定期进行校验和训读操作,判断操作系统是否挂死;若否,进入步骤S122;若是,进入步骤S2;S122.RAID卡固件定期进行校验和训读操作,判断RAID卡中硬盘是否正常运行,以及硬盘中数据是否准确无异常;若RAID运行正常,返回步骤S121;若RAID卡运行有异常,进入步骤S2。4.如权利要求2所述的实现RAID卡故障自动转存的方法,其特征在于,步骤S13具体步骤如下:S131.BMC实时访问RAID卡,并判断是否可获取到RAID卡数据;若是,进入步骤S132;若否,进入步骤S3;S132.BMC获取RAID卡传感器数据以及控制器状态、硬盘状态信息,判断RAID卡固件是否正常运行;若是,进入步骤S133;若否,进入步骤S3;S133.BMC定期收集RAID卡日志,并将RAID卡日志转存备份。5.如权利要求2所述的实现RAID卡故障自动转存的方法,其特征在于,步骤S2具体步骤如下:S21.当RAID卡固件检测到操作系统挂死时,收集RAID卡日志及各寄存器的值,再将
RAID卡日志和各寄存器的值存储到缓存中,并通过BMC转发到指定位置,形成系统故障信息;S22.当RAID卡固件检测到硬盘故障掉盘、RAID阵列降级或者RAID卡错误时,收集硬盘环境信息、硬盘本体日志以及SMART日志,并将硬件环境信息、硬盘本体日志、SMART日志以及RAID卡日志保存到缓存中,并通过BMC转发到指定位置,形成硬盘故障信息;S23.RAID卡固件将系统故障信息和硬盘故障信息,生成第一故障信息。6.如权利要求1所述的实现RAID卡故障自动转存的方法,其特征在于,步骤S3具体步骤如下:S31.当BMC无法获取到RAID卡运行信息时,判断缓存日志和BMC转存的故障日志的状态;当只有缓存日志,而无BMC端转存的故障日志时,进入步骤S32;当只有BMC端转存的故障日志,而无缓存日志时,进入步骤S33;S32.判定RAID卡与BMC通信异常,进入步骤S34;S33.判定RAID卡固件挂死或备用电源异常,进入步骤S34;S34.BMC通过底层接口获取RAID卡的寄存器的值以及RAID卡各部分状态信息,并将RAID卡的寄存器的值以及RAID卡各部分状态信息转存到指定位置,形成第二故障信息。7.如权利要求1所述的实现RAID卡故障自动转存的方法,其特征在于,步骤S4具体步骤如下:S41.获取第一故障信息和第二故障...

【专利技术属性】
技术研发人员:李超
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1