故障诊断方法、装置、计算机设备、存储介质及系统制造方法及图纸

技术编号:38545771 阅读:18 留言:0更新日期:2023-08-22 20:55
本发明专利技术涉及通信技术领域,公开了一种故障诊断方法、装置、计算机设备、存储介质及系统。其中,故障诊断方法包括:向待检测服务器发送数据获取指令,以获取到所述待检测服务器中目标网卡的寄存器数据,所述目标网卡的寄存器数据是在所述待检测服务器的操作系统下收集到的;对所述寄存器数据中的数据位进行分析,确定所述目标网卡的故障诊断结果。根据本发明专利技术实施例的方案,能够避免OCP(Open Compute Project,开放计算项目)网卡中许多故障类型对应的故障无法检测到的情况,进而能够降低服务器系统宕机的概率。器系统宕机的概率。器系统宕机的概率。

【技术实现步骤摘要】
故障诊断方法、装置、计算机设备、存储介质及系统


[0001]本专利技术涉及通信
,具体涉及故障诊断方法、装置、计算机设备、存储介质及系统。

技术介绍

[0002]传统服务器中,不可避免地会出现各种设备故障问题,例如网卡故障、内存故障、PCIE(Peripheral Component Interconnect Express,高速串行计算机扩展总线)总线挂死、GPU(Graphics Processing Unit,图形处理器)故障、OCP(Open Compute Project,开放计算项目)网卡故障等问题,最终,设备故障可能会导致服务器系统宕机。
[0003]相关技术中,BMC(Baseboard Management Controller,基板管理控制器)通常基于MCTP(Management Component Transport Protocol,管理组建传输协议)获取服务器内部设备的设备状态信息,通过PECI(Platform Environment Control Interface,平台环境式控制接口)带外获取C本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种故障诊断方法,其特征在于,所述方法包括:向待检测服务器发送数据获取指令,以获取到所述待检测服务器中目标网卡的寄存器数据,所述目标网卡的寄存器数据是在所述待检测服务器的操作系统下收集到的;对所述寄存器数据中的数据位进行分析,确定所述目标网卡的故障诊断结果。2.根据权利要求1所述的方法,其特征在于,所述对所述寄存器数据中的数据位进行分析,确定目标网卡的故障诊断结果,包括:对所述寄存器数据中的数据位进行分析,以确定所述数据位中的第一寄存器数据位是否有效;当确定第一寄存器数据位有效,根据所述数据位中的第二寄存器数据位,确定目标网卡的故障诊断结果。3.根据权利要求2所述的方法,其特征在于,所述第二寄存器数据位有多个,所述根据所述数据位中的第二寄存器数据位,确定目标网卡的故障诊断结果,包括:从多个所述第二寄存器数据位中确定是否存在被置位的寄存器数据位;当确定存在被置位的寄存器数据位,将所述被置位的寄存器数据位作为目标寄存器数据位;根据所述目标寄存器数据位,从预设的故障诊断列表中,确定与所述目标寄存器数据位对应的目标网卡的故障诊断结果,其中,所述故障诊断列表包括候选寄存器数据位与候选诊断结果之间的对应关系。4.根据权利要求1所述的方法,其特征在于,所述寄存器数据是通过如下方式收集到的:在服务器操作系统下,获取所述待检测服务器中目标网卡的运行数据;若所述运行数据存在异常,收集所述目标网卡的寄存器数据;将所述寄存器数据存储至基板管理控制器。5.根据权利要求4所述的方法,其特征在于,所述将所述寄存器数据存储至基板管理控制器,包括:基于交互文档,调用所述待检测服务器中的脚本将所述寄存器数据存储至所述基板管理控制器,...

【专利技术属性】
技术研发人员:麻书卫
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1