一种故障原因确定方法、装置、设备及介质制造方法及图纸

技术编号:39004768 阅读:19 留言:0更新日期:2023-10-07 10:36
本发明专利技术公开了一种故障原因确定方法、装置、设备及介质,涉及服务器技术领域。方案通过获取服务器内各部件的电流值和功耗值,将各部件的电流值与功耗值分别与对应的阈值进行比较,以判断部件是否发生故障,实现了故障部件的定位;进一步将故障部件的功耗值与其控制器的工作功耗值进行比较,以确定故障部件是总线数据传输故障还是部件供电硬件故障,实现了故障部件的故障原因和故障类型的定位,从而使运维人员及时定位部件故障原因并进行相应地维护处理,大大提高了服务器运维效率。大大提高了服务器运维效率。大大提高了服务器运维效率。

【技术实现步骤摘要】
一种故障原因确定方法、装置、设备及介质


[0001]本专利技术涉及服务器
,特别是涉及一种故障原因确定方法、装置、设备及介质。

技术介绍

[0002]目前,服务器中一般包含中央处理器(Central Processing Unit,CPU)、内存(Memory)、硬盘(Hard Disk Drive)以及高速串行计算机扩展总线标准(Peripheral Component Interconnect Express,PCIE)卡等部件。在服务器使用过程中,服务器内部的部件可能会出现故障,导致服务器上电开机时系统无法识别故障部件,服务器无法正常工作。因此,为了保证服务器正常运行,对故障部件的定位是服务器运维的重点之一。
[0003]当前对服务器中故障部件的定位是通过部件的在位信号实现:当系统未识别到某一部件,但该部件的在位信号显示部件在位时,认为该部件为故障部件。然而,这种方式仅能用于定位故障部件,不能确定故障部件的故障原因,例如供电故障、信号故障等,需要运维人员人工分析故障原因,效率低下。
[0004]鉴于上述问题,如何确定本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种故障原因确定方法,其特征在于,应用于基板管理控制器;所述方法包括:获取服务器内各部件的电流值和功耗值;判断各所述部件是否所述电流值不大于对应的电流阈值,且所述功耗值不大于对应的功耗阈值;若所述部件的所述电流值不大于对应的所述电流阈值,且所述功耗值不大于对应的所述功耗阈值,则确认所述部件为故障部件,并判断所述故障部件的所述功耗值是否大于所述故障部件对应控制器的工作功耗值;若所述功耗值大于所述工作功耗值,则确认所述故障部件的故障原因为总线数据传输故障;若所述功耗值不大于所述工作功耗值,则确认所述故障部件的故障原因为部件供电硬件故障。2.根据权利要求1所述的故障原因确定方法,其特征在于,所述获取服务器内各部件的电流值和功耗值包括:通过电流功耗监控芯片获取各所述部件的供电线路上的精密电阻两端的电压值;分别根据各所述电压值和对应所述精密电阻的电阻值获取对应的所述部件的所述电流值和所述功耗值。3.根据权利要求1所述的故障原因确定方法,其特征在于,在所述判断各所述部件是否所述电流值不大于对应的电流阈值,且所述功耗值不大于对应的功耗阈值之前,还包括:获取预先存储于带电可擦可编程只读存储器中的各所述部件对应的所述电流阈值和所述功耗阈值。4.根据权利要求1所述的故障原因确定方法,其特征在于,在所述确认所述故障部件的故障原因为总线数据传输故障之后,还包括:生成所述故障部件的故障日志;读取所述故障部件对应的所述控制器记录的故障数据,以查看所述故障原因。5.根据权利要求1所述的故障原因确定方法,其特征在于,在所述确认所述故障部件的故障原因为部件供电硬件故障之后,还包括:生成所述故障部件的故障日志;输出表征部件供电硬件故障的告警信息。6.根据权利要求1至5任意一项所述的故障原因确定方法,其特征...

【专利技术属性】
技术研发人员:王培培
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1