【技术实现步骤摘要】
一种故障处理方法、装置及电子设备和存储介质
[0001]本申请涉及计算机
,更具体地说,涉及一种故障处理方法、装置及一种电子设备和一种计算机可读存储介质。
技术介绍
[0002]服务器作为运算及数据存储服务的核心在各行业广泛应用,当前在各行业业务需求的压力下,服务器设计的复杂度越来越高,并且在线运行的服务器数量呈指数级不断攀升。服务器在业务计算负载长时间不间断的运行过程中,由于小概率的硬件或软件异常导致服务器宕机的情况仍不可避免,在庞大的基数上若以每月1
‰
的宕机率进行统计,也会有较大数量的异常服务器宕机难以处理,另外非计划停机维修的时间越长,对终端客户产生的损失越严重。
[0003]因此,如何在服务器异常宕机后快速准确的实现故障部件的精准定位,缩短停机维修时间是本领域技术人员需要解决的技术问题。
技术实现思路
[0004]本申请的目的在于提供一种故障处理方法、装置及一种电子设备和一种计算机可读存储介质,在服务器异常宕机后实现了故障部件的精准定位,从而缩短了停机维修时间。
[0005]为实现上述目的,本申请提供了一种故障处理方法,包括:服务器开机后,获取所述服务器中部件的资源信息;在所述服务器异常宕机后,采集所述服务器中的部件对应的故障寄存器信息;利用故障诊断规则基于所述部件的资源信息和对应的故障寄存器信息进行故障部件的定位。
[0006]其中,利用故障诊断规则基于所述部件的资源信息和对应的故障寄存器信息进行故障部件的定位,包括:利用多条故障诊断规则基于 ...
【技术保护点】
【技术特征摘要】
1.一种故障处理方法,其特征在于,包括:服务器开机后,获取所述服务器中部件的资源信息;在所述服务器异常宕机后,采集所述服务器中的部件对应的故障寄存器信息;利用故障诊断规则基于所述部件的资源信息和对应的故障寄存器信息进行故障部件的定位;其中,利用故障诊断规则基于所述部件的资源信息和对应的故障寄存器信息进行故障部件的定位,包括:利用多条故障诊断规则基于所述部件的资源信息和对应的故障寄存器信息分别生成故障部件的定位结果;若仅存在一条定位结果,则输出所述定位结果;若存在多条定位结果,则判断多条定位结果是否一致;若是,则输出任一条定位结果;若否,则基于每条故障诊断规则的权重生成每条所述定位结果的加权值,输出加权值最大的定位结果。2.根据权利要求1所述故障处理方法,其特征在于,所述利用多条故障诊断规则基于所述部件的资源信息和对应的故障寄存器信息分别生成故障部件的定位结果,包括:利用每条故障诊断规则下各部件或各故障寄存器对应的故障诊断子规则基于所述部件的资源信息和对应的故障寄存器信息生成故障部件的定位结果;基于每条故障诊断子规则下各故障寄存器信息的权重和各部件相对于故障寄存器的权重生成各部件的故障加权值;将故障加权值最大的部件确定为故障部件。3.根据权利要求1所述故障处理方法,其特征在于,所述故障诊断规则包括CPU故障诊断规则,利用所述CPU故障诊断规则基于所述部件的资源信息和对应的故障寄存器信息分别生成故障部件的定位结果,包括:根据CPU中MC Bank寄存器的状态信息和地址信息生成定位结果;其中,所述定位结果包括CPU故障源、所述CPU故障源中的故障模块和故障类型。4.根据权利要求1所述故障处理方法,其特征在于,所述故障诊断规则包括历史故障记录诊断规则,利用所述历史故障记录诊断规则基于所述部件的资源信息和对应的故障寄存器信息分别生成故障部件的定位结果,包括:判断历史故障记录中是否存在与目标故障寄存器信息相关的故障事件;若是,则基于所述目标故障寄存器信息生成定位结果;其中,所述定位结果包括所述目标故障寄存器信息对应的部件。5.根据权利要求1所述故障处理方法,其特征在于,所述故障诊断规则包括故障时间诊断规则,利用所述故障时间诊断规则基于所述部件的资源信息和对应的故障寄存器信息分别生成故障部件的定位结果,包括:基于异常宕机之前预设时间段内产生的故障寄存器信息生成定位结果;其中,所述定位结果包括所述预设时间段内最晚产生的故障寄存器信息对应的部件。6.根据权利要求1所述故障处理方法,其特征在于,还包括:若每条所述故障诊断规则均不存在对应的定位结果,则输出故障日志;其中,所述故障日志包括所述部件的资源信息和对应的故障寄存器信息;
基于所述故障日志中的错误代码类型创建新的故障诊断规则。7.根据权利要求1所述故障处理方法,其特征在于,还包括:获取每个故障部件的每种故障类型的故障寄存器信息,以生成诊断故障树;其中,所述诊断故障树的第一层节点以故障部件进行分类,第二层...
【专利技术属性】
技术研发人员:陈衍东,李道童,韩红瑞,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。