本申请公开了一种BBU故障诊断方法,首先通过供电切换数据判断出供电源在由主供电源切换至目标BBU的过程中是否正常,若不正常则可准确讲故障定位在切换逻辑;若正常,则后续通过目标BBU的硬件信号确定其工作状态,并基于工作状态确定目标BBU在运行过程中是否出现异常,若出现异常则通过故障模拟来进一步确定引发该异常的具体异常源头,以便于进行针对性的修复使其恢复正常。通过对BBU实际运作流程的深入分析,对所有可能引发BBU故障的源头逐层判断,以逐渐提升故障确定的准确率,基于机器的全自动运行流程也有效降低了售后服务成本。本申请还同时公开了一种BBU故障诊断装置、电子设备及可读存储介质,具有上述有益效果。
A fault diagnosis method, device, electronic equipment and storage medium for BBU
【技术实现步骤摘要】
一种BBU故障诊断方法、装置、电子设备及存储介质
本申请涉及存储系统运行保障
,特别涉及一种BBU故障诊断方法、装置、电子设备及可读存储介质。
技术介绍
在大数据时代,对存储设备的可靠性提出了更高要求,尤其对备份电池单元(BBU)、一次电源相关问题分析定位效率、准确性提出更高要求。一旦存储系统出现BBU/PSU(工业电源)的相关问题,均需要进行分析、测试和验证过程。传统技术往往需要工作人员亲临客户设备现场进行手动调试分析,工作人员需要对调取到的BBU工作日志进行逐条查看,不仅效率低下,而且基于人的不稳定性还很容易出现遗漏。尤其是一些复现难度高的现场低概率问题更是难以发现和溯源。这些问题均延长了存储产品设计开发验证周期,增加了售后服务成本,降低了存储产品稳定性、可靠性。因此,如何克服上述现有技术缺陷,是本领域技术人员亟待解决的问题。
技术实现思路
本申请提供了一种BBU故障诊断方法、装置、电子设备及可读存储介质,旨在提供一种可全自动化执行的BBU故障诊断方法,结合BBU实际工作情况,充分利用机器无遗漏、实时监控的特点来降低故障分析成本、售后服务成本,提高存储产品稳定性和可靠性。为实现上述目的,本申请一种BBU故障诊断方法,包括:根据供电切换数据确定能否将供电源正常切换至目标BBU;若能够正常切换至所述目标BBU,则根据所述目标BBU的硬件信号确定所述目标BBU的工作状态;当根据所述硬件信号确定所述工作状态处于异常状态时,通过故障模拟导致引发异常状态的各种原因确定准确的异常源头。可选的,根据供电切换数据确定能否将供电源正常切换至目标BBU,包括:获取PSU在每个时间点的输出电压值;获取AC_FAIL信号和放电使能信号的出现时间;计算得到所述AC_FAIL信号与所述放电使能信号之间的第一时间间隔;计算得到所述AC_FAIL信号出现到所述PSU的输出电压值下降至预设电压值的第二时间间隔;根据所述第一时间间隔和所述第二时间间隔确定能否将所述供电源正常切换至所述目标BBU。可选的,根据所述目标BBU的硬件信号确定所述目标BBU的工作状态,包括:获取所述目标BBU的系统在位信号、充/放电使能信号、内部放电使能信号以及AC_FAIL信号;根据所述系统在位信号、所述充/放电使能信号、所述内部放电使能信号以及所述AC_FAIL信号确定所述目标BBU的硬件接口信号的质量和高低电平变化情况;获取所述目标BBU的I2C链路上的SCL/SDA信号;根据所述质量、所述高低电平变化情况以及所述SCL/SDA信号确定所述目标BBU的工作状态。可选的,当根据所述硬件信号确定所述工作状态处于正常状态时,还包括:获取存储系统与所述目标BBU的通信数据;根据所述通信数据验证所述目标BBU是否存在程序运行错误。可选的,在通过故障模拟导致引发异常状态的各种原因确定准确的异常源头之后,还包括:判断所述异常源头能够自动修复;若无法自动修复,则通过预设路径发送手动修复提示。为实现上述目的,本申请还提供了一种BBU故障诊断装置,包括:供电源正常切换确定单元,用于根据供电切换数据确定能否将供电源正常切换至目标BBU;硬件接口信号分析确定单元,用于当能够正常切换至所述目标BBU时,根据所述目标BBU的硬件信号确定所述目标BBU的工作状态;异常源头定位单元,用于当根据所述硬件信号确定所述工作状态处于异常状态时,通过故障模拟导致引发异常状态的各种原因确定准确的异常源头。可选的,所述供电源正常切换确定单元包括:PSU输出电压值获取子单元,用于获取PSU在每个时间点的输出电压值;信号出现时间获取子单元,用于获取AC_FAIL信号和放电使能信号的出现时间;第一时间间隔计算子单元,用于计算得到所述AC_FAIL信号与所述放电使能信号之间的第一时间间隔;第二时间间隔计算子单元,用于计算得到所述AC_FAIL信号出现到所述PSU的输出电压值下降至预设电压值的第二时间间隔;供电源正常切换确定子单元,用于根据所述第一时间间隔和所述第二时间间隔确定能否将所述供电源正常切换至所述目标BBU。可选的,所述硬件信号分析确定单元包括:硬件接口信号获取子单元,用于获取所述目标BBU的系统在位信号、充/放电使能信号、内部放电使能信号以及AC_FAIL信号;硬件接口信号分析子单元,用于根据所述系统在位信号、所述充/放电使能信号、所述内部放电使能信号以及所述AC_FAIL信号确定所述目标BBU的硬件接口信号的质量和高低电平变化情况;I2C链路信号获取子单元,用于获取所述目标BBU的I2C链路上的SCL/SDA信号;工作状态确定子单元,用于根据所述质量、所述高低电平变化情况以及所述SCL/SDA信号确定所述目标BBU的工作状态。可选的,当根据所述硬件信号确定所述工作状态处于正常状态时,该BBU故障诊断装置还包括:通信数据获取单元,用于获取存储系统与所述目标BBU的通信数据;程序运行错误存在验证单元,用于根据所述通信数据验证所述目标BBU是否存在程序运行错误。可选的,在通过故障模拟导致引发异常状态的各种原因确定准确的异常源头之后,该BBU故障诊断装置还包括:自动修复判断单元,用于判断所述异常源头能够自动修复;手动修复提示发送单元,用于若无法自动修复,则通过预设路径发送手动修复提示。为实现上述目的,本申请还提供了一种电子设备,包括:存储器,用于存储计算机程序;处理器,用于在执行所述计算机程序时实现如上述内容所描述的BBU故障诊断方法的各步骤。为实现上述目的,本申请还提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序在被处理器执行时可实现如上述内容所描述的BBU故障诊断方法的各步骤。本申请提供的一种BBU故障诊断方法包括:根据供电切换数据确定能否将供电源正常切换至目标BBU;若能够正常切换至所述目标BBU,则根据所述目标BBU的硬件接口信号确定所述目标BBU的工作状态;当根据所述硬件接口信号确定所述工作状态处于异常状态时,通过故障模拟导致引发异常状态的各种原因确定准确的异常源头。根据本申请提供的BBU故障诊断方法可以看出,首先通过供电切换数据判断出供电源在由主供电源切换至目标BBU的过程中是否正常,若未正常切换至目标BBU即可准确讲故障定位在切换逻辑;若正常切换至目标BBU,则后续通过目标BBU的硬件信号确定其工作状态,并基于工作状态确定目标BBU在运行过程中是否出现异常,若出现异常则通过故障模拟来进一步确定引发该异常的具体异常源头,以便于进行针对性的修复使其恢复正常。本申请通过对BBU实际运作流程的深入分析,对所有可能引发BBU故障的源头进行了分层判断,以逐渐提升故障确定的准确率,基于机器的全自动运行流程也本文档来自技高网...
【技术保护点】
1.一种BBU故障诊断方法,其特征在于,包括:/n根据供电切换数据确定能否将供电源正常切换至目标BBU;/n若能够正常切换至所述目标BBU,则根据所述目标BBU的硬件信号确定所述目标BBU的工作状态;/n当根据所述硬件信号确定所述工作状态处于异常状态时,通过故障模拟导致引发异常状态的各种原因确定准确的异常源头。/n
【技术特征摘要】
1.一种BBU故障诊断方法,其特征在于,包括:
根据供电切换数据确定能否将供电源正常切换至目标BBU;
若能够正常切换至所述目标BBU,则根据所述目标BBU的硬件信号确定所述目标BBU的工作状态;
当根据所述硬件信号确定所述工作状态处于异常状态时,通过故障模拟导致引发异常状态的各种原因确定准确的异常源头。
2.根据权利要求1所述的BBU故障诊断方法,其特征在于,根据供电切换数据确定能否将供电源正常切换至目标BBU,包括:
获取PSU在每个时间点的输出电压值;
获取AC_FAIL信号和放电使能信号的出现时间;
计算得到所述AC_FAIL信号与所述放电使能信号之间的第一时间间隔;
计算得到所述AC_FAIL信号出现到所述PSU的输出电压值下降至预设电压值的第二时间间隔;
根据所述第一时间间隔和所述第二时间间隔确定能否将所述供电源正常切换至所述目标BBU。
3.根据权利要求1所述的BBU故障诊断方法,其特征在于,根据所述目标BBU的硬件信号确定所述目标BBU的工作状态,包括:
获取所述目标BBU的系统在位信号、充/放电使能信号、内部放电使能信号以及AC_FAIL信号;
根据所述系统在位信号、所述充/放电使能信号、所述内部放电使能信号以及所述AC_FAIL信号确定所述目标BBU的硬件接口信号的质量和高低电平变化情况;
获取所述目标BBU的I2C链路上的SCL/SDA信号;
根据所述质量、所述高低电平变化情况以及所述SCL/SDA信号确定所述目标BBU的工作状态。
4.根据权利要求1所述的BBU故障诊断方法,其特征在于,当根据所述硬件信号确定所述工作状态处于正常状态时,还包括:
获取存储系统与所述目标BBU的通信数据;
根据所述通信数据验证所述目标BBU是否存在程序运行错误。
5.根据权利要求1至4任一项所述的BBU故障诊断方法,其特征在于,在通过故障模拟导致引发异常状态的各种原因确定准确的异常源头之后,还包括:
判断所述异常源头能够自动修复;
若无法自动修复,则通过预设路径发送手动修复提示。
6.一种BBU故障诊断装置,其特征在于,包括:
供电源正常...
【专利技术属性】
技术研发人员:华要宇,孔维凯,王瑞杰,张兆峰,孙元帅,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。