一种存储系统故障维护方法、装置、设备及存储介质制造方法及图纸

技术编号:33639537 阅读:27 留言:0更新日期:2022-06-02 01:57
本发明专利技术涉及存储领域,尤其涉及一种存储系统故障维护方法、装置、设备及存储介质。所述方法包括:读取存储系统的寄存器以获取用于标识存储系统各部件健康状态的寄存器信息;对所述寄存器信息进行分析以确定故障信息;基于所述故障信息判断故障类型,并根据所述故障类型确定需要维护的硬盘;基于所确定的需要维护的硬盘发起并执行维护任务以对需要维护的硬盘添加移出存储系统标识。本发明专利技术的方案实现了实时监控存储系统,并自动将存在问题的硬盘移出存储系统,避免了人工分析以及踢出故障的硬盘,提高了存储系统的维护效率,极大的节省了人工维护成本。维护成本。维护成本。

【技术实现步骤摘要】
一种存储系统故障维护方法、装置、设备及存储介质


[0001]本专利技术涉及存储领域,尤其涉及一种存储系统故障维护方法、装置、设备及存储介质。

技术介绍

[0002]随着海量非结构化数据的爆炸性增长,分布式存储已经成为用户构建数据中心架构的存储基石,越来越多的关键业务接入分布式存储中。分布式存储的大量应用,使得存储系统的运维压力不断提升。如何在磁盘、中央处理器、内存等核心部件出现故障的情况下,在保证集群业务不中断的前提下快速定位到故障硬件实施更换成为了目前海量存储运维的一个核心问题。
[0003]目前,主流的处理方法是系统监控到硬件故障后,会生成告警日志,提醒用户需要进行更换修复操作。由用户手动操作将故障节点或者硬盘踢出系统,防止业务继续向故障节点和磁盘写入数据,以保证业务的延续性。由于大部分情况下海量存储集群规模较大,如何快速找到问题节点和磁盘成为运维人员的痛点和难点。

技术实现思路

[0004]有鉴于此,有必要针对现有存储系统单纯依赖人工维护的问题,提供一种存储系统故障维护方法、装置、设备及存储介质
[000本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种存储系统故障维护方法,其特征在于,所述方法包括:读取存储系统的寄存器以获取用于标识存储系统各部件健康状态的寄存器信息;对所述寄存器信息进行分析以确定故障信息;基于所述故障信息判断故障类型,并根据所述故障类型确定需要维护的硬盘;基于所确定的需要维护的硬盘发起并执行维护任务以对需要维护的硬盘添加移出存储系统标识。2.根据权利要求1所述的存储系统故障维护方法,其特征在于,所述故障信息包括存储节点故障信息和硬盘故障信息;所述基于所述故障信息判断故障类型,并根据所述故障类型确定需要维护的硬盘的步骤包括:响应于所述故障信息为硬盘故障信息,则确定故障类型为磁盘故障;响应于所述故障信息为存储节点故障信息,则确定故障类型为节点故障;响应故障类型为磁盘故障,则将所述故障信息对应的硬盘作为需要维护的硬盘;响应于故障类型为节点故障,则将故障的节点所包括的所有硬盘作为需要维护的硬盘。3.根据权利要求2所述的存储系统故障维护方法,其特征在于,所述方法还包括:检测需要维护的硬盘是否能够正常工作;响应于确认故障节点和/或故障硬盘能够正常工作,则发起并执行关闭维护任务以将恢复正常的硬盘的移出存储系统标识删除。4.根据权利要求3所述的存储系统故障维护方法,其特征在于,所述方法还包括:响应于维护任务执行完成,则发送点灯命令以将需要维护的硬盘的故障灯点亮。5.根据权利要求4所述的存储系统故障维护方法,其特征在于,所述方法还包括:响应于关闭维护任务执行完成,则发送关灯命令以将恢复正常的硬盘的故障灯熄灭。6.根据权利要...

【专利技术属性】
技术研发人员:孙凤超
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1