System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 硬盘故障管理的方法、装置、计算机设备及存储介质制造方法及图纸_技高网

硬盘故障管理的方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:40879879 阅读:2 留言:0更新日期:2024-04-08 16:50
本发明专利技术涉及存储设备技术领域,公开了硬盘故障管理的方法、装置、计算机设备及存储介质,该方法包括:采集目标硬盘的业务路径错误;所述业务路径错误包括业务路径数据错误和/或业务路径超时错误;对所述业务路径错误进行处理,生成所述业务路径错误的异常处理结果;对所述目标硬盘进行主动巡检,确定所述目标硬盘的异常巡检结果;根据所述异常处理结果和/或所述异常巡检结果,对所述目标硬盘进行故障管理。本发明专利技术将业务路径错误处理和主动巡检机制相结合,从而提供多维度的异常来源,可以更准确地进行硬盘故障管理,并可以保证实时性。

【技术实现步骤摘要】

本专利技术涉及存储设备,具体涉及硬盘故障管理的方法、装置、计算机设备及存储介质


技术介绍

1、硬盘是主要存储数据的设备,为保证其中数据的可靠性,需要及时检测出硬盘的故障。

2、目前,常见存储业务管理软件一般使用s.m.a.r.t.(self-monitoring analysisand report technology,硬盘自动检测、分析以及报告技术)工具获取硬盘的s.m.a.r.t.计数,并简单比对是否超过一定阈值判定硬盘故障,以提示用户更换备件。这种故障管理方式指标单一,且实时性较差,故障管理效果较差。


技术实现思路

1、有鉴于此,本专利技术提供了一种硬盘故障管理的方法、装置、计算机设备及存储介质,以解决故障管理效果较差的问题。

2、第一方面,本专利技术提供了一种硬盘故障管理的方法,包括:

3、采集目标硬盘的业务路径错误;所述业务路径错误包括业务路径数据错误和/或业务路径超时错误;

4、对所述业务路径错误进行处理,生成所述业务路径错误的异常处理结果;

5、对所述目标硬盘进行主动巡检,确定所述目标硬盘的异常巡检结果;

6、根据所述异常处理结果和/或所述异常巡检结果,对所述目标硬盘进行故障管理。

7、在一些可选的实施方式中,所述对所述业务路径错误进行处理,生成所述业务路径错误的异常处理结果,包括:

8、在所述业务路径错误包括业务路径数据错误的情况下,对所述业务路径数据错误中的链路错误和/或协议标准错误按照相应的错误处理方式进行处理,生成第一异常处理结果;

9、在所述务路径错误包括业务路径超时错误的情况下,根据所述业务路径超时错误所符合的检测标准进行相应的处理,生成第二异常处理结果。

10、在一些可选的实施方式中,所述对所述业务路径数据错误中的链路错误和/或协议标准错误按照相应的错误处理方式进行处理,包括:

11、优先处理所述链路错误;

12、根据所述目标硬盘的介质类型和接口协议确定相应的映射表,根据所述映射表确定与所述协议标准错误相对应的错误处理方式,并按照所述错误处理方式对所述协议标准错误进行处理;其中,预先为多种介质类型和接口协议的硬盘分别设置协议标准错误与错误处理方式之间的映射表。

13、在一些可选的实施方式中,所述根据所述业务路径超时错误所符合的检测标准进行相应的处理,包括:

14、采用定时轮询的方式,确定所述业务路径超时错误所符合的检测标准;

15、根据当前的执行阶段、所执行指令的类型以及所述目标硬盘的介质类型和接口协议,确定与所述检测标准相对应的处理措施,并根据所述处理措施对所述业务路径超时错误执行相应的处理。

16、在一些可选的实施方式中,所述对所述目标硬盘进行主动巡检,确定所述目标硬盘的异常巡检结果,包括:

17、对所述目标硬盘进行硬盘巡检,确定所述目标硬盘的第一异常巡检结果;所述硬盘巡检包括:温度巡检、寿命巡检、介质巡检中的至少一项;

18、在接收到慢盘检测指令时,对所述目标硬盘进行慢盘检测,确定表示所述目标硬盘是否为慢盘的第二异常巡检结果。

19、在一些可选的实施方式中,所述对所述目标硬盘进行硬盘巡检包括:

20、对所述目标硬盘主动进行温度巡检:将获取到的当前温度与预先设置的多个异常温度阈值进行比较,生成相应等级的温度告警;

21、对所述目标硬盘主动进行寿命巡检:在所述目标硬盘的寿命发生变化时记录消耗单位百分比寿命所对应的单位时间,并根据所述目标硬盘的剩余寿命百分比和所述单位时间预测所述目标硬盘的剩余寿命;在所示单位时间少于第一时间阈值和/或所述剩余寿命少于第二时间阈值的情况下,生成寿命告警;

22、对所述目标硬盘主动进行介质巡检:在所述目标硬盘空闲的情况下,对所述目标硬盘进行全盘介质巡检;在所述目标硬盘为仲裁盘的情况下,对所述目标硬盘的仲裁预留区域进行介质巡检;生成相应的介质巡检结果。

23、在一些可选的实施方式中,所述对所述目标硬盘进行慢盘检测包括:

24、确定调度队列当前的最大等待耗时;所述最大等待耗时为所述调度队列中当前未完成且最先进入所述调度队列的io请求的等待耗时;

25、在所述最大等待耗时超过等待耗时阈值的情况下,根据所述调度队列中多个io请求的平均耗时,确定所述目标硬盘是否为慢盘。

26、在一些可选的实施方式中,所述根据所述调度队列中多个io请求的平均耗时,确定所述目标硬盘是否为慢盘,包括:

27、选取所述调度队列中等待耗时较大的n个io请求作为目标io请求;n≥2;

28、在所述目标io请求执行完毕后,确定所述目标io请求在所述调度队列中所等待的调度耗时,并确定执行所述目标io请求的执行耗时;

29、对多个所述目标io请求的调度耗时和执行耗时分别进行统计,确定平均调度耗时和平均执行耗时;

30、根据所述平均调度耗时和平均执行耗时的大小,确定所述目标硬盘是否为慢盘。

31、在一些可选的实施方式中,所述根据所述异常处理结果和/或所述异常巡检结果,对所述目标硬盘进行故障管理,包括:

32、所述根据所述异常处理结果和/或所述异常巡检结果,对所述目标硬盘进行端口故障管理,并对所述目标硬盘进行盘故障管理。

33、在一些可选的实施方式中,所述对所述目标硬盘进行端口故障管理,包括:

34、在所述异常处理结果中的端口错误满足相应的故障条件的情况下,为所述目标硬盘的相应端口生成故障计数;

35、根据所述故障计数更新所述端口的在线状态。

36、在一些可选的实施方式中,所述目标硬盘包括第一端口和第二端口;

37、所述为所述目标硬盘的相应端口生成故障计数,包括:

38、为所述第一端口生成第一故障计数,并为所述第二端口生成第二故障计数;

39、所述根据所述故障计数更新所述端口的在线状态,包括:

40、在所述第一故障计数或所述第二故障计数超过第一计数阈值的情况下,强制剔除故障计数超过所述第一计数阈值的端口;

41、确定所述目标硬盘的所述第一端口和所述第二端口是否在线;

42、在所述第一端口和所述第二端口均仍然在线的情况下,尝试剔除故障计数较大的端口;

43、在所述第一端口和所述第二端口均离线的情况下,尝试拉回故障计数小于所述第一计数阈值的端口;

44、在尝试拉回失败的情况下,判断所述目标硬盘是否符合强制拉回条件;

45、在所述目标硬盘符合强制拉回条件的情况下,强制拉回故障计数小于第二计数阈值的端口;所述第二计数阈值大于所述第一计数阈值。

46、在一些可选的实施方式中,所述对所述目标硬盘进行盘故障管理,包括:

47、在所述异常处理结果中存在特定错误的情况下,本文档来自技高网...

【技术保护点】

1.一种硬盘故障管理的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述业务路径错误进行处理,生成所述业务路径错误的异常处理结果,包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述业务路径数据错误中的链路错误和/或协议标准错误按照相应的错误处理方式进行处理,包括:

4.根据权利要求2所述的方法,其特征在于,所述根据所述业务路径超时错误所符合的检测标准进行相应的处理,包括:

5.根据权利要求1所述的方法,其特征在于,所述对所述目标硬盘进行主动巡检,确定所述目标硬盘的异常巡检结果,包括:

6.根据权利要求5所述的方法,其特征在于,所述对所述目标硬盘进行硬盘巡检包括:

7.根据权利要求5所述的方法,其特征在于,所述对所述目标硬盘进行慢盘检测包括:

8.根据权利要求7所述的方法,其特征在于,所述根据所述调度队列中多个IO请求的平均耗时,确定所述目标硬盘是否为慢盘,包括:

9.根据权利要求1所述的方法,其特征在于,所述根据所述异常处理结果和/或所述异常巡检结果,对所述目标硬盘进行故障管理,包括:

10.根据权利要求9所述的方法,其特征在于,所述对所述目标硬盘进行端口故障管理,包括:

11.根据权利要求10所述的方法,其特征在于,所述目标硬盘包括第一端口和第二端口;

12.根据权利要求9所述的方法,其特征在于,所述对所述目标硬盘进行盘故障管理,包括:

13.一种硬盘故障管理的装置,其特征在于,所述装置包括:

14.一种计算机设备,其特征在于,包括:

15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至12中任一项所述的硬盘故障管理的方法。

...

【技术特征摘要】

1.一种硬盘故障管理的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述业务路径错误进行处理,生成所述业务路径错误的异常处理结果,包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述业务路径数据错误中的链路错误和/或协议标准错误按照相应的错误处理方式进行处理,包括:

4.根据权利要求2所述的方法,其特征在于,所述根据所述业务路径超时错误所符合的检测标准进行相应的处理,包括:

5.根据权利要求1所述的方法,其特征在于,所述对所述目标硬盘进行主动巡检,确定所述目标硬盘的异常巡检结果,包括:

6.根据权利要求5所述的方法,其特征在于,所述对所述目标硬盘进行硬盘巡检包括:

7.根据权利要求5所述的方法,其特征在于,所述对所述目标硬盘进行慢盘检测包括:

8.根据权利要求7所述的方法,其特征在...

【专利技术属性】
技术研发人员:苑忠科李大生刘清林
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1