一种磁盘冗余阵列中慢盘识别处理方法、装置及存储介质制造方法及图纸

技术编号:35066284 阅读:15 留言:0更新日期:2022-09-28 11:24
本发明专利技术涉及一种磁盘冗余阵列中慢盘识别处理方法、装置及存储介质。本发明专利技术选择响应时间超出存储系统对磁盘响应时间要求的磁盘作为候选慢盘;对候选慢盘进行磁盘自检;磁盘自检失败,则判定候选慢盘为严重级别慢盘;磁盘自检成功,则进一步检测候选慢盘当前的磁盘负载压力是否大于预设的负载压力阈值;否则,判定候选慢盘为一般级别慢盘;是则,测量候选慢盘连续N次请求处理的平均处理时间;检测平均处理时间是否大于候选慢盘历史平均处理时间与设定系数的乘积,是则,判定候选慢盘为一般级别慢盘;否则,判断候选慢盘为可恢复慢盘。本发明专利技术针对候选慢盘按不同维度分级分析,能有效避免多种原因导致的慢盘误报。避免多种原因导致的慢盘误报。避免多种原因导致的慢盘误报。

【技术实现步骤摘要】
一种磁盘冗余阵列中慢盘识别处理方法、装置及存储介质


[0001]本专利技术涉及慢盘识别处理
,尤其涉及一种磁盘冗余阵列中慢盘识别处理方法、装置及存储介质。

技术介绍

[0002]RAID(独立磁盘冗余阵列)是一种虚拟化技术,它利用条带技术将主机请求读写的数据划分成多个条带,每个条带再划分成多个条块,将多个条块根据RAID的空间分布同时写入多块磁盘,实现将多个独立的物理磁盘按照不同的方式组合成一个虚拟磁盘组。同时引入数据校验技术,根据数据条块计算出校验条块随数据条块一同写入磁盘阵列中。当单个磁盘故障时,RAID能够通过读取其他磁盘的数据条块和校验条块,重构出故障磁盘的数据,从而采用返回主机或者重新写入磁盘的操作。能够有效解决单磁盘容量小、性能低、可靠性差的缺点。
[0003]当同时读写多块磁盘时,单磁盘故障或者性能骤降会影响整个RAID读写IO的吞吐速率。所以,快速识别出慢盘后,通过重构慢盘数据来避免等待读取慢盘数据完成和实现慢盘数据的延时写入,可以有效提升整个存储系统的IOPS。当前识别慢盘的方式主要是通过对比每个条块的读写响应时延与系统设置的慢盘判定阈值来实现。其中慢盘判定阈值,一是根据磁盘的性能指标设置的静态判别阈值,二是通过统计磁盘的历史平均响应时间来设置的动态判别阈值。为防止反复触发,慢盘静态判别阈值一般远大于磁盘的标称性能,慢盘的判定不敏感,很可能磁盘处理请求的响应符合慢盘静态判别阈值,但不符合与实际存储系统对磁盘响应时间。磁盘在负载压力大时的请求响应速度明显低于磁盘在负载压力小时的请求响应速度,这就使得动态判别阈值受存储系统的负载压力变化波动影响较大,容易误报慢盘。所以慢盘识别技术的优劣,直接影响慢盘技术的敏感度,并可能造成误报慢盘,误报慢盘会产生进一步累计后果。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本专利技术提供一种磁盘冗余阵列中慢盘识别处理方法、装置及存储介质。
[0005]第一方面,本专利技术提供一种磁盘冗余阵列中慢盘识别处理方法,包括:
[0006]选择RAID中超出存储系统对磁盘响应时间要求的磁盘作为候选慢盘;
[0007]候选慢盘进行磁盘自检;若磁盘自检失败,则判定候选慢盘为严重级别慢盘;若磁盘自检成功,则进一步检测候选慢盘当前的磁盘负载压力是否大于预设的负载压力阈值;超出负载压力阈值,则判定候选慢盘为一般级别慢盘;未超出负载压力阈值,则进一步对候选慢盘的设定区域进行读写混合操作,使得候选慢盘的磁盘负载压力达到负载压力阈值,而后控制候选慢盘在当前磁盘负载压力下从等待队列中获取连续N个请求处理;监测连续N个请求处理的处理时间并计算平均处理时间;检测平均处理时间是否大于候选慢盘历史平均处理时间与设定系数的乘积,是则,判定候选慢盘为一般级别慢盘;否则,判断候选慢盘
为可恢复慢盘。
[0008]更进一步地,根据存储系统对磁盘响应时间的要求,设置相应的响应时间阈值;存储系统针对磁盘的请求包括读磁盘请求和写磁盘请求,分别针对读、写磁盘请求设置相应的读响应时间阈值和写响应时间阈值;
[0009]取处理请求时间大于相应响应时间阈值的磁盘作为候选慢盘:对于读磁盘请求,取处理读磁盘请求大于相应读响应时间阈值的磁盘作为候选慢盘;对于写磁盘请求,取处理写磁盘请求大于写响应时间阈值的磁盘作为候选慢盘。
[0010]更进一步地,候选慢盘响应于磁盘自检命令进行磁盘自检,磁盘自检的自检项包括:检测磁盘是否能正常读的读测试、检测磁盘是否能正常写的写测试,检测磁盘ROM的校验和是否一致的ROM校验和测试,检测磁盘的RAM的校验和是否一致的RAM校验和测试。
[0011]更进一步地,磁盘自检的自检项存在异常即判断磁盘自检失败,自检项全部正常判断磁盘自检成功。
[0012]更进一步地,将条带化的请求设置于等待队列,候选慢盘处理一条带化的请求时,将该条带化的请求从等待队列删除,并将该条带化的请求添加到未完成队列,候选慢盘处理完该条带化的请求,则从未完成队列删除该条带化请求;所述负载压力由等待队列和未完成队列的排队占比加权求和获得。
[0013]更进一步地,针对严重级别慢盘,RAID不再将主机请求下发给被判定为严重级别慢盘的磁盘,RAID进行踢盘动作,踢盘触发RAID的磁盘成员重构,使得热备盘替换被踢的严重级别慢盘。
[0014]更进一步地,RAID不再将主机请求下发给被判定为一般级别慢盘的磁盘;且针对一般级别慢盘,在规定时间内在超出负载压力阈值的情况下重复进行慢盘识别;若在规定时间内一般级别慢盘未被识别为可恢复慢盘,则对该一般级别慢盘进行踢盘,踢盘触发RAID的磁盘成员重构,使得热备盘替换被踢的严重级别慢盘;若在规定时间内一般级别慢盘被识别为可恢复慢盘,将候选慢盘归为可恢复慢盘。
[0015]更进一步地,针对可恢复慢盘,RAID限制单位时间内的请求下发量或将可恢复慢盘与正常磁盘看作一致,不做区分地下发请求。
[0016]第二方面,本专利技术提供一种磁盘冗余阵列中慢盘识别处理装置,包括:处理单元、存储单元、RAID单元和总线单元,其中,所述处理单元、存储单元和RAID单元通过总线连接,所述存储单元存储计算机指令,所述处理单元和所述RAID单元读取并执行计算机指令实现磁盘冗余阵列中慢盘识别处理方法。
[0017]第三方面,本专利技术提供一种实现磁盘冗余阵列中慢盘识别处理方法的存储介质,所述存储介质存储计算机程序,所述计算机程序被处理器执行时实现磁盘冗余阵列中慢盘识别处理方法。
[0018]本专利技术实施例提供的上述技术方案与现有技术相比具有如下优点:
[0019]本专利技术以磁盘响应时间超出存储系统对磁盘响应时间要求为条件选择出相应磁盘作为候选慢盘;对待检测盘进行磁盘自检,磁盘自检失败即磁盘存在故障,将磁盘自检失败的磁盘作为严重级别慢盘。
[0020]磁盘自检成功,进一步根据磁盘负载压力确定磁盘的类型,若磁盘负载压力未超出负载压力阈值,即在相对空闲的情况下,磁盘处理请求的速度都不能满足存储系统对磁
盘响应时间要求,将该类磁盘分为一般级别慢盘,此过程误报风险小。
[0021]若磁盘负载压力超出负载压力阈值,则磁盘负载对磁盘处理请求速度限制凸显,控制候选慢盘在当前磁盘负载压力下处理等待队列中连续N个请求;监测源自等待队列的连续N个请求的处理时间并计算平均处理时间;检测平均处理时间是否大于候选慢盘历史平均处理时间与设定系数的乘积,是则,判定候选慢盘为一般级别慢盘;否则,判断候选慢盘为可恢复慢盘。将高负载下平均处理时间与候选慢盘历史平均处理时间与设定系数的乘积比较。通过设定系数与历史平均处理时间相乘,有效降低历史平均处理时间中低负载情况处理时间数据的影响,使得判断过程受负载压力变化波动影响更小。且将高负载下平均处理时间小于候选慢盘历史平均处理时间与设定系数的乘积的作为可恢复慢盘,能避免出现因磁盘负载压力过高导致磁盘处理请求响应慢而产生慢盘误报。
[0022]本专利技术在针对不同分类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种磁盘冗余阵列中慢盘识别处理方法,其特征在于,包括:选择RAID中响应时间超出存储系统对磁盘响应时间要求的磁盘作为候选慢盘;对候选慢盘进行磁盘自检;若磁盘自检失败,则判定候选慢盘为严重级别慢盘;若磁盘自检成功,则进一步检测候选慢盘当前的磁盘负载压力是否大于预设的负载压力阈值;未超出负载压力阈值,则判定候选慢盘为一般级别慢盘;超出负载压力阈值,则控制候选慢盘在当前磁盘负载压力下处理等待队列中连续N个请求;监测连续N次请求处理的处理时间并计算平均处理时间;检测平均处理时间是否大于候选慢盘历史平均处理时间与设定系数的乘积,是则,判定候选慢盘为一般级别慢盘;否则,判断候选慢盘为可恢复慢盘。2.根据权利要求1所述的磁盘冗余阵列中慢盘识别处理方法,其特征在于,根据存储系统对磁盘响应时间的要求,设置相应的响应时间阈值;存储系统针对磁盘的请求包括读磁盘请求和写磁盘请求,分别针对读、写磁盘请求设置相应的读响应时间阈值和写响应时间阈值;取处理请求时间大于相应响应时间阈值的磁盘作为候选慢盘:对于读磁盘请求,取处理读磁盘请求大于相应读响应时间阈值的磁盘作为候选慢盘;对于写磁盘请求,取处理写磁盘请求大于写响应时间阈值的磁盘作为候选慢盘。3.根据权利要求1所述的磁盘冗余阵列中慢盘识别处理方法,其特征在于,候选慢盘响应于磁盘自检命令进行磁盘自检,磁盘自检的自检项包括:检测磁盘是否能正常读的读测试、检测磁盘是否能正常写的写测试,检测磁盘ROM的校验和是否一致的ROM校验和测试,检测磁盘的RAM的校验和是否一致的RAM校验和测试。4.根据权利要求3所述的磁盘冗余阵列中慢盘识别处理方法,其特征在于,磁盘自检的自检项存在异常即判断磁盘自检失败,自检项全部正常判断磁盘自检成功。5.根据权利要求1所述的磁盘冗余阵列中慢盘识别处理方法,其特征在于,将条带化的请求设置于等待队列,候选慢盘处理一条带化的请求时,将该条带化的请求从等待队列...

【专利技术属性】
技术研发人员:李海南刘丹
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1