The invention provides a method and device for triggering RAID array reconstruction, the disk subsystem, the method is applied to the storage device may include: to each physical disk under IO to read and write instructions; response time of each physical disk in the preset statistical period returned IO read and write instructions based on the average response time are calculated the physical disk, and the disk respectively determine the average response time of the non physical disk fault physical disk is reached with the model corresponding to the abnormal response time threshold; the average response time and to mark the physical disk disk model corresponding to the abnormal response time threshold for physical disk failure, if the physical disk fault belongs to the RAID array RAID, notice the fault array physical disk belongs to the reconstruction of the physical disk fault. The accuracy of the fault physical disk can be effectively improved by using the program.
【技术实现步骤摘要】
触发RAID阵列重建的方法及装置
本申请涉及计算机通信领域,尤其涉及触发RAID阵列重建的方法及装置。
技术介绍
RAID阵列(RedundantArrayofIndependentDisks,独立磁盘冗余阵列)是一种把多块独立的磁盘(物理磁盘)按不同的方式组合起来形成一个磁盘组(逻辑磁盘),从而提供比单个磁盘更高的存储性能和数据可靠性的技术。在计算机通信领域,通常会使用RAID阵列技术对磁盘中数据进行冗余保护,当有数据写入时,根据RAID阵列算法把数据拆分到多个成员磁盘中。根据RAID阵列级别不同,可容忍1块或多块磁盘故障或者离线,当检测到磁盘IO错误或者磁盘离线时,可使用专用热备盘或者全局热备盘进行重建,恢复RAID阵列数据冗余性。然而,在现有的触发RAID阵列进行重建的方法中,仅考虑了磁盘IO错误和磁盘离线的情况,没有考虑磁盘老化后响应时间变慢导致业务中断的情况,因此如何在磁盘响应慢的情况下触发RAID阵列重建成为亟待解决的问题。
技术实现思路
有鉴于此,本申请提供一种触发RAID阵列重建的方法及装置,用以提高判断故障物理磁盘的准确性。具体地,本申请是通过如下技术方案实现的:根据本申请的第一方面,提供一种触发RAID阵列重建的方法,所述方法应用于存储设备的磁盘子系统,所述存储设备包括至少一个RAID阵列,所述RAID阵列包括若干个物理磁盘,所述方法包括:根据各相关子系统的IO读写请求向各物理磁盘下发IO读写指令;基于各物理磁盘在预设统计周期内返回的IO读写指令的响应时间,分别计算各物理磁盘的平均响应时间;分别判断各非故障物理磁盘的物理磁盘的平均响应时间是 ...
【技术保护点】
一种触发RAID阵列重建的方法,其特征在于,所述方法应用于存储设备的磁盘子系统,所述存储设备包括至少一个RAID阵列,所述RAID阵列包括若干个物理磁盘,所述方法包括:根据各相关子系统的IO读写请求向各物理磁盘下发IO读写指令;基于各物理磁盘在预设统计周期内返回的IO读写指令的响应时间,分别计算各物理磁盘的平均响应时间;分别判断各非故障物理磁盘的物理磁盘的平均响应时间是否达到与其型号对应的磁盘异常响应时间阈值;其中,不同型号的物理磁盘的磁盘异常响应时间阈值不同;将平均响应时间达到与其型号对应的磁盘异常响应时间阈值的物理磁盘标记为故障物理磁盘,如果所述故障物理磁盘属于RAID阵列,则通知所述故障物理磁盘所属的RAID阵列对所述故障物理磁盘进行重建。
【技术特征摘要】
1.一种触发RAID阵列重建的方法,其特征在于,所述方法应用于存储设备的磁盘子系统,所述存储设备包括至少一个RAID阵列,所述RAID阵列包括若干个物理磁盘,所述方法包括:根据各相关子系统的IO读写请求向各物理磁盘下发IO读写指令;基于各物理磁盘在预设统计周期内返回的IO读写指令的响应时间,分别计算各物理磁盘的平均响应时间;分别判断各非故障物理磁盘的物理磁盘的平均响应时间是否达到与其型号对应的磁盘异常响应时间阈值;其中,不同型号的物理磁盘的磁盘异常响应时间阈值不同;将平均响应时间达到与其型号对应的磁盘异常响应时间阈值的物理磁盘标记为故障物理磁盘,如果所述故障物理磁盘属于RAID阵列,则通知所述故障物理磁盘所属的RAID阵列对所述故障物理磁盘进行重建。2.根据权利要求1所述的方法,其特征在于,所述与其型号对应的磁盘异常响应时间阈值为该型号的物理磁盘的平均响应时间与预设的异常响应时间加权值的乘积;所述分别判断各非故障物理磁盘的物理磁盘的平均响应时间是否达到与其型号对应的磁盘异常响应时间阈值,包括:分别计算各型号的平均响应时间不为零的非故障物理磁盘的物理磁盘数目;分别累加各型号的若干个非故障物理磁盘的物理磁盘的平均响应时间;分别将各型号的若干个非故障物理磁盘的物理磁盘累加得到的平均响应时间除以与其型号对应的平均响应时间不为零的非故障物理磁盘的物理磁盘数目,得到各型号物理磁盘的平均响应时间;分别计算各型号的物理磁盘的平均响应时间与预设的异常响应时间加权值的乘积,得到各型号物理磁盘的磁盘异常响应时间阈值;判断各非故障物理磁盘的物理磁盘的平均响应时间是否到达与其型号对应的磁盘异常响应时间阈值。3.根据权利要求1所述的方法,其特征在于,所述基于各物理磁盘在预设统计周期内返回的IO读写指令的响应时间,分别计算各物理磁盘的平均响应时间,包括:累加各物理磁盘针对所述预设统计周期的已完成的IO读写指令的响应时间;统计各物理磁盘针对所述预设统计周期的已完成的IO读写指令的个数;将各物理磁盘分别对应的累加的响应时间和统计的IO读写指令的个数相除,分别获得各物理磁盘的平均响应时间。4.根据权利要求1所述的方法,其特征在于,所述将平均响应时间达到与其型号对应的磁盘异常响应时间阈值的物理磁盘标记为故障物理磁盘,包括:分别记录平均响应时间达到与其型号对应的磁盘异常响应时间阈值的物理磁盘的持续周期数;如果在若干个统计周期后,所述平均响应时间达到与其型号对应的磁盘异常响应时间阈值的物理磁盘中的任一物理磁盘的持续周期数达到预设的持续周期阈值,则将该物理磁盘标记为故障物理磁盘。5.根据权利要求4所述的方法,其特征在于,所述分别记录平均响应时间达到与其型号对应的磁盘异常响应时间阈值的物理磁盘的持续周期数,包括:针对所述平均响应时间达到与其型号对应的磁盘异常响应时间阈值的物理磁盘中的每个物理磁盘,在下一个统计周期结束时,如果该物理磁盘再次被确定为所述平均响应时间达到与其型号对应的磁盘异常响应时间阈值的物理磁盘,则增加该物理磁盘的持续周期数并记录;如果该物理磁盘未被确定为所述平均响应时间达到...
【专利技术属性】
技术研发人员:上官应兰,张学东,
申请(专利权)人:杭州宏杉科技股份有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。