Embodiments of the disclosure relate to methods, devices and computer-readable media for managing storage systems. The storage system includes a disk array, and the disk array includes at least one disk array group. One method includes determining the first information related to the array group of disks to which the disks belong in response to receiving a first message indicating that the disks in the disks array are malfunctioning. The method also includes obtaining the first number of incomplete input/output (I/O) operations for reconstructing the faulty disk in the array group of disks. The method also includes determining the number of thresholds that can be used for I/O operations of the disk array group based on the first information and the first number. In addition, the method also includes controlling the number of I/O operations sent to the disk array group based on the number of thresholds.
【技术实现步骤摘要】
用于管理存储系统的方法、设备和计算机可读介质
本公开的实施例总体涉及数据存储领域,具体涉及用于管理存储系统的方法、设备和计算机可读介质。
技术介绍
存储系统通常具有多种存储组件,以针对来自上层应用的输入/输出(I/O)请求提供具有不同响应时间的响应。例如,存储系统通常具有高速缓存和多个存储盘,并且多个存储盘可以被组织在盘阵列中。高速缓存可以用于在诸如动态随机访问存储器(DRAM)中缓存数据,以提供针对I/O请求的更快速的响应。盘阵列则用于响应针对未被缓存在高速缓存中的数据的I/O请求,并且这样的响应通常具有较长的响应时间。当盘阵列中的盘发生故障时,通常需要利用该故障盘所属的盘阵列组中的备用盘来重建该故障盘(即,将故障盘中的数据恢复到备用盘中)。在该重建过程中,存储系统仍然可能接收到来自上层应用的针对发生故障的盘阵列组的随机I/O请求。大量的这种随机I/O请求可能导致重建过程变慢甚至中断。在此情况下,如果该盘阵列组中的另一盘也发生故障,则有可能导致数据丢失。
技术实现思路
本公开的实施例提供了用于管理存储系统的方法、设备和计算机可读介质。在本公开的第一方面,提供了一种用 ...
【技术保护点】
1.一种用于管理存储系统的方法,所述存储系统包括盘阵列并且所述盘阵列包括至少一个盘阵列组,所述方法包括:响应于接收到指示所述盘阵列中的盘发生故障的第一消息,确定与故障盘所属的盘阵列组有关的第一信息;获取所述盘阵列组中用于重建所述故障盘的尚未完成的输入/输出(I/O)操作的第一数目;基于所述第一信息和所述第一数目,确定能够用于所述盘阵列组的I/O操作的阈值数目;以及基于所述阈值数目,控制向所述盘阵列组发出的I/O操作的数目。
【技术特征摘要】
1.一种用于管理存储系统的方法,所述存储系统包括盘阵列并且所述盘阵列包括至少一个盘阵列组,所述方法包括:响应于接收到指示所述盘阵列中的盘发生故障的第一消息,确定与故障盘所属的盘阵列组有关的第一信息;获取所述盘阵列组中用于重建所述故障盘的尚未完成的输入/输出(I/O)操作的第一数目;基于所述第一信息和所述第一数目,确定能够用于所述盘阵列组的I/O操作的阈值数目;以及基于所述阈值数目,控制向所述盘阵列组发出的I/O操作的数目。2.根据权利要求1所述的方法,其中确定与故障盘所属的盘阵列组有关的第一信息包括:标识与所述盘阵列组相对应的逻辑存储单元;以及将标识的所述逻辑存储单元的状态设置为降级状态。3.根据权利要求2所述的方法,还包括:响应于接收到指示所述盘阵列组中的所述故障恢复的第二消息,将所述逻辑存储单元的所述状态恢复到正常状态。4.根据权利要求1所述的方法,其中确定与故障盘所属的盘阵列组有关的第一信息包括获取至少以下信息:所述盘阵列组中的盘的总数目;所述盘阵列组中用于重建所述故障盘的备用盘的数目;以及所述盘阵列组中的每个盘最多能够承受的I/O操作的第二数目。5.根据权利要求4所述的方法,其中确定能够用于所述盘阵列组的I/O操作的阈值数目包括:基于所述盘的总数目、所述备用盘的数目、所述第一数目和所述第二数目,确定所述阈值数目。6.根据权利要求1所述的方法,其中控制向所述盘阵列组发出的I/O操作的数目包括:响应于接收到针对所述盘阵列组的第一I/O操作的请求,确定已向所述盘阵列组发出并且尚未完成的I/O操作的第三数目;响应于所述阈值数目大于所述第三数目,向所述盘阵列组发出所述第一I/O操作中的至少部分I/O操作;以及响应于发出所述至少部分I/O操作,更新所述阈值数目。7.根据权利要求6所述的方法,其中所述至少部分I/O操作包括读操作,并且更新所述阈值数目包括:响应于发出所述读操作,将所述阈值数目减少第一预定数目。8.根据权利要求6所述的方法,其中所述至少部分I/O操作包括写操作,并且更新所述阈值数目还包括:响应于发出所述写操作,将所述阈值数目减少第二预定数目。9.一种用于管理存储系统的方法,所述存储系统包括盘阵列和高速缓存,所述盘阵列至少包括第一盘阵列组和第二盘阵列组,所述方法包括:响应于接收到指示所述第一盘阵列组发生故障的消息,从所述高速缓存中的多个列表中选择要向所述盘阵列写入的第一数据条目,所述多个列表至少包括第一列表和第二列表,其中所述第一列表用于缓存针对所述盘阵列中的故障盘阵列组的数据条目;响应于确定所述第一数据条目来自所述第一列表,将所述第一数据条目写入到所述盘阵列中;响应于确定所述第一数据条目来自所述第二列表并且所述第一数据条目要被写入到所述第一盘阵列组中,将所述第一数据条目从所述第二列表移动到所述第一列表中;以及响应于确定所述第一数据条目要被写入到所述第二盘阵列组中,将所述第一数据条目写入到所述第二盘阵列组中。10.根据权利要求9所述的方法,其中从所述高速缓存中的多个列表中选择要向所述盘阵列写入的第一数据条目包括:从所述多个列表生成候选数据条目集合;以及从生成的所述候选数据条目集合中选择所述第一数据条目。11.根据权利要求10所述的方法,其中从所述多个列表生成候选数据条目集合包括:将所述多个列表中的每个列表中被缓存最长时间的数据条目选入所述候选数据条目集合。12.根据权利要求10所述的方法,其中所述多个列表中的每个列表具有相应权重,并且从生成的所述候选数据条目集合中选择所述第一数据条目包括:基于所述相应权重,从所述候选数据条目集合中选择所述第一数据条目。13.根据权利要求12所述的方法,其中所述候选数据条目集合包括来自所述第一列表的第二数据条目和来自所述第二列表的第三数据条目,所述第二数据条目被缓存在所述第一列表中长达第一时间,所述第三数据条目被缓存在所述第二列表中长达第二时间,所述第一列表具有第一权重,所述第二列表具有小于所述第一权重的第二权重,并且从所述候选数据条目集合中选择所述第一数据条目包括:确定所述第一时间与所述第一权重的第一比值以及所述第二时间与所述第二权重的第二比值;响应于所述第一比值超过所述第二比值,将所述第二数据条目选择作为所述第一数据条目;以及响应于所述第一比值不超过所述第二比值,将所述第三数据条目选择作为所述第一数据条目。14.一种用于管理存储系统的设备,所述存储系统包括盘阵列并且所述盘阵列包括至少一个盘阵列组,所述设备包括:至少一个处理单元;至少一个存储器,所述至少一个存储器被耦合到所述至少一个处理单元并且存储用于由所述至少一个处理单元执行的指令,所述指令当由所述至少一个处理单元执行时,使得所述设备执行动作,所述动作包括:响应于接收到指示所述盘阵列中的盘发生故障的第一消息,确定与故障盘所属的盘阵列组有关的第一信息;获取所述盘阵...
【专利技术属性】
技术研发人员:杨利锋,徐鑫磊,高健,董继炳,韩耕,
申请(专利权)人:伊姆西IP控股有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。