RAID阵列中的磁盘保留和故障预防制造技术

技术编号:16307800 阅读:195 留言:0更新日期:2017-09-27 01:45
由处理器设备配置独立磁盘冗余阵列(RAID)阵列,包括:在RAID阵列内,将备用故障转移磁盘配置为作为冷备件运行,以使得冷备用磁盘保持在断电待机模式,其中每个冷备用磁盘以预定间隔单独地被通电、被测试、以及被断电以回到待机模式。

Disk retention and fault prevention in RAID arrays

By the processor equipment configuration of redundant array of independent disks (RAID) array, including: in the RAID array, the standby failover disk configuration as a cold spare parts operation, so that the cold standby disk remains in power standby mode, wherein each cold standby disk at a predetermined interval alone by electricity, and power was tested to return to the standby mode.

【技术实现步骤摘要】
【国外来华专利技术】RAID阵列中的磁盘保留和故障预防
本专利技术一般地涉及计算系统,并且更具体地说,涉及用于独立磁盘冗余阵列(RAID)阵列中的磁盘保留和故障预防的各种实施例。
技术介绍
在当今的社会中,计算机系统司空见惯。可以在工作场所、家庭或学校中发现计算机系统。计算机系统可以包括数据存储系统或磁盘存储系统,以便处理和存储数据。存储系统可以包括一个或多个磁盘驱动器,它们可以被配置在阵列中,例如独立磁盘冗余阵列(RAID)拓扑。在RAID系统中,跨采用各种配置的多个磁盘冗余地存储数据,以便在发生硬件或软件故障的情况下提供数据安全性。随着
每年呈指数发展,并且越来越多的关键数据被存储在诸如RAID之类的存储系统上,保留和保护这种数据的需求变得越来越重要。因此,数据存储领域的发展需求具有很高的优先级。
技术实现思路
提供用于由处理器设备配置独立磁盘冗余阵列(RAID)阵列的各种实施例。在RAID阵列内,将备用故障转移磁盘配置为作为冷备件运行,以使得冷备用磁盘保持在断电待机模式。每个冷备用磁盘以预定间隔单独地被通电、被测试、以及被断电以回到待机模式。通过将备用故障转移磁盘配置为冷备件,而不是例如将它们配置为作为热备件而旋转,待机备件保持全新并具有对应的完全可用的使用寿命,而不是保持使用中的驱动器的有限寿命。附图说明为了容易地理解本专利技术的优点,将通过参考在附图中示出的特定实施例给出上面简要描述的本专利技术的更具体的说明。要理解,这些附图示出本专利技术的实施例,并且因此不被视为其范围的限制,将通过使用附图以额外特殊性和细节描述和解释本专利技术,这些附图是:图1示出其中可以实现本专利技术的各个方面的用于实现多路径I/O管理的示例性硬件结构的框图;图2示出其中再次可以实现本专利技术的各个方面的其它示例性硬件结构,特别是RAID阵列的各个部分的其它框图;以及图3示出根据本专利技术的一个方面的流程图。具体实施方式大容量存储系统继续提供增加的存储容量以便满足用户需求。个人和企业等隐含地依赖这些存储系统以便保留大量不可或缺的数据。用于数据存储和保留的一个广泛使用的解决方案是使用可以被配置为冗余地存储数据的多个独立磁盘的阵列,或者独立磁盘冗余阵列(RAID)。加利福尼亚大学伯克利分校的DavidA.Patterson等人在1987年发布的标题为“ACaseforRedundantArraysofInexpensiveDisks(RAID)(廉价磁盘冗余阵列(RAID)的案例)”的出版物讨论了RAID技术的基本概念和级别。独立磁盘冗余阵列(RAID)是在多个硬盘之间划分和复制数据的存储系统。RAID阵列可以被配置为根据实施方式以不同方式存储数据。不同类型的RAID拓扑的特征是RAID一词后面跟着一个数字,例如RAID0、RAID1、RAID5等。在RAID阵列中,跨多个磁盘分布数据,但是用户或主机将阵列视为单个逻辑卷。当设计可靠的系统时,认识到系统内将具有故障。在RAID系统中,预计在某一点,在阵列内工作的存储设备或磁盘将发生故障。RAID阵列中磁盘故障的常见并且广泛采用的解决方案是包含热备用磁盘。在RAID阵列内,存在已通电并且运行的多个备用磁盘,用于替换将发生故障或已发生故障的磁盘的实例以便保留数据。这些磁盘在本领域中被称为热备件(hotspares),因为它们被通电并且与阵列中的其它磁盘一起连续旋转,并且当RAID阵列内的磁盘将发生故障或已发生故障时,它将故障转移到所述热备件之一。换言之,当RAID阵列内的磁盘发生故障时,已被连续通电并且与阵列内的其它磁盘一起运行的备用磁盘将替换它。在故障转移期间,热备件立即替换已发生故障的磁盘,但是,阵列必须继续工作而不利用该磁盘上的数据,直到已使用来自阵列中的其它磁盘的数据重新构建该磁盘。因为替换已发生故障的磁盘的热备用磁盘通常已被通电并且工作时长与已发生故障的磁盘相同,许多情况下热备用磁盘同时发生故障。RAID阵列被设计和配置为当一个磁盘故障持续时保持正常工作,但同时发生的磁盘故障可能导致实际数据丢失。鉴于以上所述,所示实施例的机制为RAID阵列中先前的磁盘保留和故障预防难题提供各种解决方案。这些机制包括使用处理器设备执行诸如将备用故障转移磁盘配置为作为冷备件运行之类的功能,以使得冷备用磁盘保持在断电待机模式,并且以预定间隔单独地对每个冷备用磁盘进行通电、测试该磁盘、以及对该磁盘进行断电以回到待机模式。这些机制可以适用于各种网络拓扑和网络组件,如将进一步描述的那样。尽管说明了与各种实施例相关的某些功能,但本领域技术人员将认识到,本文的方法可以适合于多种实施方式和场景。现在转到图1,示出存储控制器计算系统环境的示例性架构10。在一个实施例中,架构10可以至少实现为用于实现本专利技术机制的系统的一部分。存储控制器10包括中央处理单元(CPU)12,其连接到通信端口18和存储设备16。通信端口18与通信网络20通信。通信网络20和存储网络可以被配置为与服务器(主机)24和存储系统通信,存储系统可以包括存储设备14。存储系统可以包括硬盘驱动器(HDD)设备、固态设备(SSD)、闪存等,它们可以被配置在独立磁盘冗余阵列(RAID)中。通信端口18、通信网络20、以及其它组件(为了简洁起见未被示出,但为技术人员所知)可以包括诸如以下各项的硬件组件:光纤通道布线、光纤通道端口、主机总线适配器(HBA)、融合网络适配器(CNA)、网络交换机和交换组件、以及本领域技术人员已知的类似通信机制。所示实施例的各个方面可以使用这些组件中的一个或多个实现,如将进一步描述的那样。下面描述的操作可以在存储设备(多个)14上执行,位于系统10中或其他位置,并且可以具有独立工作和/或与其它CPU设备12结合工作的多个存储设备16。存储设备16可以包括诸如电可擦式可编程只读存储器(EEPROM)之类的存储器或大量相关设备。存储设备16和存储设备14经由信号承载介质连接到CPU12。此外,CPU12通过通信端口18连接到通信网络20,通信网络20具有附接的多个其它计算机主机系统24。此外,存储设备16和CPU12可以嵌入和包括在计算系统10的每个组件中。每个存储系统还可以包括单独和/或不同的存储设备16和CPU12,它们结合工作或者作为单独的存储设备16和/或CPU12工作。图2示出其中可以实现本专利技术的一个实施例的RAID系统200的一个实例。RAID系统200包括存储阵列210和一个或多个RAID控制器220。RAID系统200优选地包括多个RAID控制器220,以便通过冗余实现增加的可靠性。存储阵列210还优选地通过包括多个存储设备(例如硬盘230)实现冗余。存储设备230与阵列环路240互连。阵列环路240还将RAID控制器220与存储阵列210互连。在所示实施例中,阵列环路240是例如由光纤通道标准定义的点到点环路。在所示实施例中,RAID控制器220均支持主机连接250。RAID控制器220经由主机连接250接收访问请求,并且通过向/自存储阵列传输数据块而服务这些请求。传输到存储阵列的数据块被冗余地编码,以便在存储设备230之一发生故障的情况下允许错误检测和数据恢复。本专利技术考虑一种技术,其用于保留备用存储设备或磁盘的寿命终止(EOL)时间,例本文档来自技高网...
RAID阵列中的磁盘保留和故障预防

【技术保护点】
一种用于由处理器设备配置独立磁盘冗余阵列(RAID)阵列的方法,所述方法包括:在RAID阵列内,将备用故障转移磁盘配置为作为冷备件运行,以使得冷备用磁盘保持在断电待机模式,其中每个冷备用磁盘以预定间隔单独地被通电、被测试、以及被断电以回到待机模式。

【技术特征摘要】
【国外来华专利技术】2015.02.13 US 14/621,8911.一种用于由处理器设备配置独立磁盘冗余阵列(RAID)阵列的方法,所述方法包括:在RAID阵列内,将备用故障转移磁盘配置为作为冷备件运行,以使得冷备用磁盘保持在断电待机模式,其中每个冷备用磁盘以预定间隔单独地被通电、被测试、以及被断电以回到待机模式。2.根据权利要求1所述的方法,进一步包括在磁盘故障或即将发生的磁盘故障期间,使至少一个冷备用磁盘通电并供应所述至少一个冷备用磁盘以便替换。3.根据权利要求2所述的方法,其中由控制实体控制冷备用磁盘的通电和断电。4.根据权利要求3所述的方法,其中所述控制实体是存储控制器。5.根据权利要求1所述的方法,其中所述预定间隔遵循调度矩阵。6.根据权利要求1所述的方法,进一步包括以预定间隔单独地对每个冷备用磁盘通电、运行自测试、以及断电以回到待机模式。7.根据权利要求7所述的方法,进一步包括在由所述控制实体控制的测试下以预定间隔单独地对每个冷备用磁盘通电、以及断电以回到待机模式。8.一种用于配置独立磁盘冗余阵列(RAID)阵列的系统,所述系统包括:处理器设备,其中所述处理器设备:在RAID阵列内,将备用故障转移磁盘配置为作为冷备件运行,以使得冷备用磁盘保持在断电待机模式,其中每个冷备用磁盘以预定间隔单独地被通电、被测试、以及被断电以回到待机模式。9.根据权利要求8所述的系统,其中所述处理器设备在磁盘故障或即将发生的磁盘故障期间,使至少一个冷备用磁盘通电并供应所述至少一个冷备用磁盘以便替换。10.根据权利要求9所述的系统,其中由控制实体控制冷备用磁盘的通电和断电。11.根据权利要求10所述的系统,其中所述控制实体是存储...

【专利技术属性】
技术研发人员:R·E·斯蒂亚沃尔特R·迈尔斯
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1