磁盘阵列的高可用系统技术方案

技术编号:12053335 阅读:69 留言:0更新日期:2015-09-16 17:29
本发明专利技术提供了一种磁盘阵列的高可用系统,包括磁盘阵列的硬件系统,该硬件系统中的硬件包括主设备和备份的从设备,如果发生故障,触发故障处理流程替换故障的硬件;运行在磁盘阵列的硬件系统上的软件系统,该软件系统支持故障检测和恢复、数据镜像、缓存冗余和磁盘阵列RAID容错。本发明专利技术一方面,硬件进行备份,提高系统的可靠性;另一方面,软件支持数据镜像,缓存冗余和RAID容错,确保了磁盘阵列的稳定可靠运行,数据的一致性完整,提高了整个存储系统的高可用性。

【技术实现步骤摘要】
磁盘阵列的高可用系统
本专利技术涉及数据处理
,尤其涉及一种磁盘阵列(RAID,RedundantArraysofindependentDisks)的高可用系统。
技术介绍
高可用性(HA,HighAvailability)通常来描述一个系统经过专门的设计,从而减少停工时间,而保持其服务的高度可用性。在现代信息迅速发展的时代,数据的价值远远超出预想,数据的安全和数据存储系统的高可用性就尤为重要。存储系统的意外故障或数据损坏都会给企业或者国家带来巨大的经济损失。因而,提高存储系统磁盘阵列的高可用性势在必行。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种磁盘阵列的高可用系统,能够提高整个存储系统的高可用性。为了达到本专利技术目的,本专利技术提供了一种磁盘阵列的高可用系统,包括:磁盘阵列的硬件系统,该硬件系统中的硬件包括主设备和备份的从设备,如果发生故障,触发故障处理流程替换故障的硬件;运行在磁盘阵列的硬件系统上的软件系统,该软件系统支持故障检测和恢复、数据镜像、缓存冗余和磁盘阵列RAID容错。进一步地,硬件系统还包括:相互冗余的至少两个高速网络交换模块连接磁盘阵列中的每个控制器,每个控制器使用双端口的高速交换子卡连接高速网络交换模块。进一步地,硬件系统还包括:存储设备,该存储设备是磁盘簇JBOD。进一步地,磁盘阵列包括控制器检测模块、故障检测模块、故障定位模块和故障恢复模块;软件系统支持故障检测和恢复,具体为:控制器检测模块周期性发送和接收各个控制器的心跳消息,并将心跳信号传递给故障检测模块;当故障检测模块检测不到周期性心跳信号时,向故障定位模块报告异常事件,故障定位模块根据异常信息定位故障原因;启动冗余切换策略,切换服务;当故障恢复模块检测到控制器上线信号时,获取故障恢复策略进行故障恢复。进一步地,软件系统支持数据镜像,具体为:在对块设备的操作中进行远程备份,以并行的操作方式写数据到两个相同的逻辑卷;读数据时,读取最先相应服务的逻辑卷;若其中的一个逻辑卷出现故障时,切换到另一逻辑卷上。进一步地,软件系统支持缓存冗余,具体为:当进行缓存冗余时,缓存管理可以通过远程直接数据存取RDMA进行数据的缓存镜像;数据在控制器之间存在副本,如果一控制器故障后,其他控制器上的缓存数据写入存储设备中。进一步地,软件系统支持RAID容错,具体为:对磁盘阵列进行RAID容错;增加热备盘,在RAID降级时替换故障的磁盘。与现有技术相比,本专利技术包括:磁盘阵列的硬件系统,该硬件系统中的硬件包括主设备和备份的从设备,如果发生故障,触发故障处理流程替换故障的硬件;运行在磁盘阵列的硬件系统上的软件系统,该软件系统支持故障检测和恢复、数据镜像、缓存冗余和磁盘阵列RAID容错。本专利技术一方面,硬件进行备份,如果发生故障,可以触发故障处理流程替换故障的硬件,从而提高系统的可靠性;另一方面,软件支持数据镜像,缓存冗余和RAID容错,确保了磁盘阵列的稳定可靠运行,数据的一致性完整,提高了整个存储系统的高可用性。附图说明图1是本专利技术磁盘阵列的硬件架构示意图。图2是本专利技术磁盘阵列的软件架构示意图。图3是本专利技术磁盘阵列缓存冗余的架构示意图。具体实施方式下面结合附图对本专利技术进行进一步的详细说明。通过足够详细的描述这些实施示例,使得本领域技术人员能够实践本专利技术。在不脱离本专利技术的主旨和范围的情况下,可以对实施做出逻辑的、实现的和其他的改变。图1是本专利技术磁盘阵列的硬件架构示意图。用户设备可以通过存储区网络(SAN,StorageAreaNetwork)和磁盘阵列通信。磁盘阵列中包括多个硬件部件,如电源、风扇、控制器、主机适配器、控制器管理模块等,磁盘阵列的硬件系统中包含有主设备和备份的从设备,利用冗余的资源防止或消除故障。如果发生故障,可以触发故障处理流程,自动替换故障的硬件,继续维持系统正常工作,从而提高系统的可靠性。相互冗余的至少两个高速网络交换模块连接磁盘阵列中的每个控制器,每个控制器使用双端口的高速交换子卡连接高速网络交换模块,从而可保证了多控制器之间数据信息交换备份,多控制器之间的远程访问,多控制器间的冗余作用。磁盘阵列的存储设备可以是磁盘簇(JBOD,JustaBunchOfDisks)。图2是本专利技术磁盘阵列的软件架构示意图。磁盘阵列包括控制器检测模块、故障检测模块、故障定位模块和故障恢复模块。磁盘阵列中控制器故障检测和故障恢复具体为:控制器检测模块周期性发送和接收各个控制器的心跳消息,并将心跳信号传递给故障检测模块;当故障检测模块检测不到周期性心跳信号时,就向故障定位模块报告异常事件,故障定位模块根据异常信息定位故障原因;启动冗余切换策略,切换服务;当故障恢复模块检测到控制器上线信号,获取故障恢复策略及相关信息进行故障恢复,从而保证了阵列的可靠性服务。在处理数据读写请求时,提供多协议支持,此外数据层还提供了数据镜像、缓存冗余和RAID容错等数据恢复措施,在进行缓存冗余时,采用多重路径I/O(MPIO,Multi-PathInput/Output),其中:数据镜像具体为:在对块设备的操作中进行远程备份,以并行的操作方式写数据到两个相同的逻辑卷;读数据时,读取最先相应服务的逻辑卷;若其中的一个逻辑卷出现故障时,切换到另一逻辑卷上,从而动态地保证系统工作的可靠性,和数据的完整性;缓存冗余具体为:可参考图3,缓存冗余是在至少两台存储控制器之间实时进行缓存镜像;当进行缓存冗余时,缓存管理可以通过远程直接数据存取(RDMA,RemoteDirectMemoryAccess)进行数据的缓存镜像;由于数据在两台控制器之间存在副本,使得单台控制器故障后,另一台控制器上的缓存数据会立即写入后端存储设备中,从而实现了缓存数据的高可用性;RAID容错具体为:为了确保磁盘的故障处理可靠性,磁盘阵列采用RAID容错技术,防止单个磁盘故障导致的数据丢失。此外,还可以增加热备盘,在RAID降级时自动替换出错磁盘,使RAID进入修复状态。可通过发送邮件、短信等报警方式通知用户及时取出故障磁盘并加入新的热备盘。本专利技术一方面,硬件进行备份,如果发生故障,可以触发故障处理流程替换故障的硬件,从而提高系统的可靠性;另一方面,软件支持数据镜像,缓存冗余和RAID容错,确保了阵列的稳定可靠运行,数据的一致性完整,提高了整个存储系统的高可用性。应当理解,虽然本说明书根据实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。上文所列出的一系列的详细说明仅仅是针对本专利技术的可行性实施方式的具体说明,它们并非用于限制本专利技术的保护范围,凡未脱离本专利技术技艺精神所作的等效实施方式或变更均应包含在本专利技术的保护范围之内。本文档来自技高网...
磁盘阵列的高可用系统

【技术保护点】
一种磁盘阵列的高可用系统,其特征在于,包括:磁盘阵列的硬件系统,所述硬件系统中的硬件包括主设备和备份的从设备,如果发生故障,触发故障处理流程替换故障的硬件;运行在磁盘阵列的硬件系统上的软件系统,所述软件系统支持故障检测和恢复、数据镜像、缓存冗余和磁盘阵列RAID容错。

【技术特征摘要】
1.一种磁盘阵列的高可用系统,其特征在于,包括:磁盘阵列的硬件系统,所述硬件系统中的硬件包括主设备和备份的从设备,如果发生故障,触发故障处理流程替换故障的硬件;运行在磁盘阵列的硬件系统上的软件系统,所述软件系统支持故障检测和恢复、数据镜像、缓存冗余和磁盘阵列RAID容错;所述硬件系统,还包括:存储设备;其中,所述磁盘阵列包括控制器检测模块、故障检测模块、故障定位模块和故障恢复模块;所述软件系统支持数据镜像,具体为:在对块设备的操作中进行远程备份,以并行的操作方式写数据到两个相同的逻辑卷;读数据时,读取最先相应服务的逻辑卷;若其中的一个逻辑卷出现故障时,切换到另一逻辑卷上;所述软件系统支持缓存冗余,具体为:当进行缓存冗余时,缓存管理通过远程直接数据存取RDMA进行数据的缓存镜像;数据在控制器之间存在副本,如果一控制器故障后,其他控制器上的缓存数据写入存...

【专利技术属性】
技术研发人员:周耀辉赵静
申请(专利权)人:浪潮北京电子信息产业有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1