当前位置: 首页 > 专利查询>伊姆西公司专利>正文

在群集存储环境中执行并行数据迁移的方法技术

技术编号:2835954 阅读:268 留言:0更新日期:2012-04-11 18:40
群集存储阵列由连到一个或多个存储系统的几个结点组成。结点提供客户机访问的LUN装置,LUN装置映射到对应于一个或多个存储系统上的存储区的源逻辑单元、目标逻辑单元对应于一个或多个存储系统上的不同存储区。源逻辑单元由几个结点并行迁移到目标逻辑单元。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体上涉及数据迁移领域,特别是提供并行数据迁移方法。
技术介绍
在当今的计算环境中,客户计算机通常可以使用一个或多个存储系统,这些存储系统可经通道或网络进行本机或远程访问。可用于客户的存储通常表现为卷或逻辑单元。经常必须将数据从一卷移动或“迁移”到另一卷。数据迁移对客户机是透明的;也就是说,尽管驱动器数据正被从一物理存储位置移到另一位置,但客户机可继续访问同一逻辑驱动器。当数据必须移到新连接的存储器时或当出现结点故障时或为优化存储器空间使用和/或性能,迁移是必须的。数据迁移是耗时的过程,因为卷趋于非常大。此外,如果控制迁移的结点失效,数据可能永久丢失。因此,迁移对受影响的系统可具有有害的性能影响。因此,需要比目前现有的方案更高性能的数据迁移解决方案,且还需要防结点故障的数据迁移解决方案。
技术实现思路
根据本专利技术的原理,多个结点连到一个或多个存储系统或与其集成。结点提供用于客户机访问的LUN装置,LUN装置映射到对应于一个或多个存储系统上的存储区的源逻辑单元。目标逻辑单元对应于一个或多个存储系统上的不同存储区。源逻辑单元由多个结点中的两个或多个结点并行迁移到目标逻辑单元。更具体地,迁移按如下实现。确定将从源逻辑单元移到目标逻辑单元的数据块。提供位屏蔽,每一数据块具有一位。每一位在初始被复位。位屏蔽被分为多个位的拼接。之后,由多个结点中的两个或多个结点中的每一个执行下述步骤,直到源逻辑单元已被全部迁移到目标逻辑单元为止。结点试图锁定拼接。如果结点成功锁定拼接,则结点将对应于该拼接中的每一位的数据块复制到目标逻辑单元。之后,结点设置位屏蔽中对应于所复制数据块的位。其后,当对应于所述拼接中的位的所有数据块均已被复制时,结点解锁拼接。如果拼接不能被锁定,则另一结点已锁定该拼接且正迁移拼接的相应数据块。根据本专利技术的另一方面,多个结点包括群集系统。源逻辑单元和目标逻辑单元均为使用群集系统访问相应的存储区的逻辑实体。复制数据块的步骤在群集系统上运行。根据本专利技术的另一方面,迁移操作可被随时取消。如果用户向任何结点提交取消指令,则逻辑单元及映射到其的LUN装置被保留,目标逻辑单元和位屏蔽被删除。根据本专利技术的另一方面,位屏蔽在群集系统内的结点之间共享。当所有数据被复制到目的地因而位屏蔽中的所有位被置位时,迁移结束。位屏蔽的一个或多个镜象的拷贝保留在群集系统中。这些镜象的拷贝顺次更新以确保在任一时间只有一个拷贝被修改。该镜象提高了位屏蔽的容错。根据本专利技术的另一方面,在迁移期间对LUN装置的I/O访问可由客户机执行。如果I/O访问是读访问,数据从源逻辑单元返回给客户机。如果I/O访问是包括将被写入的数据的写访问,则结点首先确定数据将被写到哪一数据块。之后,其锁定包含该数据块的拼接。如果拼接中的所有位均被置位,则数据被写到源逻辑单元和目标逻辑单元。如果拼接中并非所有位均被置位,则从源逻辑单元读拼接中的数据块并与将被写入的数据结合,结合后的数据被写到源和目标逻辑单元。拼接中数据块的位被置位。之后解锁拼接。本专利技术的并行迁移方案相较先前可用的方案提供更高性能、更多容错的迁移解决方案。附图说明为有助于更全面理解本专利技术,现在参考附图。这些图不应被视为限制本专利技术,而仅是示例性的。图1为本专利技术实施于其中的系统的示意图。图2为包括本专利技术的迁移应用的I/O栈的表示。图3为根据本专利技术,通过多个结点将数据块从源逻辑单元并行迁移到目的地逻辑单元的表示。图4为被分为拼接的位屏蔽元数据的表示。图5为后台迁移操作的流程图。图6为前台操作的流程图。图7为位屏蔽的多个拷贝的表示。具体实施例方式根据本专利技术的原理,几个结点连到一个或多个存储系统。连到结点的客户机可访问对应于存储系统上的存储区的LUN装置。当特定LUN装置需要被迁移时,其相应的逻辑单元当由几个结点中的至少部分结点并行迁移到目标逻辑单元时成为源逻辑单元。由于迁移跨几个结点并行发生,大大提高了迁移速度,从而整体上提高了系统的性能。此外,尽管结点失效迁移操作也可进行,从而提供迁移的容错度量。参考图1,示出了本专利技术组合于其中的系统10。两个或多个结点12在网络14上连接,所述网络可以是IP网络、光纤通道SAN、一些其它互连网络或其组合。网络14将结点连到存储系统16。客户机18经网络20连到每一结点12。例如,网络20可以是IP网络、光纤通道SAN、一些其它互连网络或其组合。每一结点12执行群集系统软件22。群集系统软件22尤其需要以在访问数据的结点之间保持数据一致。也就是说,当多个客户机18访问和写同一数据时,共享的群集系统软件22确保数据是一致的,及一致地暴露给所有客户机。群集系统还采用元数据,其尤其用于确保数据一致。群集系统还确保元数据一致以防结点失效。许多群集系统使用许多类型的共享文件系统软件之一。网络文件系统(NFS)使多个客户机能经拥有共享文件的服务器访问共享文件。群集文件系统(CFS)使能通过任何结点同时共享访问并在结点失效时提供资源的故障切换。根据优选实施例,共享文件系统22为CFS。CFS的例子为来自Red Hat的GFS(全局文件系统)、来自IBRIX的Fusion、及来自IBM的GPFS(通用并行文件系统)。图1的结点12和存储系统16被示作单独实施,例如实施为服务器和存储器阵列。然而,结点12和存储系统16可组合在系统内。应注意,在于此描述的特定应用使用群集文件系统的同时,于此描述的应用通常适用于群集系统。本专利技术部分源自下述认识提供影响群集系统的优点的块存储装置的存储阵列非常有利。连到该系统的客户机同时共享对逻辑块存储装置即逻辑单元(LUN)的访问。群集系统确保这些共享的LUN上的数据一致。群集系统中的结点18通过“LUN装置”实体将LUN呈现给客户机。单一LUN装置对应于存储系统中存在的单一逻辑单元。因而,本专利技术提供用于实施分层在群集系统上的群集存储器阵列的软件。该软件称为“SCAD”。因而,图1中所示为用于实施群集存储器阵列的SCAD软件24。实施SCAD软件24的结点在此称为SCAD结点。SCAD软件24在图2中更详细地示出。SCAD软件24是建立为在CFS22之上运行的I/O软件栈26。SCAD栈26影响CFS22的有利特征,包括高可用性和共享数据的一致性,以将共享LUN暴露给客户机。所述栈的前端驱动器28为用于接口连接到客户机18的介质驱动器。SCAD API30将SCAD“装置”暴露给前端28。SCAD装置为可字节寻址的逻辑单元(“LUN装置”),其使用由作为其后备存储的在下面的CFS创建的文件。LUN装置最好由前端驱动器28作为SCSI LUN呈现给客户机18,尽管其它存储介质也可被实施。在下面SCAD API为SCAD分层应用32,其实施将对LUN装置执行的各种类型的操作。一种SCAD分层应用32为SCAD迁移应用34,其将进一步描述。SCAD层为CFS。SCAD内的层是位于CFS和SCAD应用之间的元数据管理器(MDB)36。MDB影响由CFS提供的锁定机构从而使能进行一致的群集范围的数据共享及保持SCAD元数据的一致性。该SCAD元数据38支持SCAD迁移应用。如将进一步描述的,MDB镜象其管理的元数据38以使其高度可用。该镜象对MDB上面的S本文档来自技高网...

【技术保护点】
装置,包括:与一个或多个存储系统一起运行的多个结点,所述结点提供由客户机访问的LUN装置,LUN装置映射到对应于一个或多个存储系统上的存储区的源逻辑单元;每一结点上用于导致多个结点中的两个或多个结点并行将源逻辑单元迁移到目标 逻辑单元的机构,目标逻辑单元对应于一个或多个存储系统上的不同存储区。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:迈克尔F布朗希兰P马德拉尼戴维W德罗什
申请(专利权)人:伊姆西公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1