用于虚拟磁带库系统中的优化回收处理的系统和方法技术方案

技术编号:7763521 阅读:299 留言:0更新日期:2012-09-14 23:20
本发明专利技术涉及时序媒体的存储管理的领域,更具体地,其涉及诸如虚拟磁带库中的虚拟磁带之类的虚拟化时序媒体的自治回收处理。为了提供一种用于对虚拟磁带库系统中的虚拟磁带进行管理的改进方法和系统,所发明专利技术的系统包括对虚拟磁带库系统(VTL系统)中的虚拟磁带进行管理的存储管理应用,其能够识别给定源虚拟磁带的活动数据的所有块地址;所述存储管理应用经由网络连接至所述虚拟磁带库系统,并且能够发送指示所述VTL系统执行自治回收的命令。VTL系统的特征在于所发明专利技术的回收逻辑,其将存储管理应用所写入的每个主机块唯一地映射至所述VTL系统的磁盘系统上的块。结合存储管理系统,其执行一种用于执行自治回收的方法。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及时序媒体的存储管理领域,更具体地,其涉及诸如虚拟磁带库中的虚拟磁带的虚拟化时序媒体的自治回收处理。
技术介绍
诸如IBM Tivoli Storage Manager、 Symantec Netbackup 或 EMCLegatoNetworker之类的存储管理应用执行诸如备份、归档和分级存储管理之类的不同数据存储操作。存储管理应用使用诸如虚拟磁带之类的时序媒体主要针对比物理磁带上的数据被更频繁访问的数据进行成本有效的存储。虚拟磁带典型地由虚拟磁带库进行仿真。根据现有技术的虚拟磁带库包括执行磁 带虚拟化软件的计算系统。该磁带虚拟化软件仿真虚拟磁带驱动器、虚拟磁带库和虚拟磁带。虚拟磁带库经由接口以及诸如存储区域网(SAN)或局域网(LAN)之类的网络连接到存储管理应用。存储管理应用将虚拟磁带设备和虚拟磁带仅“视为”真实的磁带设备。当存储管理应用对虚拟磁带进行写入时,该虚拟磁带被存储在也包括在虚拟磁带库中的磁盘系统中。虚拟磁带库中的每个虚拟磁带具有唯一的序列号,该序列号也被称作VOLSER。VOLSER允许唯一识别虚拟磁带库中的虚拟磁带。就像真实的磁带一样,虚拟磁带无法被以随机的方式写入,而是要从开头向结尾进行顺序写入。因此,不可能向磁带上的任意位置写入数据,而是仅在上次写操作已经在超出那里之处结束的位置写入数据。当磁带上的数据需要被重写时,则磁带必须再次从开头开始写入。随着已经被写入虚拟磁带的数据到期,这导致数据或部分数据变为非活动的。其余数据仍然是活动的。图I示出并例示了虚拟磁带100上的活动数据102和非活动数据104。活动数据是仍然有效并且可能被用于恢复的数据。非活动数据通常已经到期并且不再有效。因此,非活动数据实质上由整个磁带容量减去活动数据所代表。非活动数据是VTL的磁盘系统中存储空间的浪费,原因在于该数据不再被需要并且潜在地可能被删除。虚拟磁带上随着时间变为非活动的数据越多,虚拟磁带上被浪费的存储容量就更多,这是因为具有非活动数据104的点(spot)无法有选择地被重写。此外,磁带上的数据通常并不是按顺序到期,如图I所示,这在磁带上的活动数据部分之间留下了具有非活动数据的间隙。例如,根据现有技术的诸如在虚拟磁带库IBM TS7500中仿真的IBM TS1130的虚拟磁带具有ITB的容量。如果这样的虚拟磁带剩余50%的活动数据,则有500GB的存储容量被浪费-这是因为其仍然由虚拟磁带库进行分配,而不再被应用软件所引用。虚拟磁带仅在所有活动数据都到期或者所有活动数据都已经被移动到另一个虚拟磁带时才能够被重新使用。虚拟磁带需要为空以便从开头被重新用于新的备份。将活动数据102移动到另一个虚拟磁带也被称作回收(reclamation)。存储管理应用实施回收处理。回收处理监视已经被写满的每个虚拟磁带上的活动数据的量。典型地,具有用户可以设置的阈值-也被称作回收阈值-并且如果活动数据的量低于该阈值,则存储管理软件就自动将剩余的活动数据从该源虚拟磁带复制到在此时处于空或填充状态的目标虚拟磁带。在回收处理结束时,源磁带为空并且能够被从磁带开头处重新使用。根据现有技术的该回收处理具有以下缺陷I.回收处理由存储管理服务器来执行,这消耗了存储管理服务器上附加的计算资源。2.回收处理要求两个虚拟设备一个用于读取数据以及一个用于写入数据。3.在回收期间,要利用存储管理服务器和虚拟磁带设备之间的网络。4.在一个输出虚拟磁带变满的情况下,可能属于一起的数据集合或文件可能在回收期间被写入两个不同的虚拟磁带。这导致了较长的恢复时间。5.为了保持以上两种原因的影响小,典型地建议在时序媒体上存在30%或更少的活动数据时开始回收处理。然而,这使得可用存储容量大幅减少-理论上为70%,实际通常为50% ο6.回收之后不包含活动数据的虚拟磁带在回收处理之后仍然消耗整体容量(非活动数据),这是因为空间仅在所回收的虚拟磁带被应用软件从磁带开头(主机块(hostblock)O)重新写入时才被释放。因此,需要一种克服根据现有技术的回收处理的这些缺陷的系统和方法。
技术实现思路
本专利技术的目的是提供一种用于管理虚拟磁带库系统中的虚拟磁带的改进方法和系统。本专利技术的该目的通过所附有的独立权利要求中所提到的特征而实现。本专利技术另外的有利配置和实施例在相应的从属权利要求中给出。现在将参考所附权利要求。根据本专利技术的第一方面,所专利技术的系统包括对虚拟磁带库系统(VTL系统)中的虚拟磁带进行管理的存储管理应用,其能够识别给定源虚拟磁带的活动数据的所有块地址;所述存储管理应用经由网络连接至所述虚拟磁带库系统,并且能够发送指示所述VTL系统执行自治回收的命令。VTL系统的特征在于所专利技术的回收逻辑,其将存储管理应用所写入的每个主机块唯一地映射至所述VTL系统的磁盘系统上的块。结合存储管理应用,其执行实施自治回收的方法,上述方法的特征在于步骤a)存储管理应用确定源虚拟磁带要求回收,b)存储管理应用识别源虚拟磁带的活动数据的所有块地址,并且以升序对块地址进行排序,c)存储管理应用识别具有足够的空闲容量来存储所述源虚拟磁带的活动数据的目标虚拟磁带以及所述目标虚拟磁带上最后写入的块地址,d)存储管理向VTL系统发送指示其执行回收的命令,该命令包括关于所述源和所述目标虚拟磁带、表示源虚拟磁带上的活动数据的块地址的有序列表以及目标虚拟磁带上的开始块地址的信息,e) 一旦接收到命令,所述回收逻辑仅通过更新主机块至磁盘块的映射表而将所述源卷的活动数据主机块在所述开始块地址处开始引用至所述目标虚拟磁带,并且向存储管理应用发送针对回收命令的完成消息;以及f) 一旦接收到针对回收命令的完成消息,存储管理应用通过去除源卷的所述活动数据块并且将所述活动数据块在开始主机块地址处开始添加到目标卷来更新块映射表。在任选的下一个步骤中,回收逻辑从主机块到磁盘块的映射表中去除源虚拟磁带的所有主机块地址以便释放VTL系统中的空间。由于源虚拟磁带的存储空间已经被回收,所以之前存储在所述源虚拟磁带上的数据就不再被需要。在本专利技术的一个实施例中,经由映射表进行主机块到磁盘块的映射。磁盘块可能由磁盘系统上的块所代表。可替换地,其可以由文件系统中的文件所代表。 所专利技术的回收逻辑包括另外的方法,其拦截写入命令并且依据写入命令更新主机块到磁盘块的映射表。所专利技术的回收逻辑进一步包括一种方法,其拦截读取命令并且基于所述映射表确定适当的磁盘块。本专利技术进一步提供了第二方面,其中与存储管理应用相结合的所述回收逻辑包括另外的方法,其通过以下步骤从VTL磁盘系统删除给定源虚拟卷的非活动数据I.存储管理应用通过将非活动数据的相对量与阈值相比较来确定源虚拟磁带具有特定百分比的非活动数据,2.存储管理应用识别源虚拟磁带的非活动数据的所有块地址,3.存储管理向VTL系统发送指示其删除以上所识别的源虚拟卷的非活动数据块的命令,4. 一旦接收到命令,所专利技术的回收逻辑就通过从主机块至磁盘块的映射表去除非活动数据块来删除非活动数据块。这将释放磁盘块,上述磁盘块现在能够被用于新数据。所专利技术的方法和相应系统与现有技术的VTL系统相结合地利用以下特征克服了现有技术的存储管理应用的上述缺陷I.回收不是由存储管理服务器而是由VTL系统自身来本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:N·豪斯汀S·内夫
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1