仿效存储系统技术方案

技术编号:5386634 阅读:206 留言:0更新日期:2012-04-11 18:40
这项发明专利技术揭示一种用来把冗余数据从备份存储系统中除去的方法。在一个范例中,该方法可能包括识别第一备份数据对象,识别第二备份数据对象,检测第一备份数据对象的第一部分是第二备份数据对象的第二部分的副本,以及用指向第一部分的指针取代该第二部分。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术的诸方面涉及数据存储,更具体地说涉及用来模仿能提供全部数据备份的等价物的磁带存储系统使用现有的全部备份和后来逐渐增加的备份并准许用户从这样的 备份恢复数据的装置和方法。现有技术 许多计算机系统包括一个或多个主机和一个或多个储存主机所用数据的数据存 储系统。这些主机和存储系统通常是使用网络(例如,光纤通道(Fibre Channel)网络、以 太网网络或另一类型的通信网络)联网的。光纤通道是标准,它把基于信道的传输方案的 速度和基于网络的传输方案的灵活性结合起来并且允许多个初启程序与多个目标在网络 上通信,其中初启程序和目标可能是与网络耦合的任何装置。光纤通道通常是使用光纤电 缆之类的快速传输媒体实现的,并因此是用于转移大量数据的存储系统网络的流行选择。 包括若干主机和备份存储系统的典型的网络计算机环境的范例展示在图1中。 一个或多个应用服务器102经由局域网(LAN)103与众多用户计算机104耦合。应用服 务器102和用户计算机104两者都可能被视为主机。应用服务器102经由存储区网络 (SAN) 108与一个或多个主存储装置106耦合。主存储装置106可能是,举例来说,可从诸如 EMC公司、IBM公司之类的公司得到的磁盘阵列。作为替代,总线(未展示)或其它的网络 链路可能提供应用服务器和主存储系统106之间的互连。总线和/或光纤通道网络连接可 以使用规定在主机(例如,应用服务器102)和存储系统(s)106之间转移的数据包的格式 的协议(例如,小部件系统连接(SCSI)协议)来操作。 人们将领会到图1举例说明的联网的计算机环境代表可能被,举例来说,大的财 务机构或大公司使用的大系统。人们将理解许多联网的计算机环境不需要包括图l举例说 明的所有的元素。举例来说,较小的联网计算机环境可能仅仅包括与存储系统直接或经由 LAN连接的主机。除此之外,虽然图1举例说明分开的用户计算机104、应用服务器102和 媒体服务器114,但是这些功能可能被结合到一个或多个计算机中。 除了主存储装置106之外,许多联网计算机环境包括至少一个次要的或备份存储 系统110。备份存储系统110通常可能是磁带库,虽然可能使用其它大容量的、可靠的次存 储系统。通常,这些次存储系统比主存储器装置慢,但是包括某种类型的可以被拆除和远距 离储存的可拆除媒体(例如,磁带、磁盘或光盘)。 在列举的范例中,应用服务器102可能能够经由,举例来说,以太网或其它通信链 路112直接与备份存储系统110通信。然而,这样的连接可能是相对缓慢的而且可能用尽 资源,例如,处理器时间或网络带宽。因此,像列举的那样的系统可能包括一个或多个媒体 服务器114,该媒体服务器可能使用,举例来说,光纤通道,在SAN 108和备份存储系统110 之间提供通信链路115。 媒体服务器114可能运行某种软件,该软件包括控制在主机(例如,用户计算机 104、媒体服务器114和/或应用服务器102)、主存储器装置106和备份存储系统110之间的数据转移的备份/还原应用程序。备份/还原应用程序的范例可从Veritas、 Legato之 类的公司得到。为了保护数据,在联网的计算机环境中来自各种不同的主机和/或主存储 器装置的数据可能如同技术上已知的那样被定期地使用备份/还原应用程序备份到备份 存储系统110之上。 当然,人们将领会到,依照前面的讨论,许多联网的计算机环境与图1列举的可仿 效的联网计算机环境相比可能是比较小的而且可能包括较少的成分。所以,人们还将领会 到媒体服务器114可能事实上与应用服务器102结合在单一的主机中,而且备份/还原应 用程序可能是在与备份存储系统110(直接地或间接地,例如通过网络)耦合的任何主机上 运行的。 典型的备份存储系统的一个范例是包括若干盒式磁带和至少一个磁带驱动器以 及控制盒式磁带往磁带驱动器上装卸的机器人机制的磁带库。备份/还原应用程序把指令 提供指向机器人机制,使特定的盒式磁带(例如,0001号磁带)定位,并且将该盒式磁带装 进磁带驱动器,以便将数据写到该磁带上。备份/还原应用程序还控制往磁带上写数据的 格式。通常,备份/还原应用程序可能使用SCSI指令或其它标准化指令指导机器人机制和 控制磁带驱动器把数据写到磁带上和并且复原先前写在磁带上的数据。 传统的磁带库备份系统有许多问题,包括速度、可信度和固定的容量。许多大公司 需要每星期备份数千兆字节的数据。然而,即使昂贵的高端磁带通常也只能以每秒30-40 兆字节(30-40MB/s)(即大约每小时50千兆字节(50GB/hr))的速度读/写数据。因此,把 一或二千兆字节的数据备份到磁带备份系统上可能至少花费10到20小时的连续数据转移 时间。 除此之外,如果磁带跌落(这在典型的磁带库可能中相对地时常发生,因为人类 操作员或机器人机制在搬动或装载操作期间可能将磁带跌落)或者如果磁带暴露在非理 想的环境条件下(例如,在极端的温度或湿度条件下),大多数磁带制造商将不保证往磁带 储存数据(或恢复来自磁带的数据)将是可能的。所以,需要十分小心地把磁带保存在受 控的环境中。此外,复杂的磁带库的机器(包括机器人机制)维护费用是高昂的,而且个体 盒式磁带式是相对地昂贵的而且寿命有限。
技术实现思路
本专利技术的实施方案提供一种备份存储系统,该备份存储系统克服或减轻传统磁带库系统的一些或全部问题,而且可能提供比传统的磁带库系统大的灵活性。 概括地说,本专利技术的各个方面和各个实施方案提供以随机存取为基础的存储系统,该存储系统仿效传统的磁带备份存储系统,以致备份/还原应用程序看到与实际的磁带库一样的装置和媒体的视野。本专利技术的存储系统使用软件和硬件仿效实际的磁带媒体并且用一个或多个随机存取的磁盘阵列替换它们,转化磁带格式,把线性的连续的数据转换成适合在磁盘上储存的数据。 依照本专利技术的一些方面和实施方案,提供一种用来将现有的备份数据组解码并把 元数据(即,表现有关用户数据的信息的数据)储存在可搜寻的元数据高速缓冲存储器中 的机制、一种允许针对文件或对象搜寻和/或查看元数据高速缓冲存储器的机制和一种用 来经由网络连接从通过现有的备份政策和典型的备份软件实践储存的数据下载这些文件或对象的机制。用来通过现有的鉴别机制鉴别用户和用来以用户现在的证件为基础限制查 看元数据高速缓冲存储器的机制可能也被包括在内。 本专利技术的各个方面和实施方案还准备把冗余数据从备份数据对象中除去。这个 可能被称为重复数据删除的切除程序减少维持备份数据的副本所需要的存储能力并因 此减少储存备份数据所需要的电子媒体的数量。依照本专利技术的至少一些方面,删除重复程 序的实施方案通过使用元数据有效地利用计算机资源优化删除重复处理,下面将进一步讨 论。 依照本专利技术的其它的方面和实施方案,提供用来在元数据高速缓冲存储器中实现 多样的盒式磁带表达的逻辑合并的机制和用来适当地指向新合成的盒式磁带加标签和条 形码以致它作为有效的数据组被备份/还原软件接受的机制。另外,依照本专利技术的进一步 的方面和实施方案,提供用来储存代表合成盒式磁带的数据元素的多样的副本或用来只储 存指向在元数据高速缓冲存储器中表现现有数据的指针的机制。 本专利技术的一个方面指向用本文档来自技高网
...

【技术保护点】
一种用来把冗余数据从备份存储系统中除去的方法,该方法包括:识别数据对象元数据的至少一个特征;识别与有那至少一个特征的数据对象元数据相关联的第一备份数据对象;识别与有那至少一个特征的数据对象元数据相关联的第二备份数据对象;检测是第二备份数据对象的第二部分的副本的第一备份数据对象的第一部分;以及用指向该第一部分的指针取代该第二部分。

【技术特征摘要】
【国外来华专利技术】US 2007-6-29 11/771,245一种用来把冗余数据从备份存储系统中除去的方法,该方法包括识别数据对象元数据的至少一个特征;识别与有那至少一个特征的数据对象元数据相关联的第一备份数据对象;识别与有那至少一个特征的数据对象元数据相关联的第二备份数据对象;检测是第二备份数据对象的第二部分的副本的第一备份数据对象的第一部分;以及用指向该第一部分的指针取代该第二部分。2. 根据权利要求1的方法,其中识别数据对象元数据的至少一个特征包括 识别在主存储器中与第一备份数据对象相关联的位置;以及 识别在主存储器中与第二备份数据对象相关联的位置。3. 根据权利要求1的方法,其中至少识别数据对象元数据的一个特征包括 识别与一个软件申请相关联的第一笔备份数据对象;而且 识别与一个软件申请相关联的第二的备份数据对象。4. 根据权利要求3的方法,其中检测第一备份数据对象的第一部分包括至少部份地基 于与软件应用程序相关联的数据分布图检测是第二备份数据对象的第二部分的副本的第 一备份数据对象的第一部分。5. 根据权利要求1的方法,其中识别数据对象元数据的至少一个特征包括 识别与第一备份数据对象相关联的备份政策;以及 识别与第二备份数据对象相关联的备份政策。6. 根据权利要求1的方法,其中识别数据对象元数据的至少一个特征包括 识别当第一备份数据对象被备份的时候被储存的数据对象元数据的至少一个特征;以及识别当第二备份数据对象被备份的时候被储存的数据对象元数据的至少一个特征。7. 根据权利要求l的方法,其中识别第一备份数据对象包括识别第一数据文件,识别 第二备份数据对象包括识别第二数据文件。8. 根据权利要求l的方法,其中识别第二备份数据对象包括识别与第一备份数据对象 相比最近被较少地备份的第二备份数据对象。9. 根据权利要求l的方法,其中识别第二备份数据对象包括识别与第一备份数据对象 相比最近被较多地备份的第二备份数据对象。10. 根据权利要求l的方法,其中检测第一备份数据对象的第一部分包括使用与第一 备份数据对象相关联的元数据和与第二备份数据对象相关联的元数据检...

【专利技术属性】
技术研发人员:M桑多菲TG瑞特
申请(专利权)人:赛帕顿有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1