用于元数据的分级存储管理的方法和系统技术方案

技术编号:2836770 阅读:263 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了用于访问信息的技术。创建部分关键字索引,其中该部分关键字索引包括一个或多个部分关键字索引(PKI)记录项,其中每个PKI记录项标识元数据对象的一部分,其中该元数据对象包括元数据记录项,每个元数据记录项对应于相关联的数据对象。该部分关键字索引用于定位一个或多个PKI记录项,其中该一个或多个PKI记录项中的每一个对应于一个或多个复合对象之一中的一个或多个数据对象。该一个或多个PKI记录项中的每一个用于提取在针对该一个或多个复合对象中的每一个复合对象的元数据对象中的元数据的位置信息。使用该位置信息将来自每个元数据对象的元数据加载进数据库。

【技术实现步骤摘要】

本专利技术的实施例涉及对诸如数据库记录项之类的元数据的分级存储管理。
技术介绍
存储管理应用提供了在计算机网络中从客户端计算机处备份的、存档的、移植的或以其他方式存储的计算机信息的资源库。该资源库可以是链接到存储管理服务器的分级存储器体系(storage hierarchy),并且可以存储诸如文件和目录之类的数据对象。分级存储器体系通常包括一个或多个数据存储介质级别,其对应于所存储的数据的可访问性。例如,一个级别可以包括多个直接访问存储设备(DASD),其提供对所存储的数据的相对较快的访问。另一级别可包括多个顺序访问存储设备,其提供对数据的较慢的访问,但是在用“数据存储容量/存储设备成本”来衡量时通常是更加节省成本的。一些常规方法将各个数据对象存储在分级存储器体系中,其提供了较高程度的管理粒度,但是需要大量的存储管理开销。换言之,数据对象中的每一个可以独立于所有其他数据对象而被访问、提取、移动或以其他方式处理。在这个级别的管理代价可能相当高,因为存储管理服务器必须维护这样的数据库,其跟踪各个数据对象中的每个数据对象。因此,存储管理服务器数据库可能需要高得惊人的存储容量以存储与所有数据对象相关联的所有元数据。另外,为了提供该管理粒度,总的操作复杂度可能相当得大。另一种管理分级存储器体系内的数据对象的方法使用复合对象,该复合对象包含聚集成单个可操作存储对象的多个数据对象。即,可以将复合对象描述为包含多个文件、目录、数据库或其他数据对象的对象。复合对象的一个例子是一个表示在特定时间点对整个文件系统的备份的对象。这样的复合对象可以包含整个文件系统中的所有数据对象。对文件系统的备份可以被全部包含在单个复合对象中,而不是在数据库中创建众多的数据对象和对应的元数据对象记录项,针对该单个复合对象在存储管理服务器数据库内仅建立一个数据库记录项。将整个复合对象存储为单个对象可以实现对该复合对象中的所有数据的快速备份/恢复。因为该存储管理服务器处理单个对象,所以也简化了对这种数据的管理。无论这样的复合对象是出于备份目的还是出于其他存储管理目的而创建的,通常将这样的复合对象称作镜像。在这种情形下创建的备份镜像包含来自该文件系统的所有数据对象,并且可被存储为该分级存储器体系中的单个对象,诸如被存储在磁带上。分级存储器体系中镜像的使用可以极大地降低管理复杂度,因为该存储管理服务器可以将单个镜像中的所有数据对象作为单个对象来处理。将数据对象存储为单个镜像还可实现对该镜像内的数据进行更快的备份和恢复操作。存储管理服务器可以将数据对象存储在一个或多个存储位置或存储池中,并且使用数据库来跟踪关于所存储的数据对象的信息,该信息包括数据对象的属性以及在存储池中的位置。可以将存储池描述为一个或多个诸如磁盘或磁带之类的存储介质,其被分配为用于存储数据的组。典型的存储池可以对应于特定类型的数据、用户组或部门或者其他分组标准。一些系统收集并存储涉及复合对象内的各个对象的元数据,并且使该元数据可被访问而不需读取该复合对象。这使得允许对元数据进行访问和显示,因此可以对各个文件进行查询以便提取。复合对象内的针对各个对象的元数据可以包括数据对象的完全合格的名称、大小、时间戳以及在该复合对象内的位置。下面是两种用于管理复合对象内的各个对象的元数据的一般方法。在一种方法中,可以将元数据信息存储在存储管理服务器数据库中,以便在从任何复合对象搜索和提取任意个别对象时能进行快速访问。然而,所需的数据库空间的量随着存储越来越多的复合对象而增长,其可能使数据库性能降低。将每个复合对象的所有元数据都存储在数据库中也会引起在需要删除该复合对象时的低效率,因为这将要求也删除针对那个复合对象的每个元数据对象记录项。在另一种方法中,可以将复合对象内的所有对象的元数据存储在单个元数据对象中,该元数据对象被存储在分级存储器体系中。因此,该元数据对象包含针对该复合对象内的对象(一般是文件或目录)的属性和位置索引。该索引信息被存储在该元数据对象中并且与该复合对象相关联,因此该元数据不需要数据库空间。可以在存储该复合对象的时候创建该元数据对象,或者如果该复合对象已经内嵌了描述其内容的信息则可以通过在存储该复合对象之后扫描该复合对象的内容来创建该元数据对象。这种方法的缺点是对各个元数据对象记录项的访问会非常慢。因此,在本
中需要改进的元数据分级存储管理,以降低数据库大小并且提供更快的查询响应时间。
技术实现思路
提供了一种用于访问信息的方法、计算机程序产品和系统。创建部分关键字索引(partial key index),其中该部分关键字索引包括一个或多个部分关键字索引(PKI)记录项,其中每个PKI记录项标识元数据对象的一部分,其中该元数据对象包括元数据记录项,每个元数据记录项对应于相关联的数据对象。该部分关键字索引用于定位一个或多个PKI记录项,其中该一个或多个PKI记录项中的每一个对应于该一个或多个复合对象之一中的一个或多个数据对象。该一个或多个PKI记录项中的每一个用于提取在针对该一个或多个复合对象中的每一个复合对象的元数据对象中的元数据的位置信息。使用该位置信息将来自每个元数据对象的元数据加载进数据库。附图说明现在参考附图,在全部附图中相同的参考数字表示对应的部分。图1说明代表性的分级数据存储管理系统100,通过该系统或者结合该系统可以使用实施例。图2说明根据某些实施例的数据库的细节。图3说明根据某些实施例的以包括在针对复合对象的元数据对象中的元数据对象记录项的形式出现的样本元数据。图4说明根据某些实施例的包括在部分关键字索引中的样本PKI记录项。图5说明根据某些实施例的存储管理子系统的示例性数据分级存储器体系。图6说明根据某些实施例的用于创建部分关键字索引的逻辑。图7说明根据某些实施例的用于提供对复合对象的访问的逻辑。图8说明根据某些实施例的用于恢复一个或多个数据对象的逻辑。图9说明根据某些实施例的用于删除部分关键字索引的逻辑。图10说明根据某些实施例的可以使用的系统架构。具体实施例方式在以下的说明中,参考了附图,这些附图形成了说明书的一部分并且说明了本专利技术的若干实施例。应当理解,可以利用其他实施例,并且可以在不偏离本专利技术范围的情况下进行结构的和操作的改变。图1说明代表性的分级数据存储管理系统100,通过该系统或者结合该系统可以使用实施例。该系统100一般包括一个或多个用户客户端工作站102、一个或多个管理员工作站112以及存储管理子系统120。该用户客户端工作站102经由通信信道108电连接到该存储管理子系统120。该用户客户端工作站102向用户提供对该存储管理子系统120的访问。该管理员工作站112经由通信信道118电连接到该存储管理子系统120。该管理员工作站112还可以在邻近时和功能允许的条件下直接连接到该存储管理子系统120。该管理员工作站112被配置为管理并监控该存储管理子系统120的功能性和处理。该存储管理子系统120被配置为根据来自该用户客户端工作站102和该管理员工作站112的请求来存储数据并管理所存储的数据。该存储管理子系统120包括存储管理服务器130,其经由通信信道190操作上耦合到数据库170和分级存储器体系180。该分级存储器体系180包本文档来自技高网
...

【技术保护点】
一种用于访问信息的计算机实现的方法,包括:创建部分关键字索引,其中所述部分关键字索引包括一个或多个部分关键字索引(PKI)记录项,其中每个PKI记录项标识元数据对象的一部分,其中所述元数据对象包括元数据记录项,每个元数据记录项对应于相关联的数据对象;使用所述部分关键字索引来定位一个或多个PKI记录项,其中所述一个或多个PKI记录项中的每一个对应于一个或多个复合对象之一中的一个或多个数据对象;使用所述一个或多个PKI记录项中的每一个来提取针对所述一个或多个复合对象中的每一个复合对象的元数据对象中的元数据的位置信息;以及使用所述位置信息将来自每个元数据对象的元数据加载进数据库。

【技术特征摘要】
US 2006-5-3 11/381,4991.一种用于访问信息的计算机实现的方法,包括创建部分关键字索引,其中所述部分关键字索引包括一个或多个部分关键字索引(PKI)记录项,其中每个PKI记录项标识元数据对象的一部分,其中所述元数据对象包括元数据记录项,每个元数据记录项对应于相关联的数据对象;使用所述部分关键字索引来定位一个或多个PKI记录项,其中所述一个或多个PKI记录项中的每一个对应于一个或多个复合对象之一中的一个或多个数据对象;使用所述一个或多个PKI记录项中的每一个来提取针对所述一个或多个复合对象中的每一个复合对象的元数据对象中的元数据的位置信息;以及使用所述位置信息将来自每个元数据对象的元数据加载进数据库。2.根据权利要求1所述的方法,其中所述一个或多个元数据对象记录项中的每一个标识相关联的数据对象。3.根据权利要求1所述的方法,还包括接收对位于一个或多个复合对象中的数据对象的请求,其中所述数据对象是目录。4.根据权利要求1所述的方法,还包括显示与所述已加载的元数据相关联的一个或多个数据对象。5.根据权利要求4所述的方法,还包括接收用于展开目录的指示。6.根据权利要求4所述的方法,还包括接收用于对被显示的一个或多个已选择的数据对象执行动作的指示;以及执行所述动作。7.根据权利要求6所述的方法,其中所述动作是观看所述一个或多个已选择的数据对象。8.根据权利要求7所述的方法,其中所述动作是恢复所述一个或多个已选择的数据对象,并且还包括使用所述已加载的元数据来标识所述待恢复的一个或多个数据对象中的每一个数据对象的位置;以及将所述一个或多个数据对象拷贝到指定的目的地。9.根据权利要求1所述的方法,还包括确定所述元数据是否已被加载;以及响应于确定所述元数据还没被加载,使用所述部分关键字索引来定位所述一个或多个PKI记录项。10.一种用于访问信息的计算机实现的方法,包括创建包括一个或多个数据对象的复合对象;创建元数据对象,其中所述元数据对象是对所述复合对象的索引,并且其中所述元数据对象包括元数据记录项,每个元数据记录项对应于相关联的数据对象;以及创建部分关键字索引,其中所述部分关键字索引包括一个或多个部分关键字索引(PKI)记录项,其中所述一个或多个PKI记录项中的每一个标识所述元数据对象的一部分,并且其中所述一个或多个PKI记录项中的每一个对应于在所述一个或多个复合对象之一中的一个或多个数据对象。11.根据权利要求10所述的方法,其中创建一个或多个包括所述一个或多个数据对象的复合对象,并且还包括使用所述部分关键字索引来定位一个或多个PKI记录项,其中所述一个或多个PKI记录项中的每一个对应于在所述一个或多个复合对象之一中的一个或多个数据对象;使用所述一个或多个PKI记录项中的每一个来提取在针对所述一个或多个复合对象中的每一个复合对象的元数据对象中的元数据的位置信息;以及使用所述位置信息将来自每个元数据对象的元数据加载进数据库,其中所述元数据能够用于访问所述数据对象。12.一种包括计算机可用介质的计算机程序产品,所述计算机可用介质包括计算机可读程序,其中当在计算机上执行所述计算机可读程序时,所述计算机可读程序使所述计算机创建部分关键字索引,其中所述部分关键字索引包括一个或多个部分关键字索引(PKI)记录项,其中每个PKI记录项标识元数据对象的一部分,其中所述元数据对象包括元数据记录项,每个元数据记录项对应于相关联的数据对象;使用所述部分关键字索引来定位一个或多个PKI记录项,其中所述一个或多个PKI记录项中的每一个对应于一个或多个复合对象之一中的一个或多个数据对象;使用所述一个或多个PKI记录项中的每一个来提取针对所述一个或多个复合对象中的每一个复合对象的元数据对象中的元数据的位置信息;以及使用所述位置信息将来自每个元数据对象的...

【专利技术属性】
技术研发人员:DM坎农MJ安格林
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1