通过指示符在数据重复消除系统中保留冗余技术方案

技术编号:10805634 阅读:143 留言:0更新日期:2014-12-24 12:25
提供了用于在计算环境中的数据重复消除系统中保留数据冗余的各种实施例。在一个实施例中,公开了一种用于这样的保留的方法。配置了一种指示符。该指示符提供有经选择的数据段,其将被通过数据重复消除系统写入,以指定经选择的数据段必须不进行重复消除操作,使得不论是否相同,重复数据均可以被写入存储到物理位置上。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】提供了用于在计算环境中的数据重复消除系统中保留数据冗余的各种实施例。在一个实施例中,公开了一种用于这样的保留的方法。配置了一种指示符。该指示符提供有经选择的数据段,其将被通过数据重复消除系统写入,以指定经选择的数据段必须不进行重复消除操作,使得不论是否相同,重复数据均可以被写入存储到物理位置上。【专利说明】通过指示符在数据重复消除系统中保留冗余
本专利技术一般地涉及计算机,并且更具体地,涉及用于在包含数据重复消除系统的 计算环境中保留冗余和其他数据安全特性的方法、系统和计算机程序产品。
技术介绍
计算机和计算机系统在当今社会中的各种设置中被发现。计算环境和网络可以在 家中、在工作、在学校、在政府和其他场景中被发现。计算环境逐渐将数据存储在一个或多 个存储环境中,这在许多情况下远离对用户呈现的本地接口。 这些计算存储环境可以使用通常协作工作的诸如磁盘驱动的许多存储设备,以存 储、检索和更新大量数据,然后可以将其提供给请求或发送数据的主机计算机。在一些情况 下,很多数据存储子系统作为单个数据存储系统被集中进行管理。这些子系统可以由主机 "系统综合体(sysplex)"(系统复杂(systemcomplex))配置来管理,该配置组合若干处理 单元或处理单元的集群。以该方式,通常包括多种类型的存储设备的多层/多系统的计算 环境可以用于组织和处理大量数据。
技术实现思路
许多多层/多系统的计算环境实现数据重复消除技术以通过减少跨存储设备的 重复的存储来提高存储性能。数据重复消除系统被越来越多地使用,因为其有助于减少存 储数据所需要的物理存储的总量。该减小是通过确保重复数据不会被多次存储来完成的。 替代地,例如,如果进入应用写入数据块与已经存储的数据块匹配,则对原始数据的指针被 存储在虚拟存储映射中,而不是分配新的物理存储空间用于新的数据块。 然而,在某些情况下,重复消除的行为,即重复数据的单个实例化,可能不利于例 如所主控的应用的冗余要求或存储策略或其他要求。需要一种机制,由此保障需要被存储 多次的数据,而通过对不具有这样的要求的剩余数据进行重复消除来不减少重复消除系统 的优点。 鉴于上述,公开了用于在数据重复消除系统中保留数据冗余的各种实施例。在一 个实施例中,仅作为示例的方式,公开了一种用于这样的保留的方法。配置了一种指示符。 该指示符被提供有经选择的数据段,该经选择的数据段将被通过数据重复消除系统来写 入,以指定该经选择的数据段必须不进行重复消除操作。 除了上述的示例性实施例,各种系统和计算机程序实施例被提供并且提供相关的 优点。 【专利附图】【附图说明】 为了使本专利技术的优点容易理解,以上简要描述的本专利技术的更具体的描述将通过参 考在附图中图示的具体实施例来呈现。可以理解,这些附图仅描绘了本专利技术的典型实施例, 并且因此不被认为是对其范围的限制,将通过使用附图来以附加特征和细节描述和说明本 专利技术,在附图中: 图1是图示可以实现本专利技术的各方面的示例性计算环境的框图; 图2是示出也可以实现本专利技术的各方面的数据存储系统的硬件结构的框图; 图3是可以实现本专利技术的各方面的示例性写入请求; 图4是也可以实现本专利技术的各方面的通过数据重复消除引擎写入数据的示例性 过程的框图; 图5是根据本专利技术的用于确保数据重复消除系统中的冗余的示例性方法;以及 图6是可以实现本专利技术的各方面的用于处理数据的示例性方法。 【具体实施方式】 存储控制器中的数据重复消除通常在应用的"幕后"工作,并且当违反应用的需要 执行重复消除操作时,有时可能违反应用的兴趣来进行操作。如果应用写入相同数据的多 个副本,并且期望保留多个物理副本,而重复消除子系统(重复消除引擎)发现这些匹配副 本并且在存储数据的同时终止重复消除该副本,则该情况可能出现。这可能不利于期望在 各种位置找到多个副本的应用,并且使得存储系统相信它已经这样做,但是实际上,仅仅已 写入了该数据的单个副本。 考虑下述示例。文件系统通常喜欢在虚拟磁盘上写入"超级块"的多个物理副本 或描述基于块的存储设备上的文件系统的元数据段(或其他元数据信息)以确保冗余。因 为超级块的内容是相同的,所以数据重复消除将导致保留超级块单个物理副本和对相同物 理块的指示多个虚拟地址。该情况是非常不适当的,因为超级块的物理副本上的单个块的 丢失可能使得文件系统完全不可用,因为不存在该超级块的冗余副本。传统地,没有在数据 重复消除系统中直接解决该问题的现有方法。 各种间接方法可以用于尝试解决该问题。在一个示例中,可以使数据重复消除子 系统从其分离出物理存储的存储池产生镜像(mirror)(即,包含相同数据的2个或3个副 本)。因此,不论重复消除如何,都可以创建多个冗余副本。然而,由于下述原因而导致这对 应用的保护是不充分的。首先,应用可能希望保持例如同一数据的十(10)个副本。然而,如 果使存储池双向产生镜像,则可能仅保留最多两个(2)副本。第二,因为数据重复消除分离 出跨大量存储和多个文件系统的物理存储池,所以多个应用和文件系统很可能共享相同的 物理存储池。因此,数据的一些关键的副本(如超级块)能够物理地位于同一磁盘上。因 为重复消除将防止同一数据的多个副本被写入到多个物理位置,所以关键数据的副本的数 目减少,并且其可能针对多个文件系统位于同一物理磁盘上。这增加了单个故障成为致命 的风险。 所示的实施例提供了用于解决前述问题的多种机制。这些机制中的一个目的是确 保存储控制器(或其可以位于的任何位置)的重复消除子系统平衡减少数据副本的数目的 优点与对物理分配关键数据的多个副本的应用要求。下述实施例中描述的方法中的每一个 可以在各种情况中使用,并且可以具有特定于该情况的伴随优点。 在一个这样的实施例中,可以由应用向目标存储控制器系统提供用于经选择的数 据段的指示符,以指定具体的数据段不进行重复消除操作。然后,该动作强制存储控制器为 指定的数据块分配新的物理存储。一个这样的指示符可以包括比特,根据是否应该对经选 择的数据段/块执行期望的重复消除而将该比特设置为高或低。 鉴于上述实施例,通过允许应用指示写入是否必须被重复消除,允许应用实现与 其生成的数据相关联的存储策略的灵活性。这样,对于确定经选择的数据(即使是相同的) 是否仍然必须位于独立的物理位置,应用比重复消除系统处于更好的位置。此外,存储控制 器(或其他存储管理设备)继续执行其通过重复消除的数据减少的作用,并且同时允许对 应用的足够控制以在需要时取消重复消除。 通过向写入命令提供指示符,该指示符用于向存储控制器(或还有其他存储管理 设备)指示经选择的数据是否必须跳过重复消除,由此对应用提供非常细粒度的控制,在 仍然保留重复消除功能的优点并且保留用于关键数据的冗余的同时,允许实现灵活性。 在以下描述中,参考形成本说明书的一部分并且图示本专利技术的若干实施例的附 图。应当理解,可以利用其他实施例,并且在不脱离本专利技术的精神和范围的情况下可以进行 结构和操作改变。 转到图1,描述了可以实现本专利技术的各方面的示例性计算机系统10。计算机系统 10本文档来自技高网...

【技术保护点】
一种由处理器在计算环境中将数据冗余保留在数据重复消除系统中的方法,包括:配置指示符,所述指示符被提供有经选择的数据段,所述经选择的数据段将被通过所述数据重复消除系统来写入,以指定所述经选择的数据段必须不进行重复消除操作。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:R·M·费斯科C·E·琼斯S·罗伊
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1