提供了用于在重复删除系统中进行空间预留的各种实施方式。基于至少一个存储容量阈值与当前被备份和复制数据之一物理消耗的已用存储空间,将计算的选配比确定为当前额定数据与物理数据的加权比。对计算存储环境中的最大额定估计空间进行计算。计算剩余空间,该剩余空间定义为所述最大额定估计空间减去计算存储环境中的当前额定空间。如果剩余空间等于或者小于用户配置的用于备份操作的预留空间,则数据复制操作被接受并且存储在计算存储环境中。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体上涉及计算机,尤其涉及用于在可操作于计算存储环境中的重复删除(deduplication)系统中进行空间预留的装置、方法与计算机程序产品实施方式。
技术介绍
重复删除系统可以表现(externalize)各种逻辑数据存储实体,例如文件、数据对象、备份图像、数据快照或虚拟带盒。常常需要把这种数据存储实体从其原始站点复制到远端站点。被复制的数据实体增强了数据的容错能力和可用性。越来越需要这种容错性和广泛的可用性。尽管几种现有的方法可以用于执行数据复制,具体而言是执行对重复删除后的数据实体的复制,但是这些方法有附带的限制,这些限制会不利地影响复制效率、系统性能和数据一致性,需要附加的开销或者以上所述的组合。
技术实现思路
重复数据删除是指减少和/或消除冗余数据。在一种重复数据删除处理中,分别减少或消除数据的重复副本,留下最少量的冗余副本或者数据的单个副本。利用重复删除处理提供了多种益处,例如所需存储容量的减小和网络带宽的增加。由于这些及其它益处,重复删除近年来已经作为计算存储系统中一种非常重要的
脱颖而出。提供重复删除功能的挑战包括多个方面,例如有效地找出典型较大存储仓库中的重复数据模式,以及把以重复删除后存储有效的形式存储所述数据模式。例如,在一种许多复制发送者与一个同时还充当备份目标的接收者通信的配置中,当前用于重复的复制解决方案面临备份功能或到来的复制哪个应当具有更高优先级的挑战。当前,这种挑战可能导致对可用存储空间的竞争状况,如将进一步描述的。鉴于本领域当前的情况,需要一种用于重复删除后数据的复制的机制,这种机制满足有效复制处理的全部要求,同时避免如上所述的某些配置中的现有方法的这些限制,由此改进用于重复删除后数据的复制的现有方法。相应地,提供了用于便于在可操作于计算存储环境中的重复删除系统中的空间预留功能的各种实施方式。在一种这样的实施方式中,仅仅是作为例子,计算的选配比(factoring ratio)是作为当前额定数据与物理数据的加权比基于至少一个存储容量阈值与当前被备份数据和复制数据之一物理消耗的已用存储空间来确定的。对计算存储环境中的最大额定估计空间加以计算。计算定义为计算存储环境中最大额定估计空间减去当前额定空间的剩余空间。如果剩余空间等于或者小于用户配置的用于备份操作的预留空间,那么数据复制操作就被接受并且存储在计算存储环境中。除了以上的示例性方法实施方式,还提供了其它的示例性系统和计算机产品实施方式并且这些实施方式都提供相关的优点。附图说明为了使本专利技术的优点更加容易理解,将参考在附图中例示的具体实施方式给出以上简单描述的本专利技术的更详细的描述。应当理解,这些附图绘出了本专利技术的实施方式,但不能因此就认为是对其范围的限制,本专利技术将通过附图的使用以附加的特性与细节进行描述和解释,附图中图I例示了其中可以实现本专利技术多方面的一种示例性计算环境;图2例示了示例性数据复制与备份配置; 图3例示了贯穿以下描述和所请求保护主题所使用的多个定义;图4例示了用于在重复删除系统中提供空间预留功能的示例性实施方式;图5例示了依照前面在图4中绘出的示例性方法的用于对计算选配比加以计算的示例性方法;图6例示了根据前面在图4中绘出的示例性方法的用于空间预留功能的处理流程的示例性方法 '及图7例示了在诸如图I所示的计算环境的计算环境中包括处理器设备的示例性计算设备。具体实施例方式现在转向图1,绘出了计算环境中数据存储系统(例如,虚拟带系统)的示例性体系结构10。体系结构10为本地主机18和20提供存储服务,并且把数据复制到远端数据存储系统,如图所示。与存储设备14通信的本地存储系统服务器12经包括例如光纤通道交换机16的部件的网络连接到本地主机18和20。例如,光纤通道交换机16能够执行用于带设备的命令(例如,小型计算机系统接口(SCSI)命令)。本领域技术人员将认识到,体系结构10可以包括多种存储部件。例如,存储设备14可以包括传统的硬盘驱动器(HDD)设备,或者可以包括固态驱动器(SSD)设备。本地存储系统服务器12经网络22连接到远端存储系统服务器24。远端服务器24与本地连接的盘存储设备26通信,并且经另一个网络和例如光纤通道交换机28的网络部件28与本地连接的主机30和32通信。网络22可以包括多种网络拓扑结构,例如广域网(WAN)、局域网(LAN)、存储区域网络(SAN)及其它配置。类似地,交换机16和28可以包括其它类型的网络设备。如前面所描述过的,体系结构10为本地主机提供本地存储服务,并且向远端数据存储系统提供复制数据(如利用箭头34由数据复制功能所指示的)。就象将要描述的,本专利技术的各种实施方式及所请求保护的主题可以在例如体系结构10的体系结构上实现。例如,在一种实施方式中,盘存储设备14可以是重复删除后的存储系统的一部分,存储重复删除后的数据实体。然后,重复删除后的数据实体可以经历数据复制处理34,由此重复删除后的数据实体被复制到远端盘存储设备26上。这些处理将在下面进一步具体描述。这种把以重复删除的形式驻留在重复删除存储系统中的数据实体复制到远端重复删除存储系统的处理在源系统与目的地系统上关于处理时间和存储要求都应当是有效的,而且应当有可能利用重复删除存储系统的特性来便于这种有效性。把多个系统复制到单个灾难恢复(DR)系统上例如对于具有数据存储要求的机构是常见的,其中数据存储要求例如服从某些数据安全保存法的那些要求,或者维持来自许多小到中型站点的、具有不同保留期的数据实体复制所需的那些要求。但是,如前面所指出的,当多个发送方配置成与一个接收方通信时,可能会出现潜在的问题。尽管一个或两个复制发送方可以容易地得到控制,而且接收方可以相应地计划其容量,但是,多个复制发送方在同时执行复制操作时有可能造成接收方站点的混乱。这个问题在接收方还配置为备份目标时会加剧。再次,如前面所提到的,然后出现哪个具有更高优先级的问题,是备份还是到来的复制?关于优先级的这个问题在传统的复制实现中总体上来说没有得到解决。相应地,利用任何传统的解决方案都对可用的存储空间带来了竞争状况的可能性。在这种情形下,复制和备份都将没有任何类型的优先级,而且它们将根据等于每个发送方(包括备份主机)能够产生的吞吐量的输入/输出(I/o)来消耗空间。转向图2,例示了示例性的多对一复制环境50。在这里,多个发送方52与配置成为来自备份主机58的备份目标的接收方54通信。接收方54还与存储器56 (如本领域技术人员将认识到的,在许多实现当中,存储器56可以包括一种或多种存储设备)通信。由于接收方必须提供到备份主机58的备份功能,但是还要方便到存储器56的数据复制,因此, 如果不执行对存储器56的存储容量的实施措施,那么环境50就在复制与备份之间促成了竞争状况,使得存储器56不能优先执行备份或者复制中的任何一种具体操作,从而一旦复制完全填满了存储器56的空间,由接收方54为备份主机56提供的备份操作将不能执行,而且将会失败。为了解决上述情形,所例示的实施方式提供了用于在重复删除系统中令备份优先于复制的机制,这种机制在运行复制与备份的同时动态地实施这种容量管理事务。每个系统可以具有其自己的、指定为具有本地所有关系的存储实体本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:T·Z·陶布,E·德罗布钦科,S·H·阿吉拉夫,O·勒内曼,A·卡罗,D·N·海普内尔,A·K·埃克什坦,
申请(专利权)人:国际商业机器公司,
类型:
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。