【技术实现步骤摘要】
基于压缩比历史的数据复制
本申请一般性地涉及改进的数据处理装置和方法,并且更具体地涉及用于基于压缩比历史执行高效数据复制的机制。
技术介绍
数据复制是在许多存储产品中实施以避免因程序错误、人为失误、或灾难事件引起的数据丢失的常用机制。通常,这样的数据复制定期地进行,诸如一天一次。在这种情况下,为了风险分散的目的,在生产场所处的源系统和在数据复制场所处的目标系统通常在物理上互相远离。源系统中的数据通过一个或多个计算机或数据通信网络被传送至目标系统,数据通信网络诸如广域网(WAN)(例如,互联网)和局域网(LAN)。在这种通过计算机或数据通信网络的复制中,通常还使用数据压缩来减小通过网络传送的数据的大小。这是因为,在许多情况下,网络代表整个复制过程的瓶颈,并且因此尽可能使通过网络的数据传送的量最小化并由此提高复制过程被执行的速度是有益的。具有压缩的数据复制机制的一个示例是“rsync”数据复制工具,其提供压缩选项来压缩通过网络传送的数据。rsync数据复制工具使用“zlib”,一种用于数据压缩的Linux库。从纽约阿蒙克的国际商用机器(IBM)公司可获得的IBMSONAS和IBMStorwizeV7000Unified使用rsync数据复制工具作为数据传送引擎以用于其数据复制功能。
技术实现思路
在一个说明性实施例中,提供了一种在第一数据处理系统中用于执行数据复制操作以将数据从第一数据处理系统复制到第二数据处理系统的方法。该方法包括:由第一数据处理系统存储与将被复制到第二数据处理系统的数据相关联的压缩比历史。压缩比历史存储用于至少一个之前执行的数据复制操作的至少一 ...
【技术保护点】
一种在第一数据处理系统中用于执行数据复制操作以将数据从所述第一数据处理系统复制到第二数据处理系统的方法,所述方法包括:由所述第一数据处理系统存储与将被复制到所述第二数据处理系统的数据相关联的压缩比历史,其中所述压缩比历史存储用于至少一个之前执行的数据复制操作的至少一个压缩比;由所述第一数据处理系统基于所述压缩比历史中的所述至少一个压缩比来确定数据压缩操作是否应当被应用到用于当前数据复制操作的数据;响应于确定数据压缩应当被应用到所述数据,由所述数据处理系统对所述数据执行所述数据压缩操作并且执行所述当前数据复制操作以将压缩的数据复制到所述第二数据处理系统;以及响应于确定数据压缩不应当被应用到所述数据,由所述数据处理系统执行所述当前数据复制操作以没有压缩地将所述数据复制到所述第二数据处理系统。
【技术特征摘要】
2015.12.07 US 14/960,5571.一种在第一数据处理系统中用于执行数据复制操作以将数据从所述第一数据处理系统复制到第二数据处理系统的方法,所述方法包括:由所述第一数据处理系统存储与将被复制到所述第二数据处理系统的数据相关联的压缩比历史,其中所述压缩比历史存储用于至少一个之前执行的数据复制操作的至少一个压缩比;由所述第一数据处理系统基于所述压缩比历史中的所述至少一个压缩比来确定数据压缩操作是否应当被应用到用于当前数据复制操作的数据;响应于确定数据压缩应当被应用到所述数据,由所述数据处理系统对所述数据执行所述数据压缩操作并且执行所述当前数据复制操作以将压缩的数据复制到所述第二数据处理系统;以及响应于确定数据压缩不应当被应用到所述数据,由所述数据处理系统执行所述当前数据复制操作以没有压缩地将所述数据复制到所述第二数据处理系统。2.根据权利要求1所述的方法,进一步包括响应于确定数据压缩应当被应用到所述数据:计算用于所述数据压缩操作的当前压缩比;以及基于所述当前压缩比来更新压缩比历史数据结构。3.根据权利要求1所述的方法,其中所述压缩比历史仅存储针对最为近期地在之前执行的数据复制操作的用于所述数据的最为近期的压缩比。4.根据权利要求1所述的方法,其中所述压缩比历史存储基于对所述数据的多个之前执行的数据压缩操作所生成的用于所述数据的多个压缩比,所述多个之前执行的数据压缩操作是多个之前执行的数据复制操作的一部分。5.根据权利要求1所述的方法,其中所述数据为文件并且其中所述压缩比历史被存储为所述文件的扩展属性。6.根据权利要求5所述的方法,其中所述文件的所述扩展属性包括多个整数值,每个整数值与之前执行的数据复制操作相关联并且表示用于所述之前执行的数据复制操作的压缩比。7.根据权利要求1所述的方法,其中确定所述数据压缩操作是否应当被应用到用于所述当前数据复制操作的所述数据包括:将所述至少一个压缩比与门限值相比较,并且其中响应于所述至少一个压缩比与所述门限值具有预定关系而确定所述数据压缩操作应当被应用。8.根据权利要求1所述的方法,其中确定所述数据压缩操作是否应当被应用到用于所述当前数据复制操作的所述数据包括:基于所述至少一个压缩比来计算值;将所述值与门限值相比较;以及响应于所述值与所述门限值具有预定关系而确定所述数据压缩操作应当被应用到用于所述当前数据复制操作的所述数据。9.根据权利要求1所述的方法,进一步包括:与所述数据相关联地存储压缩比检查参数,所述压缩比检查参数指定用于所述数据的压缩比将被检查的日期和/或时间;以及响应于所述压缩比检查参数指示在当前日期和/或当前时间之前的日期和/或时间,确定所述数据压缩操作应当被应用到用于所述当前数据复制操作的所述数据。10.根据权利要求9所述的方法,其中所述压缩比检查参数基于函数被计算,所述函数响应于所述至少一个压缩比中的压缩比之间的差异相对恒定而生成与目前日期或时间相比的较大时间差异,并且其中所述函数响应于所述至少一个压缩比中的压缩比之间的差异相对不同而生成与所述目前日期或时间相比的较小时间差异。11.一种包括计算机可读存储介质的计算机程序产品,所述计算机可读存储介质具有存储在其中的计算机可读程序,其中所述计算机可读程序当在计算设备上被执行时使得所述计算设备:存储与将被复制到数据处理系统的数据相关联的压缩比历史,其中所述压缩比历史存储用于至少一个之前执行的数据复制操作的至少一个压缩比;基...
【专利技术属性】
技术研发人员:荒木博志,S·M·R·伊斯拉姆,三好浩之,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。