用于提高去重复系统备份性能的客户端侧指纹缓存的过程和方法技术方案

技术编号:9622137 阅读:99 留言:0更新日期:2014-01-30 12:17
在此提供了一种用于在客户端高速缓存中缓存指纹的系统和方法。对包括一组数据段并描述备份处理的数据对象进行识别。此后,向去重复服务器发出引用该数据对象的请求,以请求将任务标识符添加至该数据对象。如果去重复服务器能够成功地向该数据对象添加任务标识符,那么在位于客户端系统内的高速缓存中将活动的标识符添加至该组数据段的每一个数据段。

Process and method for client side fingerprint caching for improving repetitive system backup performance

A system and method for caching fingerprints in a client cache is provided herein. Identifies a data object that includes a set of data segments and describes backup processing. Thereafter, a request to reference the data object is issued to the repeating server to request the task identifier to be added to the data object. If to repeat the server can successfully add a task identifier to the data object, then add each data segment to the set of data segments in the cache, the client identifier is located within the system of activities.

【技术实现步骤摘要】
【国外来华专利技术】用于提高去重复系统备份性能的客户端侧指纹缓存的方法和系统专利
本专利技术涉及去重复系统备份,并且更具体地涉及缓存指纹从而提高去重复备份性能。相关技术说明进行备份通常包括备份例如文件形式的数据流。这些文件可以分解为多个数据单元,例如数据段。在这些数据中常常存在一定程度的重复,所以当前的(备份)策略采用去重复技术。这些备份处理包括确定去重复服务器是否具有目前存储在备份中的数据段。另外,备份处理还可以包括确定去重复服务器是否将在备份处理的整个生命期中将这些数据段的每一个保存在存储器中。这些确定通常通过客户端和去重复服务器所发送和接收的查询或消息来进行。这些查询和消息例如通过任意网络传送,其中每个查询和/或消息转换为每个备份操作的附加时间和网络成本。因此,令人希望的是在备份处理中将客户端系统和去重复服务器之间交换的全部查询和消息的数量最小化,以便加快备份处理的速度、最小化网络成本、并减少服务器上的额外负载,同时确保在这两个系统之间不发生数据丢失。专利技术概述在此披露了各种用于在客户端处缓存指纹的系统和方法。例如,一种方法包括识别一个第一数据对象,该对象包括一组数据段。该第一数据对象用于描述一个备份处理。一旦识别,向一个去重复服务器做出请求以便请求将一个活动任务标识符添加到该第一数据对象。当做出时这种请求包括对该第一数据对象的引用。如果该去重复服务器能够成功地向该第一数据对象添加一个任务标识符,那么在位于一个客户端系统内的一个高速缓存中将一个活动标识符添加至该组数据段的每个数据段。在一个实施例中,将一个活动标识符添加至对应于该组数据段中每个数据段的一个引用列表。在另一个实施例中,响应于该客户端系统的查询,从该去重复服务器接收该第一数据对象。该查询是针对一个数据对象的查询,该数据对象包括针对该组数据段的一个指纹匹配。这种类型的查询在对该客户端系统进行一次初始完整备份之前执行。该方法还包括在将该活动标识符添加至该每个数据段之后对该客户端系统执行一次备份处理。在一个实施例中,确定该备份处理所引用的一个数据段是否需要发送至该去重复服务器。这种确定是通过确定针对该数据段的一个指纹是否位于该高速缓存中以及确定该高速缓存是否具有针对该数据段的一个活动标识符而做出。在另一个实施例中,当成功地完成该备份处理时,创建该备份处理的一个记录。该记录包括备份策略信息、该备份处理所引用的一个数据段列表、该数据对象的一个指纹以及一个备份类型指示器中的至少一个。在另一个实施例中,当成功地完成该备份处理时,接收描述该备份处理的一个数据对象,将针对该数据对象的一个指纹添加至对应于该数据对象中每个数据段的一个引用列表,并且从该数据对象移除一个任务标识符。一种系统的示例可以包括一个或多个处理器和连接至这些处理器的内存。该内存存储了可用于执行类似上述一种方法的程序指令。类似地,这些程序指令存储在一个计算机可读存储介质上。前述内容是一个概述,因此不可避免地包含细节的简化、概括以及省略;因而本领域技术人员将认识到概述仅仅是说明性的并且在任何情况下不用于限制。如权利要求所唯一定义的本专利技术的其他方面、专利技术特征和优点在以下提供的非限制性详细描述中将变得明显。附图简述通过参考附图,本专利技术可以得到更好的理解,并且其众多目标、特征以及优点对本领域的普通技术人员是明显的。图1的方框图根据本专利技术的一个实施例展示了缓存客户端上的指纹的一个系统。图2A根据本专利技术的一个实施例展示了支持指纹高速缓存的一个客户端系统的架构。图2B根据本专利技术的一个实施例展示了一个客户端系统所引用的示例性内存高速缓存。图3A根据本专利技术的一个实施例展示了一个去重复服务器的架构。图3B根据本专利技术的一个实施例展示了一个去重复服务器引用的示例性内存高速缓存。图4的流程图根据本专利技术的一个实施例展示了缓存一个客户端系统上的指纹的示例过程。图5A的流程图根据本专利技术的一个实施例展示了在客户端系统上预填入一个高速缓存的示例过程。图5B的流程图根据本专利技术的一个实施例展示了在客户端系统上预填入一个高速缓存的另一个示例过程。图6的流程图根据本专利技术的一个实施例展示了在对一个客户端系统进行备份之前执行高速缓存一致性检查的示例过程。图7的流程图根据本专利技术的一个实施例展示了利用一个客户端系统上的高速缓存进行备份的示例过程。图8是根据本专利技术的一个实施例的一种计算系统的方框图。图9是根据本专利技术的一个实施例的一种网络系统的方框图。尽管易于对本专利技术做出各种修改和替代,但在附图和详细说明中将本专利技术的具体实施例作为示例来提供。应当理解的是,附图和详细说明不用于将本专利技术限制于所披露的具体形式。相反,本专利技术应该涵盖落在所附权利要求定义的本专利技术的精神和范围之内的所有修改形式、等同形式以及替代形式。详细说明图1的方框图展示了一种用于在客户端处缓存指纹的系统。指纹是为给定的数据段而产生的值。通常,这种指纹值基本上需要对于每个数据段是唯一的,并因此将数据段彼此区别开。指纹的一个示例是散列值。例如,散列算法(例如消息摘要算法5(MD5)、安全散列算法1(SHA-1)和安全散列算法256(SHA-256)等)可用于产生这些值。图1展示了一种用于在客户端处缓存这些指纹的系统。如图所示,图1包括N个客户端110,示为客户端110(1)、客户端110(2)…客户端110(N),并且进一步描绘了网络120和去重复服务器130。客户端110总体上代表任意类型或形式的计算装置。客户端110的示例可以包括笔记本电脑、台式机、服务器和/或这些装置中的一个或多个的组合。客户端110可以采用完整或增量备份形式来发起备份处理。备份处理(不论是完整的还是增量的)可以由数据对象描述。数据对象对应于备份镜像,备份镜像包括在完整或增量备份处理中将要备份的数据段。在备份处理中,客户端110可以包括有待备份的一组数据内的重复数据。另外,如果多次备份一组数据,未发生变化的数据还产生了预先备份的数据的副本。为了防止从一个客户端或从多个客户端备份重复数据,备份系统可以实施去重复操作(例如,去除数据的重复副本的处理)以便在备份客户端系统的数据时保留存储空间。在这种情况中,去重复的备份数据可以存储在去重复服务器130中。去重复服务器130可以包括备份系统(备份很多不同客户端系统的数据)或是其一部分。网络120帮助客户端110和去重复服务器130之间出现的通信和数据传送。这种通信可以利用有线或无线连接来进行。网络120的示例可以包括广域网(WAN)、局域网(LAN)、存储区域网(SAN)、互联网、或这些网络的某种组合。在备份操作过程中客户端110和去重复服务器130之间交换的每次通信都转换为操作成本、管理成本和需要完成备份的总时间。因此,将执行备份操作所需要的这些往返通信的数量最小化是可取的。出现在客户端110之一与去重复服务器130之间的数据通信的数量可以通过使用一种预填入技术(在客户端系统上进行初始完整备份之前执行)得到最小化以便将指纹预先填入客户端的高速缓存,这些指纹对应于在去重复服务器130内存储的数据段并且在备份处理过程中具有数据保护。通过这样来做,客户端系统可以不需要向去重复服务器发送进一步的查询(目的是知道是否数据段目前存储在去重复服务器中以及是否该数据段在备份处理中受到保护以免无本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201280008047.html" title="用于提高去重复系统备份性能的客户端侧指纹缓存的过程和方法原文来自X技术">用于提高去重复系统备份性能的客户端侧指纹缓存的过程和方法</a>

【技术保护点】
一种方法,包括:识别一个数据对象,其中该数据对象包括一组数据段,并且该数据对象描述一个备份处理;通过向一个去重复服务器发送一条请求来请求将一个任务标识符添加到该数据对象,其中该请求包括对该数据对象的一个引用;并且如果该去重复服务器成功地向该数据对象添加一个任务标识符,那么在一个高速缓存中将一个活动标识符添加至该组数据段的每个数据段,其中该高速缓存位于一个客户端系统处。

【技术特征摘要】
【国外来华专利技术】2011.02.11 US 13/026,1881.一种缓存方法,包括:识别一个数据对象,其中该数据对象包括要在备份处理期间备份的一组数据段;向一个去重复服务器发送一条请求,其中该请求包括请求该去重复服务器将任务标识符添加到存储在该去重复服务器处的该数据对象的副本,该请求包括对该数据对象的一个引用,并且该任务标识符向该数据对象的该副本的添加保护该数据对象的该副本以及存储在该去重复服务器处的该组数据段的副本免于在该备份处理期间从该去重复服务器被删除;以及响应于确定该去重复服务器已经成功地向存储在该去重复服务器处的该数据对象的该副本添加该任务标识符,向存储在一个高速缓存中的该组数据段中的每个数据段添加活动标识符,其中该高速缓存位于一个客户端系统处,并且该活动标识符向该每个数据段的添加指示存储在该去重复服务器处的该每个数据段的对应副本在该备份处理期间将被保持在该去重复服务器处。2.如权利要求1所述的方法,进一步包括:接收该数据对象,其中该数据对象从该去重复服务器接收,以响应于来自该客户端系统的一个查询,该查询包括针对一个数据对象的查询,该数据对象包括针对该组数据段的一个指纹匹配,并且该查询在进行该客户端系统的一次初始完整备份之前执行。3.如权利要求1所述的方法,进一步包括:将一个活动标识符添加至对应于该组数据段中的该每个数据段的一个引用列表。4.如权利要求1所述的方法,进一步包括:在将该活动标识符添加至该每个数据段之后,对该客户端系统执行该备份处理。5.如权利要求4所述的方法,进一步包括:确定该备份处理所引用的另一个数据段是否需要发送至该去重复服务器,其中该确定包括:确定针对该另一个数据段的一个指纹是否位于该高速缓存中,以及确定该高速缓存是否具有针对该另一个数据段的一个活动标识符。6.一种缓存系统,包括:用于识别一个数据对象的装置,其中该数据对象包括要在备份处理期间备份的一组数据段;用于向一个去重复服务器发送一条请求的装置,其中该请求包括请求该去重复服务器将任务标识符添加到存储在该去重复服务器处的该数据对象的副本,该请求包括对该数据对象的一个引用,并且该任务标识符向该数据对象的该副本的添加保护该数据对象的该副本以及存储在该去重复服务器处的该组数据段的副本免于在该备份处理期间从该去重复服务器被删除;以及用于响应于确定该去重复服务器已经成功地向存储在该去重复服务器处的该数据对象的该副本添加该任务标识符,向存储在一个高速缓存中的该组数据段中的每个数据段添加活动标识符的装置,其中该高速缓存位于一个客户端系统处,并且该活动标识符向该每个数据段的添加指示存储在该去重复服务器处的该每个数据段的对应副本在该备份处理期间将被保持在该去重复服务器处。7.如权利要求6所述的系统,进一步包括:用于接收该数据...

【专利技术属性】
技术研发人员:张显伯托马斯·哈特奈特吴伟宝
申请(专利权)人:赛门铁克公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1