用于更新计算机文件的备份文件的方法和系统技术方案

技术编号:2878361 阅读:204 留言:0更新日期:2012-04-11 18:40
一种用于更新计算机文件档案以反映文件修改的方法和系统,包括:选择多个比较方法的其中之一作为优选比较方法。这些比较方法包括:第一比较方法,其中,将文件与该文件的档案进行比较;以及第二比较方法,其中,对统计上代表文件的第一特征符号集合进行计算,并且将其与统计上代表文件档案的第二特征符号集合进行比较。该方法进一步包括:执行优选比较方法,生成文件与该文件档案间的差别标记,用于更新文件档案。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术一般涉及文件归档领域,特别涉及一种用于更新计算机文件档案的方法和系统。
技术介绍
文件归档系统对计算机文件进行备份,以防数据丢失。当文件随着时间发生修改时,比较器区别新版本和归档文件版本,以更新归档版本。已知的比较器包括修订控制引擎和“异或”(XOR)处理。在文件归档系统中使用的传统比较器和区别系统具有如下缺点它们是过程或存储器密集型的,并且是不灵活的。结果,它们不适用于某些系统、应用和/或条件。
技术实现思路
本专利技术提供一种用于更新计算机文件档案的改进方法和系统,以大大减少或者消除现有系统和方法的问题和缺点。具体地,根据用户和/或系统输入、条件或标准,选择多个比较器的其中之一,以优化数据存储、数据传输或其它档案资源。一种用于更新计算机文件档案以反映文件修改的方法和系统,包括选择多个比较方法的其中之一作为优选的比较方法。这些比较方法包括第一比较方法,其中,将文件与文件档案进行比较;以及第二比较方法,其中,对统计上代表文件的第一特征符号(token)集合进行计算,并且将其与统计上代表文件档案的第二特征符号集合进行比较。该方法进一步包括执行优选比较方法,生成用于更新文件档案的文件与文件档案间的差别标记。本专利技术的另一方面涉及一种用于文件归档的方法和系统,该方法和系统包括,根据至少一个条件选择一种用于对第一文件和相关第二文件进行比较的所选比较方法。从第一比较方法和第二比较方法中选择该所选比较。第一比较方法包括,将相关于第一文件的至少一个字节与相关于第二文件的至少一个字节进行比较。第二比较方法包括,将相关于第一文件的第一统计集合与相关于第二文件的第二统计集合进行比较。该方法还包括,根据第一文件、第二文件和所选比较方法生成至少一个差别标记,并且根据该标记更新第一文件。该方法还包括,根据差别标记提供用于更新第一文件的标记。通过下面附图、描述以及权利要求,本领域的技术人员将很容易明白本专利技术的技术优点。附图说明通过下面结合附图的详细描述,本专利技术将会得到最好的理解,其中图1是示出根据本专利技术一个实施例的分布式文件归档系统的图;图2是示出根据本专利技术一个实施例的用于控制备份处理的用户界面的屏幕图;图3是示出根据本专利技术一个实施例的图1的客户计算机和服务器计算机的细节的方框图;图4是示出根据本专利技术一个实施例的用于图3的客户计算机的归档系统的方框图;图5是示出根据本专利技术一个实施例的用于更新文件档案的示例性方法的流程图;图6-9是示出根据本专利技术一个实施例的用于更新计算机文件档案的方法的流程图;以及图10是示出根据本专利技术一个实施例的用于确定将要使用的区别方法的方法的流程图。具体实施例方式图1示出客户计算机100,它通过因特网或其它网络连接200与服务器计算机300相连,以更新服务器计算机300上的文件档案。客户和服务器计算机100和300可以是任何适当类型的传统计算机,例如,便携式计算机、个人计算机(personal computer,PC)、桌面PC、手持PC等,或为特定目的而特别配置的计算机。例如,在一个实施例中,客户计算机100可以是从旅馆房间通过电话线路与服务器计算机300相连的便携式计算机。在另一个实施例中,客户计算机100可以是特别配置的,集成到医疗诊断装置中,并且通过因特网与中央服务器计算机200相连,以对有价值的信息进行归档。当记录通过诊断处理或一系列处理在特定客户计算机100上发生修改时,通过使用本专利技术,这些记录的档案能够在中央服务器计算机上得以更新。需要理解的是,根据本专利技术不同方面的用于文件归档的系统和方法可以通过硬件和软件的任何其它适当组合来实现。如下更为详细的描述,根据本专利技术不同方面的用于文件归档的系统和方法,包括更新服务器计算机300上的文件档案,以反映在客户计算机100上所作的文件修改。在这种系统中,使用从两个或多个可用比较方法中选择的比较方法,将一个或多个更新文件与该文件的归档版本进行比较。使用这些方法中第一方法的比较器将更新文件与保存在客户计算机100上的文件副本进行比较,提供文件与文件档案间不同的一个或多个数据字或字节的标记。使用这些方法中第二方法的比较器将更新文件划分或者分割成多个块或段,计算每块的特征符号以生成统计上代表更新文件的特征符号集合,并且将这些特征符号与统计上代表文件档案的另一特征符号集合进行比较。当使用第二方法时,比较器提供包含文件与其档案间不同的数据字的一个或多个块的标记。也可以采用其它适当的比较方法。通过提供多个可用比较方法,该系统允许选择一种适用于给定条件集合的比较方法。图2示出客户计算机100上的一个用户界面,用于提示用户通过选择一个或多个文件归档中的优化条件来指定可用比较方法的其中之一。该比较方法能够手工或自动地通过任何适当的技术进行选择。参照图2,例如,计算机100显示标题为“备份设置编辑器”的对话框110,以提示用户输入。对话框110包括两个主要部分,“备份方法”部分120和“服务器修订”部分140。“备份方法”部分120包括两个如无线电(radio)按钮的项目选择器。第一选择器112标记为“最小化本地存储”,并且第二选择器114标记为“最小化传输时间”。第一和第二选择器112和114允许用户选择两个条件的其中之一,这些条件用于在客户计算机100上对一个或多个文件进行归档处理中的优化。第一条件是高效地使用客户计算机100上的数据存储器。第二条件是高效地将标记从容户计算机100传输到服务器计算机300。用户能够通过单击选择器112选择第一优化条件,并且通过单击选择器114选择第二优化条件。用户选择要求用户在总体上决定对于特定归档操作将要使用什么比较类型或哪个区别引擎。自动选择以逐文件的方式动态地确定每个文件的最佳区别引擎。这种系统在备份的时候能够根据一组条件或标准为文件确定最佳区别引擎,以进行优化。这种优化提高产品的整体性能,因为正在备份的每个文件是通过那个文件的最佳区别引擎进行处理的。单独地或者以使用任何适当数学模型的各种组合的方式进行评价的标准的例子,包括客户在备份时可用的网络带宽、网络连接的可靠性(这可以通过重复分组(packet)传输请求来进行测量)、正在备份文件的大小、正在备份文件的类型、客户计算机上的可用硬盘存储空间量、客户计算机上硬盘的工作效率(例如,磁盘的碎片程度和/或CPU-磁盘接口的新旧快慢程度)、以及网络连接的费用(例如,用户是否通过昂贵的卫星网络进行连接)。为了获得这些标准,例如,可以向客户计算机100的操作系统进行查询,以确定可用网络200的带宽。如果特定操作系统不支持这种查询,分层设备驱动程序可以实现用来从调制解调器或网络接口卡获取该信息。如果带宽确定为低于阀值,自动选择系统能够挑选一种最小化要在网络上进行发送的标记的区别引擎。如果要进行备份的文件大小相对于客户机100上的可用磁盘存储太大,自动选择系统能够挑选一种需要客户机100上最小本地磁盘存储量的区别引擎。自动选择系统能够根据文件类型挑选适当的区别引擎。一个这样的例子是由MICROSOFT OUTLOOK生成的.pst文件。这些文件很大,并且经常改变,因此不能通过字节或块区别引擎进行高效的处理。在可以获得更高效地处理这种文件类型的区别引擎的变化中,该系统能够分配所述引擎来处本文档来自技高网...

【技术保护点】
一种用于更新文件档案以反映文件修改的方法,该方法包括:选择多个比较方法的其中之一作为优选比较方法,该多个比较方法包括:第一比较方法,其中,将文件与该文件的档案进行比较;和第二比较方法,其中,对统计上代表文件的第一特征符号集合进行 计算,并且将其与统计上代表该文件的档案的第二特征符号集合进行比较;以及执行优选比较方法,生成文件与该文件档案间的差别标记,用于更新该文件的档案。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:卡尔J福斯特亚历山大D西格斯
申请(专利权)人:电脑联合想象公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1