在计算机网络中检索电子文档的复制件制造技术

技术编号:2920534 阅读:383 留言:0更新日期:2012-04-11 18:40
介绍了一种用于在计算机网络中检索或存放电子文档的复制件的方法。在已经选择了至少一个复制件号码之后,应用散列函数。该函数要求复制件号码和文档识别符作为输入。该函数返回至少一个实体识别符作为结果,每个实体识别符表示在网络中可能提供复制件的实体。在随后的步骤中,将与文档相关的请求寻址到所识别的实体中的至少一个实体。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体涉及在计算机网络中的复制件存取。更具体地说,本专利技术涉及在计算机网络中检索和/或存放电子文档的复制件。
技术介绍
对电子文档和数据的即时存取对于日常的商务操作变得越来越重要。结果是,对包括局部物理损坏之类的故障,还需要存储是可靠的和有弹性的。在计算机网络上的分布的、复制的存储好象是唯一的出路。但是,今天的分布的/复制的系统或者需要在所涉及的计算实体(通常是在不同位置的至少两个数据中心)之间完全、相同的复制,或者需要在分布存储的情况中,集中化的控制器持续地跟踪复制件分布。存取多于一个复制件的任何人需要或者知道复制件的完整列表或者需要具有对返回这种信息的目录服务的存取权,或者全局性地-对于所有文档-或者基于每个文档。由于现存的廉价机器能够用于服务内容,分布存储变得越来越重要。随着分布散列表(DHT)技术的出现,自组织(self-organizing)存储网络变得可行并且已经在业界引起了浓厚兴趣。这些可伸缩的、处在因特网的“顶上”的上层(overlay)网络使用下层(underlying)网络的传输能力,但是增加了价值。DHT技术提供从资源ID到主机(D-->H)的映射,而在其之前通常有从资源名称到资源ID(N-->D)的映射。这是通过使用在每个节点中的最小路由信息来实现的。通常还将DHT进行准备以处理在主机可用性和网络连接性中的变化。DHT具有各种路由偏好但却共享这样的特性,即在上层网络的构成节点之间基于逐个跳跃来传输消息。每个跳跃都知道如何更接近目的地,直到其最终到达宣称所请求的ID是其自己的那个节点并且根据请求进行动作为止。一些DHT基于间隔环拓扑进行操作,如在Ion Stoica等人所著的“ChordAScalable Peer-to-peer lookup Service for Internet Application”,Proceedings ofACM SIGCOMM 2001,2001年8月,149-160页中所述的,有一些将多维空间分割为可管理的组块(chunk),如Sylvia Ratnasamy等人所著的“A ScalableContent-Addressable Network”,Proceedings of ACM SIGCOMM,2001年9月所述的,或如Marcel Waldvogel和Roberto Rinaldi所著的“EfficientTopology-Aware Overlay Network”,ACM Computer Communication Review,2003年1月,卷33,第1号,101-106页所述,但是其他的实施无根树(rootlesstree),如Anthony Rowstron和Peter Druschel所著的“PastryScalable,distributedobject location and routing for large-scale peer-to-peer systems”,IFIP/ACMInternational Conference on Distributed Systems Platforms(Middleware),2001年11月,329-350页所述,或者如Ben Y.Zhao等人所著的“TapestryAnInfrastructure for Fault-tolerant Wide-area Location and Routing”,University ofCalifornia,Berkeley,UCB/CSD-01-1141,2001年4月所述。这些DHT系统中的许多个都能够利用下层网络的本地性(locality)。通常将本地性方面分离为地理布局类别和邻近转发(proximity forwarding)类别,这些类别根据Miguel Castro等人所著“Exploiting Network Proximity inDistributed Hash Tables”,International Workshop on Future Directions inDistributed Computing(FuDiCo),由Ozalp Babaoglu和Ken Birman和KeithMarzullo编辑,2002年6月,52-55页所述而改编而来。C.Greg Plaxton等人所著“Accessing Nearby Copies of Replicated Objectsin a Distributed Environment”,ACM Symposium on Parallel Algorithms andArchitectures”,1997年,311-320页示出了对于本地性模式的另一种方法。在由John Byers,Jeffrey Considine,Michael Mitzenmacher所著的、在2003年2月的International Peer-to-Peer Symposium(IPTPS)中的“Simple LoadBalancing for Distributed Hash Tables”中说明了负载均衡方面。在由John Kubiatowicz等人所著的“OceanStoreAn Architecture forGlobal-Scale Persistent Storage”,Proceedings of ACM ASPLOS,2000年11月中示出了链接DHT和高速缓存的一种方法。这里,当存在沿着该路径可发现文档高速缓存的概率较高时,由衰减的花朵过滤器(Attenuated Bloom Filter,ABF)来重定向沿着DHT而通过的查询。尽管连续的ABF更新通讯量,但是当产生需要时,除了错误正确(false positives)的概率之外,对于文档创始者没有方法来寻址所选择的复制件。由Magdalena Balazinska等人所著“INS/TwineA Scalable Peer-to-PeerArchitecture for Intentional Resource Discovery”,Pervasive 2002-InternationalConference on Pervasive Computing,2002年8月,示出了在DHT顶上的资源发现/目录服务的例子。US20020114341A1提出了对等企业存储,其使用集中化的控制器/协调器。申请人的US6,223,206公开一种方法和系统,用于通过将由第一流正在读取的文件的部分复制到第二设备上并且用能够存取的第二流来读取该部分来进行负载均衡。这种现有技术针对完全集中化的系统。US20030014523A1、US20030014433A1、和US20030014432A1,每个都介绍了一种存储网络数据复制器。存在公开的、关于如何从一个实例到另一个实例进行复制的算法。其描述了要选择哪一个现存的复制件作为用于进一步复制的资源。US6,467,046和EP 807 885 B1两者都示出了一种系统和方法,用于在计算机系统中自动地分发复制的数据库的拷贝。列举用于确定复制件替换的主机和盘以提高可靠性本文档来自技高网...

【技术保护点】
一种在计算机网络中用于检索电子文档的复制件的方法,包括:选择至少一个复制件号码,通过应用给定函数,该函数要求复制件号码和文档识别符作为输入:确定至少一个实体识别符,每个实体识别符表示在网络中可能提供复制件的实体,将与 文档相关的请求寻址到至少一个被识别的实体。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:丹尼尔M鲍尔保罗T赫尔利马塞尔沃尔德沃格尔
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1