反向内容采集器制造技术

技术编号:3528947 阅读:256 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及搜集连网目录的信息。在一种实施方式中,公开了一种用于搜集分组交换网上的目录的信息的方法。在一种措施中,确定第一web站点的目录。将该目录第一次向第二web站点报告。在检测到第一web站点中的变化后,根据变化情况更新目录。将该目录第二次向第二web站点报告。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术一般涉及电子目录,尤其涉及搜集连网目录的信息。
技术介绍
在因特网上,要求提供电子目录,使得可以搜索信息。常规目录通过逐个链接地“浏览”(crawl)并将所遇到的信息编目(catalog)来搜索整个因特网。这些浏览软件机器人或“浏览器”不断地遍历因特网,企图保持目录信息是最新的。历经因特网一次可能耗费数个月时间。许多电子目录都有与其相关的浏览器,用来搜集遍布因特网的信息。当浏览器遇到信息时,信息被传回到电子目录,以便编目。这样,浏览器将消耗因特网中的很大带宽,要不然这些带宽可用于其他用途。电子目录中所编目的信息往往是陈旧的。通过点击目录所提供的链接,时常发现许多链接已被中断和/或编目中的信息不再能准确描述所访问web站点的状态。与变动通过浏览被揭示相比,因特网内容的变动更快。例如,一个描述每周电视节目的web页可能每周变更一次,而浏览器却只能以低得多的频率将其编目。中断的链接和陈旧的信息降低了因特网上电子目录的有效性。
技术实现思路
本专利技术涉及搜集连网目录的信息。在一种实施方式中,公开了一种用于搜集分组交换网上的目录的信息的方法。在一个步骤中,确定第一web站点的目录。将该目录第一次向第二web站点报告。在检测到第一web站点中的变化后,根据变化情况更新目录。将该目录第二次向第二web站点报告。参照说明书的其他部分以及附图和权利要求书,可以认识到本专利技术的其他特征和优点。下面,参照附图来详述本专利技术的进一步的特征和优点,以及本专利技术的各种实施方式的结构和操作。附图说明图1是内容分配系统的一种实施方式的框图;图2是内容分配系统的活动目录部分的一种实施方式的框图;图3A是内容分配系统的源服务器部分的一种实施方式的框图;图3B是内容分配系统的外部源服务器部分的一种实施方式的框图;图4A是内容分配系统的内容交换机部分的一种实施方式的框图;图4B是内容分配系统的内容交换机部分的另一种实施方式的框图;图4C是含有多个内容交换机服务器的内容交换机站点的一种实施方式的框图;图5是内容分配系统的客户计算机部分的一种实施方式的框图;图6是内容分配系统的一种实施方式的框图;图7A是用于为用户分配内容的过程的一种实施方式的流程图的第一部分;图7B是图7A的流程图的第二部分;图8是查看者对象代理的一种实施方式的框图;图9是查看者对象代理后台应用程序的流程图;图10是查看者对象代理请求业务的流程图;图11是用于跟踪源服务器与内容交换机之间的内容的方法的一种实施方式的流程图; 图12是用于将信息从内容管理器传送到服务器管理器的过程的一种实施方式的流程图;图13是用于由内容管理器向服务器管理器公布信息的过程的流程图的一种实施方式;图14是内容交换机的一种实施方式的框图,它示出了多个通过不同的端口连接的提供商;图15是内容交换机的另一种实施方式的框图,它示出了多个通过不同的地址连接的提供商;图16是提供商和内容交换机的分组的一种实施方式的分级表示;和图17是提供商和内容交换机的分组的另一种实施方式的分级表示。具体实施例方式本专利技术改善了电子目录的准确性,并可以更有效地搜集目录信息。源服务器按预定时间表或随着发生变化将其内容对象编目并向中央活动目录报告其内容对象。搜集和报告编目信息的任务从中央活动目录被卸载到系统中的所有源服务器。在这些图中,类似部分和/或特征具有相同的标号。此外,同一类型的不同部分可以用标号后面跟一个破折号和一个第二标号来区分,第二标号可以区分类似部分。如果在说明书中只用第一标号,那么,该描述适用于具有相同第一标号的任一类似部分,而与第二标号无关。参照图1,图中示出了内容分配系统100的一种实施方式的框图。在该实施方式中,内容分配系统100包括一个活动目录104,一个或多个源服务器108,一个或多个客户计算机112,一个或多个内容交换机116,一个或多个外部源服务器118,因特网120,和一个浏览目录124。特定客户计算机112与活动目录104交互,以选择所要下载的内容对象。如果对象是流式媒体,那么它可以在下载过程中被播放,或者在稍后被存储。内容对象可以是可从网络中下载的任何类型的信息,比如,音频、视频或数据。来自客户计算机112的对内容对象的请求与首选信息一同被转发到合适的源服务器108。源服务器108决定从何处下载该对象。为了提供足够的QOS,任一内容交换机116或者甚至是源服务器108本身都能提供该对象。活动目录104可以是面向选择内容对象的客户计算机112的界面。用于源服务器108的和可选地用于客户计算机112的软件都可以从活动目录104中下载,以便启动内容分配系统100。目录界面页或是搜索界面页可以用来确定所想要的内容对象。这些界面以活动方式保持,以免与源服务器108上内容对象的链接被中断。当内容交换机116需要来自源服务器108的内容对象时,活动目录104可以提供一条回到适当源服务器108的路径。其他实施方式可以具有多个活动目录。系统的用户可以在多个活动目录中划分,以便分配负载。此外,可以冗余地使用其他活动目录,使得,如果某个活动目录离线,那么其他活动目录可以吸收该负载。在某些实施方式中,源服务器108提供内容对象的源,将用户引向内容对象的优选源,并向活动目录104提供目录信息。源服务器108将内容对象介绍给系统100。介绍涉及源服务器管理者对要使其对活动目录104可用的内容对象的选择。管理者可以是管理源服务器108的人或系统。内容对象可以包括以前存储的信息或信息的流式馈入。根据预定的周期,源服务器108提供随着源服务器108上的内容变更而更新的所选择信息的编目。源服务器108确定要将客户计算机112引向的优选源,以便下载内容对象。在将客户计算机重新引向信息的优选源时,客户计算机112的首选表、内容交换机的负载以及内容对象的拷贝的位置都是源服务器108所要考虑的。这个源可以是源服务器108本身,或者是内容交换机116之一。用户引导客户计算机112寻找所想要的内容对象并随后下载该对象。利用从活动目录104中下载的查看者对象代理软件,客户计算机112确定能以足够的QOS传送内容的内容交换机116。确定具有足够的QOS的内容交换机116的过程包括,例如,接收来自那些在准备优选表时很可能产生最佳结果的内容交换机的测试信息。如果想要定制的方法,那么用户可以修改内容交换机116的优选表。当源服务器108在决定内容对象的源时,利用首选信息来提供足够的QOS。外部源服务器118可以是可供客户计算机112使用的内容对象的附加源。在一种实施方式中,外部源服务器118与内容交换机116连接。内容交换机116是内容对象的高速缓存器。许多这样的内容交换机116被分配到因特网120的不同地方,用以高速缓存内容对象。信息可以基于以下考虑被高速缓存,比如,基于用户对信息的需求,基于希望其内容便于用户使用的源服务器108的业务,或基于需要改善的QOS的用户的业务。内容交换机116的分组可以成群地或单独地为客户计算机112对内容对象的需求服务。当要从内容交换机116中请求内容对象的用户没有发现所请求的内容对象或所请求的内容对象的片段时,将内容交换机116的请求转向其他内容交换机来请求该内容对象。如果其他内容交换机116也没有该内本文档来自技高网...

【技术保护点】
一种用于搜集分组交换网上的目录的信息的方法,该方法包括:确定与第一web站点有关的目录;将该目录第一次向第二web站点报告;检测第一web站点中的变化;根据变化更新目录;和将该目录第二次向第二web站点报告。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:内森F拉希博斯基马克R汤普森
申请(专利权)人:奥罗卡斯特COM公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1