当前位置: 首页 > 专利查询>微软公司专利>正文

灾难数据中心中的爬行新鲜度制造技术

技术编号:9698661 阅读:147 留言:0更新日期:2014-02-21 12:09
用于服务的存储在次要位置处的内容在被投入运行之前先被爬行以帮助维持最新的搜索索引。在该次要位置处被爬行的内容包括从该服务的主要位置获得的内容。当该次要位置处的爬行器(crawler)尝试访问该主要位置处存储的内容时,该爬行器被定向以访问存储在该次要位置处存储的该内容的相应副本而不是访问该主要位置处的内容。可在不同时间在该次要位置处爬行该内容,诸如在该信息被更新时、根据时间表等等。

【技术实现步骤摘要】
【国外来华专利技术】灾难数据中心中的爬行新鲜度背景基于web的应用和在线服务包括位于web服务器上的文件以及存储在数据库中的数据。该服务可使用捜索索引来提高对捜索查询做出响应的速度和性能。当捜索索引老旧时,捜索查询可能不返回目前在该服务中的所有信息。概述提供本概述是为了以简化的形式介绍将在以下详细描述中进一步描述的选择的概念。本概述不g在标识出所要求保护的主题的关键特征或必要特征,也不g在用于帮助确定所要求保护的主题的范围。存储在服务的次要位置处的内容在被投入运行之前先被爬行(crawl)以帮助维护最新的捜索索引。该次要位置可担当该服务的主要位置的灾难数据中心。当灾难发生吋,次要位置代替主要位置来处置对该服务的请求。在该次要位置处被爬行的内容包括从该服务的主要位置获得的内容。例如,存储在该次要位置处的内容可包括存储在该主要位置处的内容的备份/镜像。当该次要位置处的爬行器(crawler)尝试访问存储在该主要位置处的内容时,该爬行器被定向以访问存储在该次要位置处的该内容的相应副本而不是访问该主要位置处的内容。可在不同时间在该次要位置处爬行该内容,诸如在该信息被更新时、根据时间表等等。当该服务的主要位置处发生灾难而流量被路由到该次要位置时,用户可执行捜索并接收来自在该次要位置处创建的捜索索引的捜索結果。附图简述图1示出示例性计算环境;图2示出用于在在线服务的次要位置处维护捜索索引的系统;图3示出用于在服务的次要位置处创建并更新捜索索引的过程;以及图4示出在爬行次要位置的内容期间把对主要位置处的内容的请求定向到次要位置。详细描述现将參考其中相同的标号代表相同的元件的附图来描述各实施例。具体地,图1和相应的讨论g在提供对在其中可实现各实施例的合适计算环境的简要、概括描述。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。也可使用其他计算机系统配置,包括手持式设备、多处理器系统、基于微处理器或可编程消费电子产品、小型计算机、大型计算机等等。还可使用在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境。在分布式计算环境中,程序模块可位于本地和远程存储器存储设备两者中。现在參考图1,将描述在各个实施例中所利用的计算机100的说明性计算机环境。图1所示的计算机环境包括计算设备,这些计算设备各自可以被配置为移动计算设备(例如,电话、平板计算机、上网本、膝上型计算机)、服务器、台式计算机,或者某一其他类型的计算设备,并且包括中央处理单元5 (“CPU”)、包括随机存取存储器9 (“RAM”)和只读存储器(“ROM”)10的系统存储器7,以及将存储器耦合至中央处理单元(“CPU”)5的系统总线12。在R0M10中存储基本输入/输出系统,该系统包含有助于诸如在启动期间在计算机内的各元件之间传输信息的基本例程。计算机100还包括大容量存储设备14,该大容量存储设备14用于存储操作系统16、应用24、web浏览器25以及搜索管理器26,这将在下面予以更详细的描述。大容量存储设备14通过连接至总线12的大容量存储控制器(未示出)连接至CPU5。大容量存储设备14及其相关联的计算机可读介质为计算机100提供非易失性存储。虽然本文中包含的对计算机可读介质的描述涉及诸如硬盘或CD-ROM驱动器等大容量存储设备,但是计算机可读介质可以是能够由计算机100访问的任何可用介质。作为示例而非限制,计算机可读介质可包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据之类的信息的任何方法或技术来实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括,但不限于,RAM、ROM、可擦除可编程只读存储器(“EPROM”)、电可擦可编程只读存储器(“EEPR0M”)、闪存或其他固态存储器技术、⑶-ROM、数字多功能盘(“DVD”)或其他光存储、磁带盒、磁带、磁盘存储或其他磁性存储设备,或能用于存储所需信息且可以由计算机100访问的任何其他介质。计算机100在使用通过诸如因特网之类的网络18与远程计算机的逻辑连接的联网环境中操作。计算机100可以通过 连接至总线12的网络接ロ単元20来连接到网络18。网络连接可以是无线的和/或有线的。网络接ロ単元20也可用于连接到其他类型的网络和远程计算机系统。计算机100还可以包括用于接收和处理来自多个其他设备的输入的输入/输出控制器22,这些设备包括键盘、鼠标或者电子指示笔(未在图1中示出)。类似地,输入/输出控制器22可以为显示屏23、打印机或其他类型的输出设备提供输入/输出。如前简述的那样,多个程序模块和数据文件可以被存储在计算机100的大容量存储设备14和RAM9内,包括适于控制计算机的操作的操作系统16,如华盛顿州雷蒙德市的微软公司的WINDOWS 7?、WINDOWS SERVERS成WINDOWS PHONE 7?操作系统。大容量存储设备14和RAM9还可以存储ー个或多个程序模块。具体而言,大容量存储设备14和RAM9可以存储包括一个或多个应用24和web浏览器25的一个或多个应用程序。根据ー实施例,应用24是被配置成与在线服务交互的应用,所述在线服务诸如为不同承租人提供服务的解决方案服务的商业点。也可以使用其他应用。例如,应用24可以是被配置成与数据交互的客户端应用。应用可以被配置成与许多不同类型的数据交互,包括但不限于:文档、电子表格、幻灯片、笔记等。网络存储27被配置为存储数据,诸如用于服务(诸如在线服务17)的承租人的承租人数据。网络存储27是ー个或多个计算设备/用户可通过IP网络18来访问的。例如,网络存储27可以为诸如在线服务17等在线服务存储用于ー个或多个承租人的承租人数据。其他网络存储也可以被配置成存储用于承租人的数据。承租人数据也可以从ー个网络存储移至另ー个网络存储。如示出的,在线服务包括主要位置17和次要位置17’。根据ー实施例,次要位置17’是主要在线服务17的镜像,并担当在灾难影响该在线服务的主要位置的可访问性的情况下的灾难数据中心。一般而言,次要位置17’提供由主要在线服务17提供的服务和数据的副本。在正常操作期间,对在线服务的请求被定向至主要位置17。在主要位置起作用期间,主要网络中发生的内容改变和动作被镜像映射在次要位置中。以此方式,主要位置和次要位置保持以相同方式被配置并包括基本相同的内容。在线服务17的主要位置和次要位置17’各维护ー捜索索引,该搜索索引是由与相应服务中的每ー个服务相关联的爬行器爬行的。捜索管理器26被配置为维护在线服务的捜索索引。捜索管理器26可以是诸如在线服务17和在线服务17’等的在线服务的一部分,并且搜索管理器26所提供的全部/ 一些功能可以位于应用内部/外部。一般而言,捜索管理器26被配置为执行与对在线服务(诸如在线服务17’)的一位置的捜索服务有关的操作。在该次要位置处被爬行的内容包括从该服务的主要位置获得的内容。例如,存储在该次要位置处的内容可包括存储在该主要位置处的内容的备份。当该次要位置处的爬行器尝试访问存储在该主要位置处的内容时(例如,正被爬行的URL指向该主要位置),捜索管理器26定向该爬行器以访问存储在该次要位置处的本文档来自技高网...

【技术保护点】
一种用于在次要位置处创建并维护搜索索引的方法,所述次要位置担当服务的主要位置的灾难数据中心,所述方法包括:从所述服务的所述主要位置获得内容,所述内容反映对所述主要位置所做的改变;在所述服务的所述次要位置处存储所述内容;以及爬行存储在所述服务的所述次要位置处的所述内容,以便在所述服务的所述主要位置处发生灾难以前在所述次要位置处创建搜索索引。

【技术特征摘要】
【国外来华专利技术】2011.06.06 US 13/154,2831.一种用于在次要位置处创建并维护捜索索引的方法,所述次要位置担当服务的主要位置的灾难数据中心,所述方法包括: 从所述服务的所述主要位置获得内容,所述内容反映对所述主要位置所做的改变; 在所述服务的所述次要位置处存储所述内容;以及 爬行存储在所述服务的所述次要位置处的所述内容,以便在所述服务的所述主要位置处发生灾难以前在所述次要位置处创建捜索索引。2.如权利要求1所述的方法,其特征在于,爬行存储在所述次要位置处的所述内容包括确定何时从所述主要位置请求内容并且把所述请求定向以从所述次要位置而不是所述主要位置获得所述内容。3.如权利要求2所述的方法,其特征在于,把所述请求定向到所述次要位置而不是所述主要位置包括以下至少ー项JEDNS (域名系统)条目从主要网络地址更改为所述次要位置的次要网络地址;访问所述次要位置处的文件,所述文件把所述次要位置处的爬行器机器定向到所述次要位置处的一位置;以及在向所述次要位置以外的DNS做出请求之前进行。4.如权利要求1所述的方法,其特征在于,从所述服务的所述主要位置处获得所述内容包括从所述主要位置获得内容的备份并且验证从所述主要位置获得的内容的完整性。5.如权利要求1所述的方法,其特征在于,还包括接收自备份的时刻以来在所述主要位置处所做的改变的更新。6.如权利要求1所述的方法,其特征在于,所述服务的所述次要位置基本上是所述在线服务的所述主要位置的镜像,所述镜像包括所述主要位置的内容的副本并且在所述主要位置处发生灾难之前和之后仍能访问。7.一种存储用于在次要位置处创建并维护捜索索引的计算机可执行指令的计算机可读存储介质,所述次要位置担当服务的主要位置的灾难数据中心,所述指令包括: ...

【专利技术属性】
技术研发人员:S·R·沙哈A·特鲁帕提V·塔拉诺弗D·布拉德
申请(专利权)人:微软公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1