索引切换和索引控制的方法及装置制造方法及图纸

技术编号:12304399 阅读:36 留言:0更新日期:2015-11-11 13:36
本发明专利技术提供了一种索引控制方法,包括:从索引服务器接收其生成的索引,并将索引保存在临时中转区中;将临时中转区中的索引发送给索引数据库,并在索引数据库中记录与索引有关的信息;当索引服务器当前使用的索引损坏时,从索引服务器接收历史索引请求;基于用户选择,从索引数据库获取历史索引,并将历史索引保存在临时中转区中;以及向索引服务器发送历史索引,以便索引服务器将损坏的索引切换为历史索引。当索引内容损坏时,能够将已损坏的索引迅速切换为未损坏的历史索引;当索引内容完好时,可定期或不定期地生成并保存历史索引,以备当索引损坏时迅速提供可用备份。

【技术实现步骤摘要】

本专利技术涉及索引切换和索引控制的方法及装置
技术介绍
目前绝大数搜索引擎是通过对文档关键词,或者数据库字段内容建立索引来完成 快速索引网页内容的技术。由于文档或数据库内容的更新,索引的内容也会被更新。但是 在开发相关搜索算法的过程中,索引更新容易出现损坏,一旦索引内容出现损坏,重新建立 索引的耗时较长。为保证搜索引擎服务连续性,提高用户体验,需要对索引内容实时进行人 工干预。
技术实现思路
为克服以上现有技术的缺陷,本专利技术提出了一种索引切换方法,包括:如果当前索 引损坏,向控制服务器请求历史索引;从控制服务器接收历史索引;以及将当前索引切换 为历史索引。 本专利技术还提出了一种索引控制方法,包括:从索引服务器接收其生成的索引,并将 索引保存在临时中转区中;将临时中转区中的索引发送给索引数据库,并在索引数据库中 记录与索引有关的信息;当索引服务器当前使用的索引损坏时,从索引服务器接收历史索 引请求;基于用户选择,从索引数据库获取历史索引,并将历史索引保存在临时中转区中; 以及向索引服务器发送历史索引,以便索引服务器将损坏的索引切换为历史索引。 通过本专利技术提出的索引切换方法和索引控制方法,当索引内容损坏时,能够将已 损坏的索引迅速切换为未损坏的历史索引;并且,当索引内容完好时,可定期或不定期地生 成并保存历史索引,以备当索引损坏时迅速提供可用备份。基于以上,本专利技术保证搜索服务 的连续性,提高用户体验。 本专利技术还提出了索引切换装置和索引控制装置。【附图说明】 图1示出了能够实现本专利技术的搜索系统。 图2示出了根据本专利技术实施例的索引切换方法。 图3示出了根据本专利技术实施例的索引切换系统。 图4示出了根据本专利技术实施例的索引控制方法。 图5示出了根据本专利技术实施例的索引控制装置。【具体实施方式】 以下对本专利技术的示例性实施例做出说明,其中包括本专利技术实施例的各种细节以有 助于理解,应当将它们认为仅仅是示例性的。因此,本领域的技术人员应当认识到,可对本 文描述的实施例做出各种修改和改变,而不脱离本专利技术的范围和精神。 图1示出了能够实现本专利技术的分布式搜索系统100,包括Web服务器110、索引数 据库120、索引控制服务器130、索引服务器150-1至150-N、文档或数据170、以及操作者 180。其中索引控制服务器130还包括临时中转区140,下文将对其描述。一般来说,搜索引 擎中使用倒排索引。 索引数据库120存储作为备份的历史索引数据,及其版本号,创建时间等记录,并 且可以是单台数据库服务器,或者分布式存储服务器。 索引控制服务器130对本系统中的索引服务器存储内容进行中转,同时执行版本 控制,下发历史索引文件到索引服务器。 索引服务器150-1至150-N存储在全文搜索下某个单词在一个文档或者一组文档 中的存储位置的映射服务器,为搜索引擎使用。 图1的搜索系统可进行以下处理: ①操作者通过Web服务器110在索引数据库120中查询历史索引的版本号,创建 时间等信息,选择需要切换的索引版本。 ②操作者通过Web服务器110选择需要切换的索引版本,发送指令给索引控制服 务器130,请求切换索引服务器150-1至150-N存储内容的版本为指定版本号。 ③索引控制服务器130收到索引切换请求后,依据请求切换的版本号从索引数据 库120中获取对应的索引文件,保存在临时中转区140。 ④索引数据库120从索引控制服务器130的临时中转区140中,抽取最新的索引 文件保存,并记录版本号,创建时间,MD5校验值,最后删除临时中转区的文件。 ⑤索引控制服务器130将对应的版本的索引文件,逐个推送到索引服务器150。同 时设置"停止"标记位,禁止索引服务器150执行程序⑦。 ⑥索引控制服务器130定时随机从索引服务器150中获取最新的索引文件存储, 保存于临时中转区140。 ⑦普通索引建立程序。 在一个实施例中,操作者180可以在必要时,通过Web服务器110发送命令给索引 控制服务器130以恢复正常的索引生成程序。索引控制服务器130逐个对索引服务器撤销 "停止"标记位,恢复程序⑦,并开始生成最新的索引。 在一个实施例中,索引数据库需要一张表存储如下关键字段信息,具体如下: 索引版本号:记录历史索引的唯一序号。 索引创建时间:历史索引被创建后产生的时间戳。 MD5校验值:历史索引文件MD5校验值,可用于检验文件是否被破坏。 索引文件所在IP :当索引数据库120为分布式存储时使用。索引控制服务器130 可以向该IP地址请求传送历史索引文件。 索引文件所在目录:保存历史索引文件的位置。 结合图1,图2示出了根据本专利技术实施例的一种索引切换方法200。方法200适用 于在索引服务器150中执行,包括:步骤201,如果当前索引损坏,向索引控制服务器130请 求历史索引;步骤202,从索引控制服务器130接收历史索引;以及步骤203,将当前索引切 换为历史索引。 在一个实施例中,在步骤202从索引控制服务器130接收历史索引之前,还包括: 用户从索引数据库120中选择历史索引;索引控制服务器130从索引数据库120获取所选 择的历史索引,将其存储在临时中转区140,然后向索引服务器150发送历史索引。用户可 根据实际情况选择特定时间的历史索引,例如,一天前、一小时前、甚至几分钟前的历史索 引,等等。 此外,在向索引服务器150发送历史索引前,可对历史索引进行校验,确保所发送 的历史索引对索引服务器150而言可用。 在一个实施例中,在步骤203,从索引控制服务器130接收历史索引后,索引服务 器150设置"停止"标识位,以禁止其生成最新的索引。这是因为在当前索引已损坏的情形 中,继续生成的索引很可能也已损坏,因此,应当禁止继续生成新的索引,直至搜索系统修 复。 在一个实施例中,所述当前索引和历史索引都是倒排索引。 如图3所示,本专利技术还提出了一种索引切换装置300,包括请求模块301、接收模块 302和切换模块303。这些模块分别与上述步骤20U202和203相对应。也就是说,请求模 块301被配置为,如果当前索引损坏,向索引控制服务器130请求历史索引;接收模块302 被配置为,从索引控制服务器130接收历史索引;以及切换模块被配置为,将当前索引切换 为历史索引。 结合图1,图4示出了根据本专利技术实施例的一种索引控制方法400。方法400适用 于在索引控制服务器130中执行,包括:步骤401,从索引服务器150接收其生成的索引,并 将索引保存在临时中转区140中;步骤402,将临时中转区140中的索引发送给索引数据库 120,并在索引数据库120中记录与索引有关的信息;步骤403,判断当前索引是否损坏,如 未损坏,回到当前第1页1 2 本文档来自技高网...
索引切换和索引控制的方法及装置

【技术保护点】
一种索引切换方法,包括:如果当前索引损坏,向控制服务器请求历史索引;从控制服务器接收历史索引;以及将当前索引切换为历史索引。

【技术特征摘要】

【专利技术属性】
技术研发人员:谢蔚王曦晨王海龙
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1