搜索调度方法及搜索服务器技术

技术编号:4288259 阅读:226 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种搜索调度方法,包括:接收搜索请求;获取本地注册的各个搜索引擎对所述搜索请求的区配度;获取在本搜索服务器虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息;根据所述搜索服务器的标识信息访问在本搜索服务器虚拟注册的搜索引擎所属搜索服务器,获取所述本搜索服务器虚拟注册的搜索引擎对所述搜索请求的区配度;根据所述本地注册的各个搜索引擎对该搜索请求的区配度及所述本搜索服务器虚拟注册的搜索引擎对所述搜索请求的区配度,确定至少一个用于根据所述搜索请求进行信息检索的搜索引擎。同时本发明专利技术还公开了一种搜索服务器,本发明专利技术实现了快速、高效的选择较优的搜索引擎,提高了的搜索引擎的调度效率。

【技术实现步骤摘要】

本专利技术涉及网络
,尤其涉及一种搜索调度方法及一种搜索服务器。
技术介绍
在当今网络世界中,搜索引.擎已经成为进行互联网信息检索必不可少的工具,现有的搜索引擎有传统的互联网巨头,如Google, Yahoo, Baidu,还有一些 专业的针对某一行业的垂直搜索引擎,如酷讯的火车票搜索,房老大房地产信 息搜索平台。还有移动领域的搜索引擎,如cgogo, UUCun, roboo等。还有一 些提供本地服务的搜索引擎,如电信的号码百事通。然而,网上信息极度膨胀 导致查找信息犹如大海捞针。虽然优秀搜索引擎提供了大量的信息资源并以优 先的算法做支撑来帮助用户寻找他希望用的信息,但目前单个搜索引擎也有它 的局限性。元搜索引擎(Metasearch Engine),是一种调用其它独立搜索引擎的引擎,亦 称"搜索引擎之母(The mother of searce engines)"。在这里,"元"(Meta)为"总 的"、"超越"之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制 和优化利用。相对元搜索引擎,可被利用的独立搜索引擎称为"源搜索引擎" (source Engine ),或"成员搜索引擎",整合、调用、控制和优化利用源搜索引 擎的技术,称为"元搜索技术"(Meta-searching technique),元4叟索技术是元搜 索引擎的核心。元搜索引擎可以通过元索引选择较优的搜索引擎。但不同搜索引擎一般有 不同的请求格式与返回结果格式,因此,传统元搜索引擎不能无限制的集成多 个成员搜索引擎的能力。在OpenSearch (开放搜索)规范中为各搜索引擎描述 其能力提供了一种标准,搜索引擎只要按照OpenSearch规范提供描述文件,其 它应用就能够很方便的通过其接口描述文件提供的公共接口与搜索引擎进行信 息交互。规范的推出方便了各搜索引擎能力之间的集成。但现有的元搜索引擎 要么元搜索引擎之间不能互相访问,或者选择搜索引擎的过程复杂。斯i旦3畐大学的Luis Gravano, Hkctor Garcia-Molina在i仑文《Generalizing GIOSS to Vector-Space Databases and Broker Hierarchies》中提到了基于元元索亏I 的搜索引擎调度方案,该技术方案的系统构架如图1所示,该系统包括多个元 搜索平台(图中示出两个),各元搜索平台基于元元搜索平台进行管理,元元搜 索平台为各搜索平台建立元元索引,各元搜索平台管理各自所管理的成员搜索引擎,为各成员搜索引擎建立元索引,图2为该现有:^支术的基于元元索引的搜索引擎调度方法,包括101,元搜索平台接收来自用户的搜索请求;102,元搜索平台把所接收到的搜索请求转发到元元搜索平台;103, 元元搜索平台根据元元索引计算出元搜索51擎对搜索请求的区配度, 并根据预先设定的阈值,选择区配度较好的元搜索平台,例如选择元搜索平台B 和元搜索平台C;104, 把搜索请求转发到步骤103所选择的元搜索平台B;105, 元搜索平台B接收到搜索请求后,根据元索引计算出成员搜索引擎的 区配度;106, 把搜索引擎标识及其区配度返回给元元搜索平台;107, 把搜索请求转发到步骤103所选择的元搜索平台C;108, 元搜索平台C接收到搜索请求后,根据元索引计算出成员搜索引擎的 区配度;109,把搜索引擎标识及其区配度返回给元元搜索平台;110, 元元搜索平台根据各元搜索平台返回的搜索引擎及其权重和预先设定 的阈值,计算出较好的成员搜索引擎;111, 元元搜索平台把较好的成员搜索引擎返回给元搜索平台。 专利技术人在实现本专利技术的过程中,发现在上述现有技术方案中,由于各元搜索平台之间通过元元搜索平台实现互相调用,元元搜索平台为各元搜索平台建 立元元索引的过程会导致信息损失,导致无法找到真正需要的成员搜索引擎, 元搜索平台接收到搜索请求后,需通过元元搜索平台,由元元搜索平台选择确 定成员搜索引擎,调度流程复杂,处理时延较长。9
技术实现思路
为了解决上述问题,本专利技术实施例提供一种搜索调度方法及一种搜索服务器,以提高搜索引擎的调度效率,筒化调度流程,提高处理效率。为了达到上述专利技术目的,本专利技术实施例提供了一种搜索调度方法,包括接收搜索请求;获取本地注册的各个搜索引擎对所述搜索请求的区配度;获取在本搜索服务器虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息;根据所述搜索服务器的标识信息访问对应的搜索服务器,获取所述本搜索服务器虚拟注册的搜索引擎对所述搜索请求的区配度;根据所述本地注册的各个搜索引擎对所述搜索请求的区配度及所述本搜索服务器虚拟注册的搜索引擎对所述搜索请求的区配度,确定至少一个用于根据所述搜索请求进行信息检索的搜索引擎。及一种搜索服务器,包括本地注册单元,用于接收搜索引擎的本地注册请求,对搜索引擎进行本地注册;虚拟注册单元,用于接收归属于其他搜索服务器的搜索引擎的虚拟注册请求,所述虚拟注册请求包含搜索引擎标识、地域信息、搜索类型及所属搜索服务器的标识信息,根据所述虚拟注册请求中的搜索引擎标识、地域信息、搜索类型及所属搜索服务器的标识信息对所述搜索服务器的搜索引擎进行虚拟注册;元索引单元,用于生成并管理所述本地注册单元所注册的搜索引擎的元索引;搜索调度单元,用于接收搜索请求,从所述元索引单元获取由所述本地注册单元所注册的各个搜索引擎对所述搜索请求的区配度,获取由所述虚拟注册单元虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息,根据所述搜索服务器的标识信息访问所述搜索服务器,获取由所述虚拟注册单元虚拟注册的搜索引擎对所述搜索请求的区配度,由所述本地注册单元所注册的各个搜索引擎对所述搜索请求的区配度及由所述虚拟注册单元虚拟注册的搜索引擎对所述搜索请求的区配度,确定至少一个用于根据所述搜索请求进行信息检索 的搜索引擎。本专利技术实施例还提供了另一种搜索调度方法,包括 接收搜索请求;从所述搜索请求中提取搜索条件,以所提取的搜索条件查询元索引数据库, 获取本地注册的各个搜索引擎对所述搜索请求的区配度;判断所述各个搜索引擎对所述搜索请求的区配度是否大于预设门限值,若 判断为是,则选择区配度大于预设门限值的搜索引擎用于根据所述搜索请求进 行信息检索。及另一种搜索服务器,包括接收单元,用于接收搜索请求;搜索条件提取单元,用于从所述搜索请求中提取搜索条件;区配度获取单元,用于根据所述搜索条件提取单元所提取的所述搜索条件 查询元索引数据库,获取本地注册的各个搜索引擎对所述搜索请求的区配度;搜索引擎选择单元,用于判断所述各个搜索引擎对所述搜索请求的区配度 是否大于预设门限值,若判断为是,则选择区配度大于预设门限值的搜索引擎 用于根据所述搜索请求进行信息检索。实施本专利技术实施例,通过对其他搜索服务器所管理的搜索引擎进行虚拟注 册,实现了在接收到搜索请求后,基于所述虚拟注册进行搜索服务器间的互相 访问,在各搜索服务器所管理的搜索引擎中选择较优的搜索引擎,提高了搜索 范围及搜索准确度,提高了调度效率,简化了调度流程。实施本专利技术另一实施例,在接收到搜索请求后,根据搜索请求中提取的搜 索条件查询并获取本地注册的各个搜索引擎对所述搜索请求的区配本文档来自技高网
...

【技术保护点】
一种搜索调度方法,其特征在于,包括:    接收搜索请求;    获取本地注册的各个搜索引擎对所述搜索请求的区配度;    获取在本搜索服务器虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息;    根据所述搜索服务器的标识信息访问对应的搜索服务器,获取所述本搜索服务器虚拟注册的搜索引擎对所述搜索请求的区配度;    根据所述本地注册的各个搜索引擎对所述搜索请求的区配度及所述本搜索服务器虚拟注册的搜索引擎对所述搜索请求的区配度,确定至少一个用于根据所述搜索请求进行信息检索的搜索引擎。

【技术特征摘要】

【专利技术属性】
技术研发人员:崔首领闵国兵顾翀董晓艺胡汉强李正兵
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1