当前位置: 首页 > 专利查询>陈洪专利>正文

一种基于客户端实时聚合的元搜索引擎系统技术方案

技术编号:7236515 阅读:210 留言:0更新日期:2012-04-11 18:40
本发明专利技术公布了一种基于客户端实时聚合的元搜索引擎系统,包括客户端软件和服务器端系统两部分,其特点在于,将元搜索引擎服务器上运行的聚合搜索任务转移到客户端软件上完成,从而减少对搜索服务器的压力,减少对搜索服务器数量和网络带宽的需求,节约成本。本发明专利技术的客户端软件的形式和编程语言不受限制,可以是:浏览器的插件、ActiveX控件、Applet,脚本或者存于独立的可执行软件中,它直接将用户的搜索请求发送到第三方源搜索引擎系统实时检索数据,并将返回的结果在客户端进行聚合处理:包括缓存、去重、排序,最后将聚合后的结果展现给用户。服务器端主要完成对客户端软件的参数设置、下载、版本更新。

【技术实现步骤摘要】

本专利技术涉及互联网搜索引擎技术,具体设计一种基于客户端实时聚合的元搜索引擎系统
技术介绍
观察百度和谷歌搜索引擎返回的搜索结果,会发现前200条搜索结果中,大概有 40%左右的链接是相同的,各自还有60%左右的数据没有进入对方前200的排名。也就是说,如果使用百度搜索引擎,只查看前200条的话,看不到大约120条左右谷歌认为应进入前200名的搜索结果。如果两个搜索引擎都看的话,又有80条左右的数据重复看了,这样既浪费了用户的时间,而且使用起来需要在两个搜索引擎之间切换,不太方便。元搜索引擎系统可以将多个搜索引擎的结果进行整合去重,可有效解决上述问题。目前的元搜索引擎系统都是将聚合搜索任务放在服务器端完成,客户端只是通过浏览器发送请求和显示搜索结果。通常有两种方式,一是用户通过浏览器将请求发送给元搜索引擎服务器,服务器实时将请求转发到多个第三方源搜索引擎系统进行搜索,并将它们返回的搜索结果在元搜索引擎服务器上进行汇集、筛选、删并等优化处理后,再返回给客户端的浏览器显示。这种方式的弊端是当大量客户端同时访问的话,如果服务器端的处理能力不够,客户端的响应速度会变得很慢。另一种方式就是元搜索引擎服务器端事先整合好第三方源搜索引擎系统的数据,当收到客户端的请求时,直接从整合的数据中检索出结果,返回给客户端。这种方式仍然需要消耗大量服务器和硬盘资源,同时很难和第三方源搜索引擎系统的数据同步。基于上述原因,虽然现在国内外有不少元搜索引擎系统,要么响应速度慢,要么返回的结果太少,满足不了用户的需要。
技术实现思路
本专利技术设计了一种基于客户端实时聚合的元搜索引擎系统,其核心模块主要由客户端软件和服务器端系统两部分组成,和传统元搜索引擎系统的最大不同是,客户端软件直接将用户请求发送到第三方源搜索引擎系统进行搜索,并将它们返回的搜索结果在客户端上进行去重整合,最后将整合后的结果呈现给用户。服务器端仅需完成对客户端软件的参数设置、下载和版本更新。附图说明图1为传统元搜索引擎系统的结构示意图,图中数字含义如下1 客户端接收用户输入的关键词,向元搜索引擎服务器发送搜索请求2 元搜索引擎服务器将搜索请求转发给多个第三方源搜索引擎系统3 第三方源搜索引擎系统返回搜索结果4 元搜索引擎服务器把结果去重整合后返回给客户端图2为基于客户端实时聚合的元搜索引擎系统的结构示意图,图中数字含义如下1 客户端访问元搜索引擎服务器2 元搜索引擎服务器返回搜索页面3:客户端客户端接收用户输入的关键词,直接将搜索请求转发给多个第三方源搜索引擎系统4 第三方源搜索引擎系统返回搜索结果,客户端去重整合引显示图3为基于客户端实时聚合的元搜索引擎系统的实现示意图。具体实施例方式本专利技术中的服务器端是个网站,当用户访问网站时,返回搜索页面给客户端,这点和通常的搜索引擎网站一样。搜索页面界面很简单,主要是提供一个文本框给用户输入搜索关键词和一个搜索提交按钮。搜索页面加载时,会检测客户端软件是否已安装,是否有新版本,如果没有安装或有新版本,就从服务器下载最新的客户端软件,进行安装或升级。本专利技术的客户端软件的形式和编程语言不受限制,可以是浏览器的插件、 ActiveX控件、Applet,脚本或者存于独立的可执行软件中。虽然他们的表现形式可以不同, 但实现的基本功能都和附图3描述的一样。如果客户端软件是独立的可执行软件,则启动方式不是访问网站,而是直接运行即可。服务器端通过设置参数告诉客户端从哪些第三方源搜索引擎系统获取搜索数据, 实现的方式有两种一是直接将这些参数做成隐含字段附在搜索页面,或者做成多选按钮让用户选择;二是客户端发新请求,服务器返回参数。服务器端通过后台管理软件设置这些参数。客户端软件在接收用户输入的搜索词后,采用多线程方式直接将搜索请求发给多个第三方源搜索引擎系统,进行并行搜索。客户端软件接收第三方源搜索引擎系统返回的结果,去除重复部分,保存到缓冲区中。客户端软件采用分页的方式,把缓冲区中的搜索结果呈现给用户。客户端软件进一步可以预先多获取一些搜索数据放到缓冲区中,以提高用户搜索速度。比如用户正在看第1页内容的同时,客户端软件在后台可下载第2页甚至更多的内容到缓冲区,等用户看第2页时,搜索结果马上就可从缓冲区获得。客户端软件是独自完成自己的搜索任务,互相之间没有影响。基于客户端实时聚合的元搜索引擎系统,能和传统的全文搜索引擎系统相结合, 组合成一个混合搜索引擎系统。搜索时的数据来源包括本身的全文搜索引擎系统、其它第三方搜索引擎系统,在客户端将结果聚合后呈现给用户。本专利技术的核心思想是将传统搜索引擎系统服务器端的搜索任务转移到客户端完成,从而可大大减少服务器的数量和网络带宽的需求,降低成本。一般大型搜索引擎网站的服务器数量是成千上万台,使用本专利技术的方案,服务器的数量可减少到几十甚至几台,因为原来服务器承担的主要搜索任务改由更多的客户端的计算机承担了,服务器主要提供搜索入口界面和客户端软件的下载更新。而且通过预取缓存技术,用户的搜索体验速度还要更快。权利要求1.一种基于客户端实时聚合的元搜索引擎系统,其特征在于包括客户端软件直接将用户的搜索请求发送到第三方源搜索引擎系统实时检索数据,并将返回的结果在客户端进行去重、排序、显示;服务器端完成对客户端软件的参数设置、下载、版本更新;第三方源搜索引擎系统用于提供原始搜索数据,是客户端软件整合的数据来源。2.根据权利要求1所述的基于客户端实时聚合的元搜索引擎系统,其特征是客户端软件以多线程方式访问第三方源搜索引擎系统,来提高搜索速度。3.根据权利要求1所述的基于客户端实时聚合的元搜索引擎系统,其特征是客户端软件根据搜索关键词预先取得搜索结果保存到缓存区中,当请求显示这些数据时,可立即从缓存区取得数据进行显示。4.根据权利要求1所述的基于客户端实时聚合的元搜索引擎系统,其特征是客户端软件的形式和编程语言不受限制,可以是浏览器的插件、ActiveX控件、Applet,脚本或者存于独立的可执行软件中。5.基于客户端实时聚合的元搜索引擎系统,其特征是能检测客户端软件是否安装,是否需要升级。6.基于客户端实时聚合的元搜索引擎系统,其特征是能和传统的全文搜索引擎系统相结合,组合成一个混合搜索引擎系统。搜索时的数据来源包括本身的全文搜索引擎系统、其它第三方搜索引擎系统,在客户端将结果聚合后呈现给用户。全文摘要本专利技术公布了一种基于客户端实时聚合的元搜索引擎系统,包括客户端软件和服务器端系统两部分,其特点在于,将元搜索引擎服务器上运行的聚合搜索任务转移到客户端软件上完成,从而减少对搜索服务器的压力,减少对搜索服务器数量和网络带宽的需求,节约成本。本专利技术的客户端软件的形式和编程语言不受限制,可以是浏览器的插件、ActiveX控件、Applet,脚本或者存于独立的可执行软件中,它直接将用户的搜索请求发送到第三方源搜索引擎系统实时检索数据,并将返回的结果在客户端进行聚合处理包括缓存、去重、排序,最后将聚合后的结果展现给用户。服务器端主要完成对客户端软件的参数设置、下载、版本更新。文档编号G06F17/30GK102393858SQ201110370069公开日2012年3月28日 申请日期2011年11月21日 优先权日2011年本文档来自技高网...

【技术保护点】

【技术特征摘要】
...

【专利技术属性】
技术研发人员:陈洪
申请(专利权)人:陈洪
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术