当前位置: 首页 > 专利查询>董方专利>正文

基于点对点网络的互联网搜索系统和方法技术方案

技术编号:4082974 阅读:268 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种基于点对点网络的互联网搜索系统和方法,该搜索系统和方法是通过在每个搜索节点处设置搜索终端,使各个节点间形成点对点网络。利用点对点网络中消息的发布与回传机制将该搜索请求逐级发送给其他搜索节点。每个搜索节点各自响应该搜索请求,基于各搜索节点本地所存储的索引库进行检索,并将各搜索节点的检索结果最终汇集于原始搜索节点处,由原始搜索节点对这些检索结果进行聚合排序。这样的搜索系统结构和搜索方法完全打破了现有搜索系统的体系结构,给出了一种全新的搜索系统体系架构。彻底解决了现有技术中搜索引擎服务器的工作压力问题。

【技术实现步骤摘要】

本专利技术涉及互联网搜索系统及其搜索方法,特别是一种基于点对点网络实现互联 网搜索服务的搜索系统及其方法,使得搜索系统的数据存储和运算分散到各个用户节点, 降低搜索引擎的建造和维护成本,属于互联网搜索技术

技术介绍
互联网搜索技术是互联网应用中的一项重要技术。人们通过互联网搜索引擎在数 据庞大的互联网中搜索自己所关心的数据内容。现有的互联网搜索技术一般是由搜索服务提供商建立一组搜索引擎服务器。该搜 索引擎服务器在互联网上抓取各个网页的信息,并按照一定数据结构组织保存各网页可供 检索数据(如地址、标题、内容、锚文本等)的索引信息,从而建立庞大的索引库。用户在进 行搜索时,一般是向该搜索引擎服务器发出搜索关键词,搜索引擎服务器根据该输入关键 词在所建立的索引库中进行检索,并将检索结果按照一定规则排序,发送给搜索请求用户。但是,这种既有的互联网搜索技术存在以下几点问题首先,搜索引擎服务器数据中心集中构建的大型分布式存储和计算系统的开支巨 大,维护和运营开支巨大,需要大量的能源和网络带宽。其次,数据中心的存储系统容量的扩大速度、计算能力的提高的速度,无法赶上互 联网内容增加的速度。造成被索引网页的数量占所有网页的数量的比例下降。不利于搜索 结果相关性的提高。再有,这种搜索技术难于提高和调整搜索结果的相关性的排序。人工干预排序的工作量巨大。鉴于以上现有技术中所存在的问题,本专利技术提供了一种基于点对点网络实现互联 网搜索服务的搜索系统及其方法。
技术实现思路
本专利技术的主要目的在于解决现有技术中存在的问题,提供一种基于点对点网络实 现互联网搜索服务的搜索系统及其方法,使得搜索系统的数据存储和运算分散到各个用户 节点,降低搜索引擎的建造和维护成本。本专利技术的目的是通过下述技术方案予以实现的基于点对点网络的互联网搜索系统,其特征在于该搜索系统由若干对等的搜索 节点构成;各个搜索节点通过互联网连接成点对点网络;在所述每个搜索节点中设置有一 个搜索终端;该搜索终端包括有网络接口、搜索控制器、搜索存储空间、检索模块和聚合排序 模块;该网络接口与搜索控制器相连,搜索终端通过该网络接口与互联网相连接;该搜索存储空间包括有索引库和点对点链接库;所述索引库用以存储网页的索引信息;所述点对点链接库用以存储该搜索节点与相邻搜索节点间的链接信息;所述点对点 链接库与搜索控制器直接相连;所述索引库通过所述检索模块与搜索控制器相连接;该检索模块受搜索控制器控制,用以实现根据用户搜索请求的关键词在索引库中 进行检索,并将检索结果发送至聚合排序模块;该聚合排序模块分别与搜索控制器、检索模块相连接,用以对检索模块发送来的 检索结果进行聚合排序。基于点对点网络的互联网搜索方法,基于前述的互联网搜索系统实现,其特征在 于具体包括如下步骤(1)用户由原始搜索节点发起搜索请求;(2)该原始搜索节点响应搜索请求,由该节点的搜索控制器控制检索模块在索引 库中进行检索;(3)该原始搜索节点的搜索控制器调用本地点对点链接库中的链接信息,将所述 搜索请求转发给与该原始搜索节点相连接的搜索节点;(4)接收到所述搜索请求的搜索节点响应搜索请求,判断本搜索节点是否满足 结束转发条件;如果不满足结束转发条件,则认定本搜索节点为中间搜索节点,执行步骤 (5);如果满足结束转发条件,则认定本搜索节点为最终搜索节点,执行步骤(7);(5)该中间搜索节点的搜索控制器调用本地点对点链接库中的链接信息,将所述 搜索请求转发给与该中间搜索节点相连接的搜索节点;(6)该中间搜索节点响应搜索请求,由该搜索节点的搜索控制器控制检索模块在 索引库中进行检索,并将检索结果以及其下级搜索节点回传的检索结果一并回传给其上级 搜索节点,并返回步骤⑷;(7)该最终搜索节点响应搜索请求,由该节点的搜索控制器控制检索模块在索引 库中进行检索,并将检索结果回传给其上级搜索节点;(8)该原始搜索节点的搜索控制器控制聚合排序模块对其他搜索节点回传的检 索结果与在本地索引库中检索的结果进行聚合排序,并将聚合排序后的检索结果发送给用 户,完成检索过程。本专利技术的有益效果是该是通过在每个 搜索节点处设置搜索终端,使各个节点间形成点对点网络。利用点对点网络中消息的发布 与回传机制将该搜索请求逐级发送给其他搜索节点。每个搜索节点各自响应该搜索请求, 基于各搜索节点本地所存储的索引库进行检索,并将各搜索节点的检索结果最终汇集于原 始搜索节点处,由原始搜索节点对这些检索结果进行聚合排序。这样的搜索系统结构和搜 索方法完全打破了现有搜索系统的体系结构,给出了一种全新的搜索系统体系架构。彻底 解决了现有技术中搜索引擎服务器的工作压力问题。附图说明图1为基于点对点网络的互联网搜索系统第一实施例的结构示意图;图2为基于点对点网络的互联网搜索系统第二实施例的结构示意图;图3为基于点对点网络的互联网搜索系统第三实施例的结构示意图;图4为基于点对点网络的互联网搜索系统第四、五、六实施例的结构示意图5为基于点对点网络的互联网搜索方法第七实施例的流程图;图6为基于点对点网络的互联网搜索方法第八实施例的流程图。具体实施例方式下面结合附图和实施例对本专利技术作进一步描述。实施例1 图1为基于点对点网络的互联网搜索系统第一实施例的结构示意图,也是本专利技术 搜索系统的基本结构图。该互联网搜索系统由若干对等的搜索节点构成。各个搜索节点通 过互联网连接成点对点网络。在所述每个搜索节点中设置有一个搜索终端。如图所示,该搜索终端至少包括有网络接口、搜索控制器、搜索存储空间、检索模 块和聚合排序模块。该网络接口与搜索控制器相连,搜索终端通过该网络接口与互联网相连接。该搜索控制器为搜索终端的核心控制设备,用以控制终端中各个功能模块的工作。该搜索存储空间为搜索终端的存储设备,其中至少包括有索引库和点对点链接 库。所述索引库用以存储网页的索引信息,以供搜索终端进行检索。所述点对点链接库用 以存储该搜索节点与相邻搜索节点间的链接信息。所述点对点链接库与搜索控制器直接相 连,通过搜索控制器调用所述链接信息实现节点间的通讯链接。所述索引库通过所述检索 模块与搜索控制器相连接。该检索模块受搜索控制器控制,用以实现根据用户搜索请求的关键词在索引库中 进行检索,并将检索结果发送至聚合排序模块。该聚合排序模块分别与搜索控制器、检索模块相连接,用以对检索模块发送来的 检索结果进行聚合排序,并将聚合排序后的检索结果发送给搜索控制器。如上所述,在该基于点对点网络的互联网搜索系统中的每个搜索节点均设置有一 个上述结构的搜索终端。当其中一个搜索节点发起搜索请求时,该节点的搜索控制器一方 面通过本地的检索模块对本地索引库进行检索,另一方面通过调用点对点链接库中所存储 的链接信息将该搜索请求发送至与该搜索节点相邻的其他搜索节点处。其他搜索节点响应 该搜索请求,继续按照上述过程一方面完成本地检索,一方面继续向下一级节点转发该搜 索请求。如此往复,经过有限级转发搜索请求,最终将各搜索节点的检索结果汇集于最初发 起搜索请求的节点,并经过聚合排序向发起用户反馈最终的检索结果,从而完成整个搜索 过程。可见,本专利技术所设计的基于点对点网络的互联网搜索系统相较于现有搜索系统有 着本质的区别。本搜索系统不需要本文档来自技高网...

【技术保护点】
基于点对点网络的互联网搜索系统,其特征在于:该搜索系统由若干对等的搜索节点构成;各个搜索节点通过互联网连接成点对点网络;在所述每个搜索节点中设置有一个搜索终端;该搜索终端包括有:网络接口、搜索控制器、搜索存储空间、检索模块和聚合排序模块;该网络接口与搜索控制器相连,搜索终端通过该网络接口与互联网相连接;该搜索存储空间包括有索引库和点对点链接库;所述索引库用以存储网页的索引信息;所述点对点链接库用以存储该搜索节点与相邻搜索节点间的链接信息;所述点对点链接库与搜索控制器直接相连;所述索引库通过所述检索模块与搜索控制器相连接;该检索模块受搜索控制器控制,用以实现根据用户搜索请求的关键词在索引库中进行检索,并将检索结果发送至聚合排序模块;该聚合排序模块分别与搜索控制器、检索模块相连接,用以对检索模块发送来的检索结果进行聚合排序。

【技术特征摘要】
基于点对点网络的互联网搜索系统,其特征在于该搜索系统由若干对等的搜索节点构成;各个搜索节点通过互联网连接成点对点网络;在所述每个搜索节点中设置有一个搜索终端;该搜索终端包括有网络接口、搜索控制器、搜索存储空间、检索模块和聚合排序模块;该网络接口与搜索控制器相连,搜索终端通过该网络接口与互联网相连接;该搜索存储空间包括有索引库和点对点链接库;所述索引库用以存储网页的索引信息;所述点对点链接库用以存储该搜索节点与相邻搜索节点间的链接信息;所述点对点链接库与搜索控制器直接相连;所述索引库通过所述检索模块与搜索控制器相连接;该检索模块受搜索控制器控制,用以实现根据用户搜索请求的关键词在索引库中进行检索,并将检索结果发送至聚合排序模块;该聚合排序模块分别与搜索控制器、检索模块相连接,用以对检索模块发送来的检索结果进行聚合排序。2.如权利要求1所述的互联网搜索系统,其特征在于在所述搜索终端中还设置有网 页缓冲区和索引模块;该网页缓冲区与所述网络接口相连,用以将用户所浏览的网页相关数据存储于网页缓 冲区内;该索引模块分别与网页缓冲区、索引库相连;该索引模块受搜索控制器控制,用以从网 页缓冲区中提取网页的索引信息,并将该索引信息发送至所述索引库。3.如权利要求1所述的互联网搜索系统,其特征在于在所述点对点网络中还设置有 至少一个网络服务器;该网络服务器包括有网络接口、服务器控制器、搜索节点链接库; 该搜索节点链接库中存储有若干搜索节点的链接信息;该服务器控制器一方面与搜索节点 链接库相连,另一方面通过网络接口与互联网相连接。4.如权利要求1所述的互联网搜索系统,其特征在于在所述搜索存储空间中还设置 有检索结果库;该检索结果库用以存储通过本搜索节点所进行搜索的检索结果。5.如权利要求1所述的互联网搜索系统,其特征在于在所述搜索存储空间中还设置 有反馈信息库;该反馈信息库用以存储用户对已完成的检索结果的反馈信息。6.如权利要求1所述的互联网搜索系统,其特征在于在所述搜索存储空间中还设置 有用户使用频率库;该用户使用频率库用以存储用户浏览网页的频率信息。7.基于点对点网络的互联网搜索方法,基于权利要求1所述的互联网搜索系统实现, 其特征在于具体包括如下步骤(1)用户由原始搜索节点发起搜索请求;(2)该原始搜索节点响应搜索请求,由该节点的搜索控制器控制检索模块在索引库中 进行检索;(3)该原始搜索节点的搜索控制器调用本地点对点链接库中的链接信息,将所述搜索 请求转发给与该原始搜索节点相连接的搜索节点;(4)接收到所述搜索请求的搜索节点响应搜索请求,判断本搜索节点是否满足结束转 发条件;如果不满足结束转发条件,则认定本搜索节点为中间搜索节点,执行步骤(5);如 果满足结束转发条件,则认定本搜索节点为最终搜索节点,执行步骤(7);(5)该中间搜索节点的搜索控制器调用本地点对点链接库中的链接信息,将所述搜索 请求转发给与该中间搜索节点相连接的搜索节点;(6)该中间搜索节点响应搜索请求,由该搜索节点的搜索控制器控制检索模块在索引 库中进行检索,并将检索结果以及其下级搜索节点回传的检索结果一并回传给其上级搜索 节点,并返回步骤(4);(7)该最终搜索节点响应搜索请求,由该节点的搜索控制器控制检索模块在索引库中 进行检索,并将检索结果回传给其上级搜索节点;(8)该原始搜索节点的搜索控制器控制聚合排序模块对其他搜索节点回传的检索结果 与在本地索引库中检索的结果进行聚合排序,并将聚合排序后的检索结果发送给用户,完 成检索过程。8.如权利要求7所述的互联网搜索方法,基于权利要求2所述的互联网搜索系统实现, 其特征在于所述步骤(2)、(6)、(7)中各搜索节点的索引库通过如下步骤进行更新(al)用户所浏览的网页相关数据存储于该缓冲区内;(a2)该搜索节点的搜索控制器控制索引模块从该网页缓冲区提取网页相关数据,并从 中提取该网页的索引信息;(a3)搜索控制器将该索引信息存储于索引库。9.如权利要求7所述的互联网搜索方法,其特征在于所述步骤(6)包括如下具体步骤(61a)该中间搜索节点响应搜索请求,由该节点的搜索控制器控制检索模块在索引库 中进行检索,并保存检索结果;(61b)当该中间搜索节点收到...

【专利技术属性】
技术研发人员:董方
申请(专利权)人:董方
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1