一种搜索服务器及搜索方法技术

技术编号:8366790 阅读:190 留言:0更新日期:2013-02-28 05:22
本发明专利技术公开了一种搜索服务器,该服务器包括下载可靠度存储器和搜索后处理器,可靠度存储器适于存储一个或者多个网页的下载可靠度信息,至少包括网页的URL和该网页的下载可靠度;搜索后处理器根据该搜索结果列表的每个搜索结果项中网页的URL从下载可靠度存储器获取相应网页的下载可靠度信息,根据网页的排序得分和下载可靠度生成网页的新排序得分,并以新排序得分更新搜索结果列表中的相应搜索结果项中的排序得分以重新排序生成新搜索结果列表。本发明专利技术还公开了一种相应的搜索方法。

【技术实现步骤摘要】

本专利技术涉及网络搜索领域,尤其涉及一种考虑到网络内容的下载可靠度的搜索服务器及相应的搜索方法。
技术介绍
随着互联网的高速发展,各种企业、组织和个人等逐步了解到在互联网上提供信息服务的重要性而纷纷建立各自的网站来发布相应信息。随着在网络上提供网络信息服务的网站日益增多,互联网用户很难记住所有的这些网站甚至是想访问的网站的具体地址。与此同时,互联网所容纳的信息也在呈爆炸式增长,发展到今天,互联网上的各种内容,可谓是浩如烟海。在这种情况下,如何让互联网用户在最短的时间内找到并下载到自己想要的内容,譬如程序、音乐、视频、文件……成为了当务之急。于是,有别于开始的发布各种消息的网站,一类专事搜索的网站、服务器应运而生。而基于互联网的搜索网站以及衍生出的 各种搜索方式,也极大的推动了互联网的发展。目前,互联网用户在很大程度上都依赖于搜索网站来查询这些自己需要的可供下载的内容。一般而言,搜索网站利用搜索引擎来从互联网中提取各个网站的信息(以网页文字为主),建立起数据库。当用户在搜索网站上进行查询时,搜索引擎能检索与用户查询条件相匹配的记录。按照搜索结果与查询条件相匹配的程度,给出搜索结果中每条相应记录的排名得分score,按照排名得分score的高低来排序并返回给用户。然而,现在的搜索引擎并没有考虑搜索返回的可下载内容是否真正可以下载,而且即使这些内容可以下载,也没有向用户给出下载这些内容的网络速度和可靠性的任何启示。也就是说,利用现有的网络搜索引擎进行搜索后用户所看到的搜索结果列表,仅仅是按照搜索结果中每条相应记录的得分来排序,并不能确定上述列表中所给出的链接,哪些是可下载的,哪些是下载速度很快的……也很难选择应该从哪个链接来下载是最可靠的和快速的。因此需要一种新的搜索服务器和方法,在搜索结果中重点考虑用户所要下载内容的可靠性和下载速度等。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的搜索服务器和相应的搜索方法。根据本专利技术的一个方面,提供了一种搜索服务器,该搜索服务器包括信息存储器、搜索处理器、下载可靠度存储器和搜索后处理器。信息存储器,适于存储从接入互联网的各网站中收集的网页信息,其中网页信息至少包括网页的内容及其URL。搜索处理器,适于接收从用户终端提交的搜索关键词,从信息存储器中检索内容包括搜索关键词的各个网页,并生成包括一个或者多个搜索结果项的搜索结果列表,其中每个搜索结果项包括相应网页的URL及其排序得分R_SCOre。下载可靠度存储器,适于存储一个或者多个网页的下载可靠度信息,每个网页的下载可靠度信息至少包括网页的URL和网页的下载可靠度DR_SCOre。搜索后处理器,适于从搜索处理器获取搜索结果列表,根据搜索结果列表的每个搜索结果项中网页的URL从下载可靠度存储器获取相应网页的下载可靠度信息,根据网页的排序得分R_score和下载可靠度DR_score生成网页的新排序得分NR_score,并以新排序得分NR_score更新搜索结果列表中的相应搜索结果项中的排序得分R_score以重新排序生成新搜索结果列表。可选地,在根据本专利技术的搜索服务器中,网页的下载可靠度信息包括网页的URL和网页在不同地理区域对应的下载可靠度DR_SCOre ;并且搜索后处理器还适于从搜索处理器获取用户终端IP地址,根据网页的URL和用户终端IP地址从下载可靠度存储器获取与该用户终端IP地址相对应的地理区域的下载可靠度DR_SCOre。可选地,在根据本专利技术的搜索服务器中,根据下述来计算新排序得分 NR_score=DR_score*x+R_score* (1-χ),其中X是下载可靠度权重,在0-1之间,优选为O. 7。可选地,在根据本专利技术的搜索服务器中,其中当所获取的下载可靠度DR_SCOre小于一特定值时,所述搜索后处理器自动从搜索结果列表中删除与所述下载可靠度DR_SCOre对应的网页的搜索结果项。可选地,在根据本专利技术的搜索服务器中,新搜索结果列表的搜索结果项还包括相应网页的下载可靠度DR_score。可选地,在根据本专利技术的搜索服务器中,如果当搜索后处理器未能从下载可靠度存储器获得相应网页的下载可靠度DR_SCOre信息,则搜索后处理器不计算所述网页的新排序得分NR_score且不更新搜索结果列表中的相应搜索结果项中的排序得分R_score。可选地,根据本专利技术的搜索服务器还包括结果处理器,其适于从搜索后处理器获取新搜索结果列表,生成搜索结果并呈现给用户终端;可选地,呈现给用户终端的搜索结果包括相应网页的下载可靠度。根据本专利技术的另一个方面,还提供一种相应的搜索方法,在包括信息存储器和下载可靠度存储器的搜索服务器中运行,信息存储器适于存储从接入互联网的各网站中收集的网页信息,网页信息至少包括网页的内容及其URL,下载可靠度存储器适于存储一个或者多个网页的下载可靠度信息,每个网页的下载可靠度信息至少包括网页的URL和网页的下载可靠度DR_score。该搜索方法包括如下步骤接收从用户终端提交的搜索关键词;从信息存储器中检索内容中含有搜索关键词的各个网页,并生成包括一个或者多个搜索结果项的搜索结果列表,每个搜索结果项包括相应网页的URL及其排序得分R_score ;根据搜索结果列表的每个搜索结果项中网页的URL从下载可靠度存储器获取相应网页的下载可靠度信息,并根据网页的排序得分R_score和下载可靠度DR_score生成网页的新排序得分NR_score,并以新排序得分NR_score来更新搜索结果列表中的相应搜索结果项中的排序得分R_score以重新排序生成新搜索结果列表。根据本专利技术的搜索服务器和搜索方法,为用户搜索并显示了表征相应网页下载成功率和下载速度的下载可靠度,使得用户能够更方便、有效地确定要从哪个网页来下载所要的内容。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出具体实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中图I为根据本专利技术一个实施例而提供的搜索服务器的结构示意图。图2为根据本专利技术一个实施例而提供的搜索方法的流程图。具体实施方式 本专利技术提供了一种为网络搜索结果提供下载可靠度的搜索服务器和搜索方法,下面将结合附图详细说明如下。参见图1,根据本专利技术一个实施例的搜索服务器包括信息收集/处理器100,信息存储器101,下载可靠度存储器110,下载可靠度处理器111,搜索处理器120,以及搜索后处理器121。用户通过用户终端140输入搜索关键词,经由本专利技术的搜索服务器,搜索并得到带有网页下载可靠度的搜索结果,并通过用户终端140呈现给用户。在本专利技术中,用户终端可以是计算机终端,也可以是手机、能接入互联网的各种电子设备等。信息收集/处理器100从接入互联网的各网站服务器1、2……N中收集网页信息(网页信息至少包括网页的内容及其URL)并将该信息存储入信息存储器101中。信息收集/处理器100从各网站服务器中收集网页信息的方式可以是传统的互联网信息搜索本文档来自技高网
...

【技术保护点】
一种搜索服务器,包括信息存储器,适于存储从接入互联网的各网站中收集的网页信息,所述网页信息至少包括网页的内容及其URL;搜索处理器,适于接收从用户终端提交的搜索关键词,从所述信息存储器中检索内容包括搜索关键词的各个网页,并生成包括一个或者多个搜索结果项的搜索结果列表,每个搜索结果项包括相应网页的URL及其排序得分R_score;下载可靠度存储器,适于存储一个或者多个网页的下载可靠度信息,每个网页的下载可靠度信息至少包括网页的URL和所述网页的下载可靠度DR_score;搜索后处理器,适于从搜索处理器获取所述搜索结果列表,根据所述搜索结果列表的每个搜索结果项中网页的URL从下载可靠度存储器获取相应网页的下载可靠度信息,根据所述网页的排序得分R_score和下载可靠度DR_score生成所述网页的新排序得分NR_score,并以所述新排序得分NR_score更新所述搜索结果列表中的相应搜索结果项中的排序得分R_score以重新排序生成新搜索结果列表。

【技术特征摘要】

【专利技术属性】
技术研发人员:张栋
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1