本发明专利技术公开了一种搜索服务器,该服务器包括信息安全度存储器和搜索后处理器,信息安全度存储器适于存储一个或者多个网页的信息安全度信息,至少包括网页的URL和该网页的信息安全度;搜索后处理器根据该搜索结果列表的每个搜索结果项中网页的URL从信息安全度存储器获取相应网页的信息安全度信息,根据网页的排序得分和信息安全度生成网页的新排序得分,并以新排序得分更新搜索结果列表中的相应搜索结果项中的排序得分以重新排序生成新搜索结果列表。本发明专利技术还公开了一种相应的搜索方法。
【技术实现步骤摘要】
本专利技术涉及网络搜索领域,尤其涉及一种考虑到网络内容的信息安全度的搜索服务器及相应的搜索方法。
技术介绍
随着互联网的高速发展,各种企业、组织和个人等逐步了解到在互联网上提供信息服务的重要性而纷纷建立各自的网站来发布相应信息。随着在网络上提供网络信息服务的网站日益增多,互联网用户很难记住所有的这些网站甚至是想访问的网站的具体地址。 与此同时,互联网所容纳的信息也在呈爆炸式增长,发展到今天,互联网上的各种内容,可谓是浩如烟海。在这种情况下,如何让互联网用户在最短的时间内找到自己想要的内容成为了当务之急。于是,有别于开始的发布各种消息的网站,一类专事搜索的网站、服务器应运而生。而基于互联网的搜索网站以及衍生出的各种搜索方式,也极大的推动了互联网的发展。目前,互联网用户在很大程度上都依赖于搜索网站来查询这些自己需要的内容。一般而言,搜索网站利用搜索引擎来从互联网中提取各个网站的信息(以网页文字为主),建立起数据库。当用户在搜索网站上进行查询时,搜索引擎能检索与用户查询条件相匹配的记录。按照搜索结果与查询条件相匹配的程度,给出搜索结果中每条相应记录的排名得分score,按照排名得分score的高低来排序并返回给用户。然而,随着互联网的快速发展,互联网上的信息呈爆炸式增长,各种不良和不正确的信息也越来越多。用户通过搜索网站进行查询时,经常会获得不正确、错误和恶意的信息。一些恶意人员故意构造带有木马、病毒等网页,利用搜索引擎的排名算法缺陷,使这些恶意网页在搜索结果中排名靠前。用户一旦通过搜索引擎搜索到这样的网页并选择浏览这些恶意网页,则很可能会因此使得用户的终端感染木马或者中毒并因此造成损失。另外一些恶意人员会构造类似于真实网站的虚假网站,并且利用搜索引擎的缺陷而在用户进行搜索时,在搜索结果中将虚假网站排名在真实网站之前,这样很可能引导用户前往这些虚假网站而使用户被虚假网站误导而遭受损失。现有一些搜索引擎会在搜索结果中提醒用户相应的网页可能包含诸如木马、病毒的恶意内容,从而可以阻止用户访问这些网页。然而,现有的搜索引擎仅仅对恶意内容进行甄别,而没有对包含虚假内容的网页进行甄别,不能满足用户的真实需求。因此,用户如何通过搜索引擎获得准确和安全的信息成为目前的重要挑战。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的搜索服务器和相应的搜索方法。根据本专利技术的一个方面,提供了一种搜索服务器,该搜索服务器包括信息存储器、 搜索处理器、信息安全度存储器和搜索后处理器。信息存储器,适于存储从接入互联网的各网站中收集的网页信息,其中网页信息至少包括网页的内容及其URL。搜索处理器,适于接收从用户终端提交的搜索关键词,从信息存储器中检索内容包括搜索关键词的各个网页, 并生成包括一个或者多个搜索结果项的搜索结果列表,其中每个搜索结果项包括相应网页的URL及其排序得分R_SCOre。信息安全度存储器,适于存储一个或者多个网页的信息安全度信息,每个网页的信息安全度信息至少包括网页的URL和网页的信息安全度IS_sCOre。 搜索后处理器,适于从搜索处理器获取搜索结果列表,根据搜索结果列表的每个搜索结果项中网页的URL从信息安全度存储器获取相应网页的信息安全度信息,根据网页的排序得分R_score和信息安全度IS_score生成网页的新排序得分NR_score,并以新排序得分NR_ score更新搜索结果列表中的相应搜索结果项中的排序得分R_score以重新排序生成新搜索结果列表。可选地,在根据本专利技术的搜索服务器中,根据下述来计算新排序得分NR_score=IS_score*x+R_score* (1-χ),其中X是信息安全度权重,在0-1之间,优选为O. 7。可选地,在根据本专利技术的搜索服务器中,其中当所获取的信息安全度IS_sCOre小于一特定值时,所述搜索后处理器自动从搜索结果列表中删除与所述信息安全度is_score 对应的网页的搜索结果项。特别地,如果本专利技术所述的信息安全度IS_SCOre取值在1-100 之间,当上述所获取的信息安全度IS_sC0re小于30时,所述搜索后处理器自动从搜索结果列表中删除与所述信息安全度IS_sC0re对应的网页的搜索结果项。可选地,在根据本专利技术的搜索服务器中,新搜索结果列表的搜索结果项还包括相应网页的信息安全度IS_score。可选地,在根据本专利技术的搜索服务器中,如果当搜索后处理器未能从信息安全度存储器获得相应网页的信息安全度信息,则搜索后处理器不计算所述网页的新排序得分 NR_score且不更新搜索结果列表中的相应搜索结果项中的排序得分R_score。可选地,根据本专利技术的搜索服务器还包括结果处理器,其适于从搜索后处理器获取新搜索结果列表,生成搜索结果并呈现给用户终端;可选地,呈现给用户终端的搜索结果包括相应网页的信息安全度。根据本专利技术的另一个方面,还提供一种相应的搜索方法,在包括信息存储器和信息安全度存储器的搜索服务器中运行,信息存储器适于存储从接入互联网的各网站中收集的网页信息,网页信息至少包括网页的内容及其URL,信息安全度存储器适于存储一个或者多个网页的信息安全度信息,每个网页的信息安全度信息至少包括网页的URL和网页的信息安全度IS_score。该搜索方法包括如下步骤接收从用户终端提交的搜索关键词;从信息存储器中检索内容中含有搜索关键词的各个网页,并生成包括一个或者多个搜索结果项的搜索结果列表,每个搜索结果项包括相应网页的URL及其排序得分R_score ;根据搜索结果列表的每个搜索结果项中网页的URL从信息安全度存储器获取相应网页的信息安全度信息,并根据网页的排序得*R_score和信息安全度IS_score生成网页的新排序得分NR_score,并以新排序得分NR_score来更新搜索结果列表中的相应搜索结果项中的排序得分R_score以重新排序生成新搜索结果列表。根据本专利技术的搜索服务器和搜索方法,为用户搜索并显示了表征相应网页内容安全且准确的信息安全度,使得用户能够直接得到更安全、更准确的搜索结果。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段, 而可依照说明书的内容予以实施。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出具体实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中图I为根据本专利技术一个实施例而提供的搜索服务器的结构示意图。图2为根据本专利技术一个实施例而提供的搜索方法的流程图。具体实施方式本专利技术提供了一种为网络搜索结果提供信息安全度的搜索服务器和搜索方法,下面将结合附图详细说明如下。参见图1,根据本专利技术一个实施例的搜索服务器包括信息收集/处理器100,信息存储器101,信息安全度存储器110,信息安全度处理器111,搜索处理器120,以及搜索后处理器121。用户通过用户终端140输入搜索关键词,经由本专利技术的搜索服务器,搜索并得到带有网页信息安全度的搜索结果,并通过用户终端140呈现给用户。在本专利技术中,用户终端可以是计算机终端,也可以是手机、能接入互联网的各种电子设备等。信息收集/处本文档来自技高网...
【技术保护点】
一种搜索服务器,包括信息存储器,适于存储从接入互联网的各网站中收集的网页信息,所述网页信息至少包括网页的内容及其URL;搜索处理器,适于接收从用户终端提交的搜索关键词,从所述信息存储器中检索内容包括搜索关键词的各个网页,并生成包括一个或者多个搜索结果项的搜索结果列表,每个搜索结果项包括相应网页的URL及其排序得分R_score;信息安全度存储器,适于存储一个或者多个网页的信息安全度信息,每个网页的信息安全度信息至少包括网页的URL和所述网页的信息安全度IS_score;搜索后处理器,适于从搜索处理器获取所述搜索结果列表,根据所述搜索结果列表的每个搜索结果项中网页的URL从信息安全度存储器获取相应网页的信息安全度信息,根据所述网页的排序得分R_score和信息安全度IS_score生成所述网页的新排序得分NR_score,并以所述新排序得分NR_score更新所述搜索结果列表中的相应搜索结果项中的排序得分R_score以重新排序生成新搜索结果列表。
【技术特征摘要】
【专利技术属性】
技术研发人员:张栋,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。