搜索方法及装置制造方法及图纸

技术编号:9642531 阅读:106 留言:0更新日期:2014-02-07 01:14
本发明专利技术公开了一种搜索方法及装置。其中,该搜索方法包括:获得默认词库;统计用户通过客户端发送的各搜索词的次数,将次数大于预定值的搜索词添加到所述默认词库中,获得当前词库;接收用户通过客户端发送的搜索词,在当前词库中搜索该搜索词,获得搜索结果,并向所述客户端返回该搜索结果以用于向用户展示。上述搜索方法及装置,通过统计用户发送的各搜索词的次数,将次数大于预定值的搜索词添加到默认词库中,让热门的词更容易命中相关的资料,从而可以提升搜索命中率。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种搜索方法及装置。其中,该搜索方法包括:获得默认词库;统计用户通过客户端发送的各搜索词的次数,将次数大于预定值的搜索词添加到所述默认词库中,获得当前词库;接收用户通过客户端发送的搜索词,在当前词库中搜索该搜索词,获得搜索结果,并向所述客户端返回该搜索结果以用于向用户展示。上述搜索方法及装置,通过统计用户发送的各搜索词的次数,将次数大于预定值的搜索词添加到默认词库中,让热门的词更容易命中相关的资料,从而可以提升搜索命中率。【专利说明】搜索方法及装置
本专利技术涉及计算机技术,具体涉及一种搜索方法及装置。
技术介绍
搜索引擎的出现,整合了众多网站信息,起到了信息导航的作用。搜索引擎分为垂直搜索引擎和通用搜索引擎两种:通用搜索引擎就如同互联网第一次出现的门户网站一样,大量的信息整合导航,极快的查询,将所有网站上的信息整理在一个平台上供用户使用,于是信息的价值第一次普遍地被众多商家认可,迅速成为互联网中最有价值的领域;垂直搜索引擎是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。现有的垂直搜索命中比率对词库的依赖较大,准确的词库才能获得更好搜索体验,因此,需要一个比较完善并且更新快捷的词库。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的搜索方法及装置。根据本专利技术的一个方面,提供了一种搜索方法,包括:获得默认词库;统计用户通过客户端发送的各搜索词的次数,将次数大于预定值的搜索词添加到所述默认词库中,获得当前词库;接收用户通过客户端发送的搜索词,在当前词库中搜索该搜索词,获得搜索结果,并向所述客户端返回该搜索结果以用于向用户展示。根据本专利技术的另一方面,提供了一种搜索装置,包括:获得模块,适于获得默认词库;添加模块,适于统计用户通过客户端发送的各搜索词的次数,将次数大于预定值的搜索词添加到所述默认词库中,获得当前词库;搜索模块,适于接收用户通过客户端发送的搜索词,在当前词库中搜索该搜索词,获得搜索结果,并向所述客户端返回该搜索结果以用于向用户展示。上述搜索方法及装置,通过统计用户发送的各搜索词的次数,将次数大于预定值的搜索词添加到默认词库中,让热门的词更容易命中相关的资料,从而可以提升搜索命中率。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的【具体实施方式】。【专利附图】【附图说明】通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1a示出了根据本专利技术一个实施例的搜索方法的流程图;图1b示出了根据本专利技术另一个实施例的搜索方法的流程图;图2示出了根据本专利技术另一个实施例的搜索方法的流程图;图3示出了根据本专利技术一个实施例的搜索装置的结构示意图;图4示出了根据本专利技术另一个实施例的搜索装置的结构示意图。【具体实施方式】下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。图1a示出了根据本专利技术一个实施例的搜索方法的流程图。如图1a所示,该搜索方法包括:步骤S101、获得默认词库;该默认词库为对从互联网上抓取的网页进行解析、提取和过滤处理,然后对处理后的网页内容进行分词处理获得的;其中,该默认词库包括不同类别的默认词库;例如游戏词库包括武侠类游戏词库、模拟经营类游戏词库等;步骤S103、统计用户通过客户端发送的各搜索词的次数,将次数大于预定值的搜索词添加到默认词库中,获得当前词库;该步骤S103包括:统计用户通过客户端发送的各搜索词的次数,判断搜索词对应的类别,将该类别中次数大于预定值的搜索词添加到对应类别的默认词库中,获得对应类别的当前词库。 由于搜索词保存在日志中,所以可以通过每小时的脚本文件将保存在日志中的搜索词写入词表,如果词表中没有这个词,则加入词表,如果词表中已经有这个词,则将该词的次数加一。其中,从日志中获取搜索词的实现代码如下:【权利要求】1.一种搜索方法,包括: 获得默认词库; 统计用户通过客户端发送的各搜索词的次数,将次数大于预定值的搜索词添加到所述默认词库中,获得当前词库; 接收用户通过客户端发送的搜索词,在当前词库中搜索该搜索词,获得搜索结果,并向所述客户端返回该搜索结果以用于向用户展示。2.根据权利要求1所述的方法,所述获得默认词库包括:获得不同类别的默认词库;或者所述统计用户通过客户端发送的各搜索词的次数,将次数大于预定值的搜索词添加到所述默认词库中,获得当前词库,包括: 统计用户通过客户端发送的各搜索词的次数,判断搜索词对应的类别,将该类别中次数大于预定值的搜索词添加到对应类别的默认词库中,获得对应类别的当前词库。3.根据权利要求2所述的方法,所述统计用户通过客户端发送的各搜索词的次数,判断搜索词对应的类别,将次数大于预定值的搜索词添加到对应类别的默认词库中,获得对应类别的当前词库,包括: 利用脚本文件将保存在日志中的搜索词写入词表,并将对应搜索词的次数进行累加处理; 判断搜索词对应的类别; 将次数大于预定值的搜索词保留在所述词表中,将所述词表添加到对应类别的默认词库中,生成对应类别的当前词库,使用对应类别的当前词库替换对应类别的默认词库。`4.根据权利要求3所述的方法,所述词表包括关键词、对应关键词的次数和词库分割行。5.根据权利要求1所述的方法,所述默认词库为对从互联网上抓取的网页进行解析、提取和过滤处理,然后对处理后的网页内容进行分词处理获得的。6.一种搜索装置,包括: 获得模块,适于获得默认词库; 添加模块,适于统计用户通过客户端发送的各搜索词的次数,将次数大于预定值的搜索词添加到所述默认词库中,获得当前词库; 搜索模块,适于接收用户通过客户端发送的搜索词,在当前词库中搜索该搜索词,获得搜索结果,并向所述客户端返回该搜索结果以用于向用户展示。7.根据权利要求6所述的装置,所述获得模块,具体适于获得不同类别的默认词库;或者所述添加模块,具体适于:统计用户通过客户端发送的各搜索词的次数,将该类别中次数大于预定值的搜索词添加到对应类别的默认词库中,获得对应类别的当前词库。8.根据权利要求7所述的装置,所述添加模块,具体适于: 利用脚本文件将保存在日志中的搜索词写入词表,并将对应搜索词的次数进行累加处理本文档来自技高网
...
搜索方法及装置

【技术保护点】
一种搜索方法,包括:获得默认词库;统计用户通过客户端发送的各搜索词的次数,将次数大于预定值的搜索词添加到所述默认词库中,获得当前词库;接收用户通过客户端发送的搜索词,在当前词库中搜索该搜索词,获得搜索结果,并向所述客户端返回该搜索结果以用于向用户展示。

【技术特征摘要】

【专利技术属性】
技术研发人员:赵宏威
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1