一种基于搜索引擎的信息检索方法及检索系统技术方案

技术编号:2844044 阅读:253 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于搜索引擎的信息检索方法,其特征在于,包括:触发本地程序或者搜索页面的脚本程序;监视用户在搜索栏的输入信息,即时发送至搜索服务器;将输入信息在搜索服务器的数据库中进行匹配,将匹配得到的即时结果返回所述本地程序或脚本程序;在当前的搜索页面上的提示栏中显示即时结果。本发明专利技术通过简化结果比较确定的查询中的搜索步骤,提高搜索速度,并能使用户的操作更加直观;本发明专利技术还引入模糊查询技术以及各类提示信息,使用户在无法完成输入时,依然可以进行搜索,并方便用户进一步的查询及操作。本发明专利技术可用于电脑、手机、信息家电等各种信息工具,技术实现简单,无技术障碍,无特殊保密算法,成本较低。

【技术实现步骤摘要】

本专利技术涉及信息检索领域,特别是涉及一种基于搜索引擎的信息检索方法及检索系统
技术介绍
搜索引擎(Search Engines)是一个对互联网上的信息资源进行搜集整理,然后供用户查询的系统,搜索引擎的工作一般包括如下三个过程1、在互联网中发现、搜集网页信息;2、对信息进行提取和组织建立索引库;3、再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。它是一个为人们提供信息检索服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。早期的搜索引擎是把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。这其实是最原始的方式,只适用于因特网信息并不多的时候。随着因特网信息按几何式增长,出现了真正意义上的搜索引擎,这些搜索引擎知道网站上每一页的开始,随后搜索因特网上的所有超级链接,把代表超级链接的所有词汇放入一个数据库。这就是现在搜索引擎的原型。现在的搜索引擎已经不只是单纯的搜索网页的信息了,它们已经变得更加综合化,完美化了。虽然随着搜索引擎技术的发展,其结果排序的合理程度日益改进,但是大部分搜索服务一直保持着类似的,需要多个步骤的操作方式。例如,搜索“清华大学”这个词汇,就可能有数百万页的结果,用户想要获得自己所需要的搜索结果往往需要执行以下操作(a)在搜索栏输入“清华大学”;(b)确认输入;(c)在搜索页面中查找需要的搜索结果;(d)点击该搜索结果获取相关信息。对于一些结果比较确定的查询,比如搜索“清华大学”用户的搜索目的仅在于搜索清华大学的网站时,上述搜索过程则过于繁琐和冗余。另外,用户经常会遇到汉字不会输入或者外文单词不会拼写的情况,这时无法完成输入,或者有时候用户无法准确的描述自己的查询,这时候他希望得到提示,但是搜索引擎却没有给予帮助。例如,在现有的搜索引擎中输入“?”或者其他符号,则现有的搜索引擎直接将其忽略,对其他输入信息进行搜索,显示搜索结果。总之,现有的信息检索技术中,尤其是在网络信息检索领域,简化结果比较确定的查询中的搜索步骤,提高搜索速度;以及在搜索引擎中引入模糊查询技术,都是本领域技术人员迫切需要解决的技术问题。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于搜索引擎的信息检索方法,在搜索结果确定的情况下,返回即时结果以及提示信息,省略搜索步骤,尤其在提高搜索效率的前提下,在搜索引擎中引入模糊查询技术,方便用户在无法完成输入时的查询。本专利技术的另一个目的是将上述检索方法应用于实际中,提供一种基于搜索引擎的信息检索系统,用以保证上述检索方法的实现和应用。为解决上述技术问题,本专利技术提供了一种基于搜索引擎的信息检索方法,包括触发本地程序或者搜索页面的脚本程序;监视用户在搜索栏的输入信息,即时发送至搜索服务器;将输入信息在搜索服务器的数据库中进行匹配,将匹配得到的即时结果返回所述本地程序或脚本程序;在当前的搜索页面上的提示栏中显示即时结果。优选的,所述即时结果为实体信息,所述实体信息包括实体名称以及实体网址,所述实体为在现实生活中有实际意义的物体或者概念。优选的,当所述输入信息包括通配符时,该方法还包括(1)以通配符前的输入信息为前缀在常用词数据库中进行匹配;(2)以通配符后的输入信息为后缀在常用词数据库中进行匹配; (3)将(1)、(2)中匹配得到的常用词或者所述常用词对应的即时结果返回本地程序或脚本程序。优选的,当所述输入信息为中文和字母的组合时,该方法还包括将中文转化为拼音字母,与字母组成拼音串;将所述拼音串在搜索服务器的拼音—实体数据库中进行匹配;将拼音—实体数据库中匹配得到的即时结果返回本地程序或脚本程序。优选的,当所述输入信息为数字或拼音时,还包括将所述的数字或拼音在搜索服务器的数字-实体数据库或拼音-实体数据库中进行匹配,将匹配得到的即时结果返回本地程序或脚本程序。优选的,所述的方法,还包括以即时结果中的实体名称为前缀在搜索服务器的常用词数据库中进行匹配,将匹配得到的常用词返回本地程序或脚本程序;在当前的搜索页面上的提示栏中显示常用词。优选的,所述的方法,还包括以输入信息为前缀在搜索服务器的历史搜索词数据库中进行匹配,将匹配得到的历史搜索词返回本地程序或脚本程序;在当前的搜索页面上的提示栏中显示历史搜索词。优选的,所述的方法,还包括将输入信息在本地收藏夹中进行匹配,将匹配得到的用户书签及其分类信息返回本地程序;或者,将输入信息在搜索服务器的用户书签数据库中进行匹配,将匹配得到的用户书签及其分类信息返回脚本程序;在当前的搜索页面上的提示栏中显示用户书签及其分类信息。优选的,所述的方法,还包括如果没有得到任何匹配的即时结果以及常用词,则将从搜索服务器的常用词数据库中匹配得到的与输入信息最相近的常用词作为纠错词返回本地程序或脚本程序;在当前的搜索页面上的提示栏中显示纠错词。当所述输入信息为中文缩写时,优选的,所述的方法,还包括将输入信息在缩写-实体数据库中匹配,将匹配得到的实体信息作为即时结果返回所述本地程序或脚本程序;和/或者,将输入信息在缩写-实体名称库中匹配,将匹配得到的实体名称作为常用词返回所述本地程序或脚本程序。优选的,所述的方法,还包括预置热门搜索键;当输入信息为所述热门搜索键时,匹配搜索服务器的热门搜索词数据库,将数据库中的热门搜索词返回本地程序或脚本程序;在当前的搜索页面上的提示栏中显示热门搜索词。优选的,当用户通过手机键盘向搜索栏中输入信息时,该方法还包括将手机键盘输入的数字组合转化为字母组合;将所述字母组合在搜索服务器的英文词数据库中进行匹配,将匹配得到的英文词返回手机搜索页面的脚本程序,在当前搜索页面上的提示栏中显示英文词;或者,将所述字母组合在搜索服务器的常用词数据库中进行匹配,将匹配得到的常用字母组合返回手机搜索页面的脚本程序,在当前搜索页面上的提示栏中显示常用字母组合;或者,将所述字母组合在拼音-常用词数据库中进行匹配,将匹配得到的中文常用词返回手机搜索页面的脚本程序;在当前搜索页面上的提示栏中显示中文常用词。本专利技术还公开了一种基于搜索引擎的信息检索系统,包括触发单元,用于触发本地程序或者搜索页面的脚本程序;监视单元,用于监视用户在搜索栏的输入信息,并即时发送至搜索服务器;搜索服务器,包括接口子单元和即时结果匹配子单元,其中接口子单元用于接收所述输入信息,以及返回匹配项至所述本地程序或脚本程序;即时结果匹配子单元用于根据输入信息在即时结果数据库中查找即时结果作为匹配项;显示单元,用于在当前的搜索页面上的提示栏中显示匹配项。优选的,所述即时结果数据库为实体信息数据库、缩写-实体数据库、拼音-实体数据库或者数字-实体数据库;所述实体信息包括实体名称以及实体网址,所述实体为在现实生活中有实际意义的物体或者概念。优选的,所述搜索服务器还包括通配符识别子单元,用于识别输入信息中的通配符,将输入信息以通配符为界分为两部分;模糊查询匹配子单元,用于完成以下动作(1)以通配符前的输入信息为前缀在常用词数本文档来自技高网
...

【技术保护点】
一种基于搜索引擎的信息检索方法,其特征在于,包括:触发本地程序或者搜索页面的脚本程序;监视用户在搜索栏的输入信息,即时发送至搜索服务器;将输入信息在搜索服务器的数据库中进行匹配,将匹配得到的即时结果返回所述本地程序或 脚本程序;在当前的搜索页面上的提示栏中显示即时结果。

【技术特征摘要】
1.一种基于搜索引擎的信息检索方法,其特征在于,包括触发本地程序或者搜索页面的脚本程序;监视用户在搜索栏的输入信息,即时发送至搜索服务器;将输入信息在搜索服务器的数据库中进行匹配,将匹配得到的即时结果返回所述本地程序或脚本程序;在当前的搜索页面上的提示栏中显示即时结果。2.如权利要求1所述的方法,其特征在于,所述即时结果为实体信息,所述实体信息包括实体名称以及实体网址,所述实体为在现实生活中有实际意义的物体或者概念。3.如权利要求2所述的方法,其特征在于,当所述输入信息包括通配符时,该方法还包括1)以通配符前的输入信息为前缀在常用词数据库中进行匹配;2)以通配符后的输入信息为后缀在常用词数据库中进行匹配;3)将1)、2)中匹配得到的常用词或者所述常用词对应的即时结果返回本地程序或脚本程序。4.如权利要求1或3所述的方法,其特征在于,当所述输入信息为中文和字母的组合时,该方法还包括将中文转化为拼音字母,与字母组成拼音串;将所述拼音串在搜索服务器的拼音-实体数据库中进行匹配;将拼音-实体数据库中匹配得到的即时结果返回本地程序或脚本程序。5.如权利要求1或3所述的方法,其特征在于,当所述输入信息为数字或拼音时,还包括将所述的数字或拼音在搜索服务器的数字-实体数据库或拼音-实体数据库中进行匹配,将匹配得到的即时结果返回本地程序或脚本程序。6.如权利要求1或3所述的方法,其特征在于,还包括以即时结果中的实体名称为前缀在搜索服务器的常用词数据库中进行匹配,将匹配得到的常用词返回本地程序或脚本程序;在当前的搜索页面上的提示栏中显示常用词。7.如权利要求6所述的方法,其特征在于,还包括以输入信息为前缀在搜索服务器的历史搜索词数据库中进行匹配,将匹配得到的历史搜索词返回本地程序或脚本程序;在当前的搜索页面上的提示栏中显示历史搜索词。8.如权利要求6所述的方法,其特征在于,还包括将输入信息在本地收藏夹中进行匹配,将匹配得到的用户书签及其分类信息返回本地程序;或者,将输入信息在搜索服务器的用户书签数据库中进行匹配,将匹配得到的用户书签及其分类信息返回脚本程序;在当前的搜索页面上的提示栏中显示用户书签及其分类信息。9.如权利要求3所述的方法,其特征在于,还包括如果没有得到任何匹配的即时结果以及常用词,则将从搜索服务器的常用词数据库中匹配得到的与输入信息最相近的常用词作为纠错词返回本地程序或脚本程序;在当前的搜索页面上的提示栏中显示纠错词。10.如权利要求1所述的方法,其特征在于,当所述输入信息为中文缩写时,该方法还包括将输入信息在缩写-实体数据库中匹配,将匹配得到的实体信息作为即时结果返回所述本地程序或脚本程序;和/或者,将输入信息在缩写-实体名称库中匹配,将匹配得到的实体名称...

【专利技术属性】
技术研发人员:周枫庄莉李伟李志恒李魁
申请(专利权)人:网易有道信息技术北京有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1