一种搜索方法技术

技术编号:3814939 阅读:186 留言:0更新日期:2012-04-11 18:40
一种搜索方法,包括搜索管理模块索引模块、对外服务模块、分词模块、索引定期更新模块、其特征在于搜索管理模块与索引模块、对外服务模块、分词模块通信处理搜索的数据,搜索定时更新模块定期更新索引模块中的数据。本发明专利技术有效地提高了检索效率,利用搜索的结果排名实现了在线状态的用户排在前面以方便寻找,实现了搜索更新解决用户状态索引频繁跟新时降低系统的索引效率。

【技术实现步骤摘要】

本专利技术涉及,尤其涉及反向搜索,搜索排名,索引更新

技术介绍
XMPP(Extensible Messageing and Presence Protocol 可扩展消息与存在协 议)是目前主流的四种IM(IM instant messaging,即时消息)协议之一,其他三种分别为 即时信息和空间协议(IMPP)、空间和即时信息协议(PRIM)、针对即时通讯和空间平衡扩充 的进程开始协议SIP (SIMPLE)。在这四种协议中,XMPP是最灵活的。XMPP是一种基于XML的协议,它继承了在XML 环境中灵活的发展性。因此,基于XMPP的应用具有超强的可扩展性。经过扩展以后的XMPP 可以通过发送扩展的信息来处理用户的需求,以及在XMPP的顶端建立如内容发布系统和 基于地址的服务等应用程序。而且,XMPP包含了针对服务器端的软件协议,使之能与另一 个进行通话,这使得开发者更容易建立客户应用程序或给一个配好系统添加功能。IM是什么意思呢? IM是Instant Messaging的缩写,IM的中文意思是即时信息, 指可以在线实时交流的工具,也就是通常所说的在线聊天工具,如QQ、MSN、新浪UC、TQ等都 是互联网用户常用的IM聊天软件。后附常见即时信息IM软件下载地址即时信息(IM)早 在1996年就开始流行了,当时最著名的即时通信工具为ICQ。ICQ最初由三个以色列人所 开发,1998年被美国在线收购,现在仍然是最受欢迎的即时聊天工具之一。到2003年底,全 球的ICQ用户数量超过15亿,其中60%以上分布在美国之外的世界各国。IM即时信息有针对个人应用和企业应用的不同类型,目前占主导地位的是个人 聊天工具,并且大多是免费服务的。目前常用的即时信息工具有国外的ICQ、Yahoo信使 (Yahoo ! Messenger)、MSN 信使(MSNMessenger)、A0L 即时信使(AIM)等,以及国内网站提 供的即时信息聊天工具如腾迅公司的QQ、新浪UC等。此外,一个网站内部的在线用户之间 的实时交流也是即时信息的一种具体应用形式。搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集互 联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。从使用者的角 度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引 擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。搜索引擎指自动从英特网 (Internet)搜集信息,经过一定整理以後,提供给用户进行查询的系统。用比喻的手法来 说,英特网上的信息浩瀚万千,而且毫无秩序,所有的信息象汪洋上的一个个小岛,网页链 接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为你绘制一幅一目了然的信息地图,供 你随时查阅。在互联网发展初期,网站相对较少,信息查找比较容易。然而伴随互联网爆炸 性的发展,普通网络用户想找到所需的资料简直如同大海捞针,这时为满足大众信息检索 需求的专业搜索网站便应运而生了。现代意义上的搜索引擎的祖先,是1990年由蒙特利尔大学学生Alan Emtage专利技术 的Archie。虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,而且由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage想到 了开发一个可以以文件名查找文件的系统,于是便有了 Archie。Archie工作原理与现在的搜索引擎已经很接近,它依靠脚本程序自动搜索网上的 文件,然后对有关信息进行索引,供使用者以一定的表达式查询。由于Archie深受用户欢 迎,受其启发,美国内华达SystemComputing Services大学于1993年开发了另一个与之非 常相似的搜索工具,不过此时的搜索工具除了索引文件外,已能检索网页。当时,“机器人”一词在编程者中十分流行。电脑“机器人”(ComputerRobot)是指 某个能以人类无法达到的速度不间断地执行某项任务的软件程序。由于专门用于检索信息 的“机器人”程序象蜘蛛一样在网络间爬来爬去,因此,搜索引擎的“机器人”程序就被称为 “蜘蛛”程序。世界上第一个用于监测互联网发展规模的“机器人”程序是MatthewGray开发的 World wide Web Wanderer。刚开始它只用来统计互联网上的服务器数量,后来则发展为能 够检索网站域名。与Wanderer 相对应,Mart in Koster 于 1993 年 10 月创建了 ALIWEB,它是 Archie 的HTTP版本。ALITOB不使用“机器人”程序,而是靠网站主动提交信息来建立自己的链接 索引,类似于现在我们熟知的Yahoo。随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在 Matthew Gray的Wanderer基础上,一些编程者将传统的“蜘蛛”程序工作原理作了些改 进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开 始,就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现, 其中以 JumpStation、The World Wide Web Worm (Goto 的前身,也就是今天 Overture),和 Repository-Based Software Engineering (RBSE) spider 最负盛名。然而JumpStation和WWW Worm只是以搜索工具在数据库中找到匹配信息的先后 次序排列搜索结果,因此毫无信息关联度可言。而RBSE是第一个在搜索结果排列中引入关 键字串匹配程度概念的引擎。最早现代意义上的搜索引擎出现于1994年7月。当时MichaelMauldin将John Leavitt的蜘蛛程序接入到其索引程序中,创建了大家现在熟知的Lycos。同年4月,斯坦 福(Stanford)大学的两名博士生,David Filo和美籍华人杨致远(Gerry Yang)共同创办 了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心。从此搜索引擎进入了高速发 展时期。目前,互联网上有名有姓的搜索引擎已达数百家,其检索的信息量也与从前不可同 日而语。比如最近风头正劲的Google,其数据库中存放的网页已达30亿之巨!随着互联网规模的急剧膨胀,一家搜索引擎光靠自己单打独斗已无法适应目前的 市场状况,因此现在搜索引擎之间开始出现了分工协作,并有了专业的搜索引擎技术和搜 索数据库服务提供商。象国外的Inktomi (已被Yahoo收购),它本身并不是直接面向用户 的搜索引擎,但向包括Overture (原GoTo,已被Yahoo收购)、LookSmart、MSN、HotBot等在 内的其他搜索引擎提供全文网页搜索服务。国内的百度也属于这一类,搜狐和新浪用的就 是它的技术。因此从这个意义上说,它们是搜索引擎的搜索引擎。搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(FullText Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta SearchEngine)。本文档来自技高网...

【技术保护点】
一种搜索方法,包括搜索管理模块索引模块、对外服务模块、分词模块、索引定期更新模块、其特征在于搜索管理模块与索引模块、对外服务模块、分词模块通信处理搜索的数据,搜索定时更新模块定期更新索引模块中的数据。

【技术特征摘要】

【专利技术属性】
技术研发人员:王雨豪王成彬
申请(专利权)人:上海即略网络信息科技有限公司
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1