一种实现云搜索服务的方法及系统技术方案

技术编号:6548117 阅读:233 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种实现云搜索服务的方法及系统。具体地说,本发明专利技术公开了一种云搜索服务注册方法,该方法包括:站点发送注册申请至云服务端,所述注册申请至少包括站点域名;所述云服务端根据所述注册申请为所述站点分配站点ID,并根据所述站点ID建立所述站点的资源索引的目录;所述云服务端采集所述站点的资源并存储,根据所述站点资源生成站点资源索引;所述云服务端根据所述站点资源索引的目录定义的位置存储所述站点资源索引。本发明专利技术进一步公开了云服务端的站点资源索引更新方法、云搜索服务系统中的搜索方法以及一种云搜索服务系统。通过本发明专利技术,站点无需考虑资源索引存储以及其他搜索技术细节。

【技术实现步骤摘要】

本专利技术涉及信息检索领域,具体涉及一种实现云搜索服务的方法及系统,即实现云服务端为站点提供搜索服务的方法和系统。
技术介绍
随着互联网技术的发展,搜索已经成为网站必不可少的功能。在个人建站系统中, 常用的站内搜索技术主要有三种。1、基于数据库的搜索通过数据库sql语句的单字索引功能完成最简单的索引功能和最低级的全文检索,且只能进行标题的检索,处于检索时,数据库消耗大量硬件资源,无法开展各种附加功能,效率非常低下。2、基于spider抓取的站内搜索通过spider抓取网页,经html解析,分词,索引实现网页式站内搜索, 这样做的的缺点是有大量的不必要的信息影响搜索结果的排序和显示效果,严重影响搜索精确度,并且用户对搜索范围和内容以及呈现的结果无法精确控制。3、基于搜索引擎的站内搜索很多站点使用大型搜索引擎如Google的站内检索site, domain, com代替了自己的站内数据库全文检索,但依靠Google这样的大型搜索引擎并不会深度遍历一个网站,也不会将该网站的所有内容都收录并索引,而是只收录最新更新的静态网页,且缺少入口的网站内容将逐渐被抛弃,此外,搜索引擎针对站点的更新频率也是有一定周期的,很多内容需要一定时间后才能收录。另外,搜索引擎技术门槛较高,需要高性能的服务器和技术人员支持,对普通的个人站点来说不适合。因此,需要为站点提供一种针对站点内容、实时动态更新、分站点索引以及高效地提供搜索服务的方法。
技术实现思路
本专利技术的目的在于,通过云服务端为站点提供站点资源搜索的服务,使得站点无需考虑资源索引存储以及其他搜索技术细节。本专利技术的又一目的在于,当用户在站点进行搜索时,该站点不仅能够将本站点的相关内容呈现给用户,必要时还能够将注册入云服务端的所有联盟站点的相关内容也呈现给用户。根据本专利技术,提供一种云搜索服务注册方法,该方法包括以下步骤 站点发送注册申请至云服务端,所述注册申请至少包括站点域名;所述云服务端根据所述注册申请为所述站点分配站点ID,并根据所述站点ID建立所述站点的资源索引的目录;所述云服务端采集所述站点的资源并存储,根据所述站点资源生成站点资源索引; 所述云服务端根据所述站点资源索引的目录定义的位置存储所述站点资源索引。优选地,所述方法还包括,云服务端将所述站点的注册申请、站点ID以及站点资源索引的目录以一一对应的方式存储。优选地,所述注册申请还包括站点名称和/或站点状态。优选地,所述云服务端在其存储的所有站点的资源的基础上生成总资源索引。优选地,所述目录采用多级目录的方式建立。优选地,所述云服务端采集所述站点的资源并存储包括所述云服务端通过所述站点提供的资源标准化内容接口采集所述站点的资源,所述站点资源包括标准化内容,所述标准化内容包括资源访问地址、资源ID、资源名称、资源分类、 资源正文和资源最后修改时间;所述云服务端存储所述资源的标准化内容。优选地,所述资源的标准化内容还包括资源标签、资源摘要、资源作者ID、资源作者、资源创建时间、资源浏览量、资源编辑次数、资源版本数和资源评论数中的至少一个。优选地,所述站点提供的资源标准化内容接口采用XML语言编写,并对每个资源有独立的资源访问地址。优选地,所述资源为词条、文章、图片和视频中的至少一种。根据本专利技术,提供一种云搜索服务系统中的云服务端的站点资源索引更新方法, 所述云搜索服务系统包括云服务端和多个站点,所述云服务端存储有每个站点的站点域名、站点资源索引的目录、站点资源索引以及站点资源,该方法包括以下步骤站点响应用户对站点资源所做的编辑,发送更新消息至云服务端,所述更新消息包括站点域名、资源访问地址、资源类型和编辑模式;所述云服务端调用所述资源访问地址,以获取所述站点资源; 所述云服务端根据所述站点域名和资源类型得到其存储的所述站点的该类型的资源和资源索引的目录,进而获取其存储的所述站点的该类型的资源索引;所述云服务端利用其获取的站点资源,根据所述编辑模式更新其存储的所述站点的该类型的资源,并根据更新后的站点资源更新其存储的站点资源索引。优选地,所述资源类型为词条类型、文章类型、图片类型和视频类型中的一种;所述编辑模式为创建、修改、删除和恢复中的一种。优选地,所述站点资源包括标准化内容,所述标准化内容包括资源访问地址、资源 ID、资源名称、资源分类、资源正文和资源最后修改时间。优选地,所述资源的标准化内容还包括资源标签、资源摘要、资源作者ID、资源作者、资源创建时间、资源浏览量、资源编辑次数、资源版本数和资源评论数中的至少一个。优选地,所述方法进一步包括,所述云服务端接收自所述站点发送的更新消息,将其放入消息队列,通过监听消息队列,对所述更新消息进行逐个处理。优选地,所述更新消息使用http请求,采用json格式传输。根据本专利技术,提供一种云搜索服务系统中的搜索方法,所述云搜索服务系统包括云服务端和多个站点,所述云服务端存储有每个站点的站点域名、站点资源索引目录、站点资源索引和站点资源,所述站点资源包括标准化内容,该方法包括以下步骤站点响应用户的搜索请求发送搜索请求参数至云服务端,所述搜索请求参数包括站点域名、搜索关键字;所述云服务端根据所述站点域名得到所述站点的资源索引的目录,进而获取其存储的所述站点的资源索引;所述云服务端根据所述搜索关键字,在其存储的所述站点的资源索引中进行匹配查询,;若匹配到一条或多条资源索引,所述云服务端获取所述一条或多条资源索引对应的包含该关键字的资源的标准化内容,并将每个资源的标准化内容中的一个或多个返回至所述站点;若没有匹配到资源索引,则所述云服务端返回报错信息至所述站点; 所述站点将云服务端返回的搜索结果显示给用户。优选地,所述云服务端根据所述搜索关键字在其存储的所述站点的系统默认类型的资源索引中进行匹配查询。优选地,所述搜索请求参数进一步包括资源类型,所述云服务端根据所述搜索关键字在其存储的所述站点的所述资源类型的资源索引中进行匹配查询。优选地,所述方法进一步包括,所述云服务端对搜索结果中的关键字做高亮处理。根据本专利技术,提供一种云搜索服务系统中的搜索方法,所述云搜索服务系统包括云服务端和多个站点,所述云服务端存储有每个站点的站点域名、站点资源索引的目录、站点资源索引、站点资源,以及所有站点的总资源索引,所述站点资源包括标准化内容,该方法包括以下步骤站点响应用户的搜索请求发送搜索请求参数至云服务端,所述搜索请求参数包括站点域名和搜索关键字;所述云服务端根据所述站点域名得到所述站点的资源索引的目录,进而获取其存储的所述站点的资源索引;所述云服务端根据所述搜索关键字,在其存储的所述站点的资源索引中进行匹配查询;若匹配到多于预定数量的一条或多条资源索引,所述云服务端获取所述一条或多条资源索引对应的包含该关键字的资源的标准化内容,并将每个资源的标准化内容中的一个或多个返回至所述站点;若匹配到不多于预定数量的资源索引,所述云服务端根据所述搜索关键字在其存储的总资源索引中再次进行匹配查询;若匹配到一条或多条资源索引,云服务端获取所述一条或多条资源索引对应的包含该关键字的资源的标准化内容,并将每个资源的标准化内容中的一个或多个返回至所述站若没有匹配到的资源索引,则云服务端返回报错信息至所述站点; 所述站本文档来自技高网...

【技术保护点】
1.一种云搜索服务注册方法,该方法包括以下步骤:站点发送注册申请至云服务端,所述注册申请至少包括站点域名;所述云服务端根据所述注册申请为所述站点分配站点ID,并根据所述站点ID建立所述站点的资源索引的目录;所述云服务端采集所述站点的资源并存储,根据所述站点资源生成站点资源索引;所述云服务端根据所述站点资源索引的目录定义的位置存储所述站点资源索引。

【技术特征摘要】
1.一种云搜索服务注册方法,该方法包括以下步骤站点发送注册申请至云服务端,所述注册申请至少包括站点域名; 所述云服务端根据所述注册申请为所述站点分配站点ID,并根据所述站点ID建立所述站点的资源索引的目录;所述云服务端采集所述站点的资源并存储,根据所述站点资源生成站点资源索引; 所述云服务端根据所述站点资源索引的目录定义的位置存储所述站点资源索引。2.根据权利要求1所述的方法,其特征在于,所述方法还包括,云服务端将所述站点的注册申请、站点ID以及站点资源索引的目录以一一对应的方式存储。3.根据权利要求1或2所述的方法,其特征在于,所述注册申请还包括站点名称和/或站点状态。4.根据权利要求1所述的方法,其特征在于,所述方法还包括,所述云服务端在其存储的所有站点的资源的基础上生成总资源索引。5.根据权利要求1或2所述的方法,其特征在于,所述目录采用多级目录的方式建立。6.根据权利要求1所述的方法,其特征在于,所述云服务端采集所述站点的资源并存储包括所述云服务端通过所述站点提供的资源标准化内容接口采集所述站点的资源,所述站点资源包括标准化内容,所述标准化内容包括资源访问地址、资源ID、资源名称、资源分类、 资源正文和资源最后修改时间;所述云服务端存储所述资源的标准化内容。7.根据权利要求6所述的方法,所述资源的标准化内容还包括资源标签、资源摘要、资源作者ID、资源作者、资源创建时间、资源浏览量、资源编辑次数、资源版本数和资源评论数中的至少一个。8.根据权利要求6所述的方法,其特征在于,所述站点提供的资源标准化内容接口采用XML语言编写,并对每个资源有独立的资源访问地址。9.根据权利要求1所述的方法,其特征在于,所述资源为词条、文章、图片和视频中的至少一种。10.一种云搜索服务系统中的云服务端的站点资源索引更新方法,所述云搜索服务系统包括云服务端和多个站点,所述云服务端存储有每个站点的站点域名、站点资源索引的目录、站点资源索引以及站点资源,其特征在于,该方法包括以下步骤站点响应用户对站点资源所做的编辑,发送更新消息至云服务端,所述更新消息包括站点域名、资源访问地址、资源类型和编辑模式;所述云服务端调用所述资源访问地址,以获取所述站点资源; 所述云服务端根据所述站点域名和资源类型得到其存储的所述站点的该类型的资源和资源索引的目录,进而获取其存储的所述站点的该类型的资源索引;所述云服务端利用其获取的站点资源,根据所述编辑模式更新其存储的所述站点的该类型的资源,并根据更新后的站点资源更新其存储的站点资源索引。11.根据权利要求10所述的方法,其特征在于,所述资源类型为词条类型、文章类型、 图片类型和视频类型中的一种;所述编辑模式为创建、修改、删除和恢复中的一种。12.根据权利要求10所述的方法,其特征在于,所述站点资源包括标准化内容,所述标准化内容包括资源访问地址、资源ID、资源名称、资源分类、资源正文和资源最后修改时间。13.根据权利要求12所述的方法,其特征在于,所述资源的标准化内容还包括资源标签、资源摘要、资源作者ID、资源作者、资源创建时间、资源浏览量、资源编辑次数、资源版本数和资源评论数中的至少一个。14.根据权利要求10所述的方法,其特征在于,所述方法进一步包括,所述云服务端接收自所述站点发送的更新消息,将其放入消息队列,通过监听消息队列,对所述更新消息进行逐个处理。15.根据权利要求10所述的方法,其特征在于,所述更新消息使用http请求,采用 json格式传输。16.一种云搜索服务系统中的搜索方法,所述云搜索服务系统包括云服务端和多个站点,所述云服务端存储有每个站点的站点域名、站点资源索引目录、站点资源索引和站点资源,所述站点资源包括标准化内容,其特征在于,该方法包括以下步骤站点响应用户的搜索请求发送搜索请求参数至云服务端,所述搜索请求参数包括站点域名、搜索关键字;所述云服务端根据所述站点域名得到所述站点的资源索引的目录,进而获取其存储的所述站点的...

【专利技术属性】
技术研发人员:潘海东梅春刘刚
申请(专利权)人:互动在线北京科技有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1