【技术实现步骤摘要】
一种分布式搜索方法
本专利技术涉及搜索领域,尤其涉及一种分布式搜索方法。
技术介绍
目前,基于数据库的全文检索,是在数据库上增加了一个全文检索的模块,该模块功能和数据库集成在一起,占用数据库服务器的资源。在查询压力比较大的情形下,经常导致数据库服务器负载过高,不能向应用提供正常服务。
技术实现思路
为了解决上述技术问题,本专利技术的目的在于提供一种基于文件系统的全文检索,把全文检索的功能独立出来,成为一个单独的服务,这样可以和数据库分开部署,从而减轻数据库的压力,同时增强检索服务的性能的分布式搜索的架构。本专利技术的完整技术方案是,一种分布式搜索方法,包括一个搜索引擎集群,所述搜索引擎集群位于数据库之前、应用之后,所述搜索引擎集群包括Zookeeper、Katta、HDFS、Solr;Solr用于创建索引:通过连接到数据库,获取数据行,创建索引分片;HDFS用于存储索引:通过其中的Hadoop控制台,存储分片到HDFS上;Katta用于部署、更新以及查询索引:通过Katta控制台,发布索引分片,Katta自动部署分片到索引节点;未满的分片需要继续填充索引文档,然后更新到已发布的节点上;应用发出的查询,由Katta客户端处理:首先向索引节点发出获取索引ID的请求,进行排序等处理,然后根据ID发出获取具体的文档;Zookeeper作为分布式协调器的一部分。所述索引分片的大小小于等于10G或小于等于1500万行。由上可见,本专利技术与现在技术相比有如下有益效果:本专利技术提供一种基于文件系统的全文检索,把全文检索的功能独立出来,成为一个单独的服务,这样可以和数据库分 ...
【技术保护点】
一种分布式搜索架构,其特征在于,包括一个搜索引擎集群,所述搜索引擎集群位于数据库之前、应用之后,所述搜索引擎集群采用Zookeeper、Katta、HDFS、Solr为基础架构;Solr用于创建索引:通过连接到数据库,获取数据行,创建索引分片;HDFS用于存储索引:通过其中的Hadoop控制台,存储分片到HDFS上;Katta用于部署、更新以及查询索引:通过Katta控制台,发布索引分片,Katta自动部署分片到索引节点;未满的分片需要继续填充索引文档,然后更新到已发布的节点上;应用发出的查询,由Katta客户端处理:首先向索引节点发出获取索引ID的请求,进行排序等处理,然后根据ID发出获取具体的文档;Zookeeper作为分布式协调器的一部分。
【技术特征摘要】
1.一种分布式搜索方法,其特征在于,包括一个搜索引擎集群,所述搜索引擎集群位于数据库之前、应用之后,所述搜索引擎集群包括Zookeeper、Katta、HDFS、Solr;Solr用于创建索引:通过连接到数据库,获取数据行,创建索引分片;HDFS用于存储索引:通过其中的Hadoop控制台,存储分片到HDFS上;Katta用于部署、更新以及查询索引:通过Katta控制台,发布索引...
【专利技术属性】
技术研发人员:严纬,
申请(专利权)人:上海特易信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。