【技术实现步骤摘要】
一种独立搜索的ApacheLucene评分高亮方法
本专利技术涉及网络搜索
,确切地说是一种独立搜索的ApacheLucene评分高亮方法。
技术介绍
在当今基于ApacheLucene实现的搜索引擎如:ApacheSolr、ElasticSearch等中,高亮与搜索都是捆绑在一起使用的,因为高亮需要文档的原始内容;但是在亿级数据量的大数据生产环境中,原始内容存储会带来磁盘IO性能瓶颈,以及主备节点数据同步慢的性能问题;本专利技术提供了一种方法,将搜索与高亮分开,既搜索服务只索引不存储原始内容;高亮服务单独部署;这样既可以提升搜索性能,也可以提升高亮的性能以及可扩展性。
技术实现思路
本专利技术要解决的技术问题是将搜索与高亮分开,既搜索服务只索引不存储原始内容;高亮服务单独部署;这样既可以提升搜索性能,也可以提升高亮的性能以及可扩展性。为解决上述技术问题,本专利技术采用如下技术手段:一种独立搜索的ApacheLucene评分高亮方法;其特征在于:该方法包括如下步骤:步骤1:数据接收,高亮服务接收客户端通过http协议传输过来的搜索语句参数;步骤2:数据转化,将步骤1接收搜索语句参数转成ApacheLucene的Query对象;步骤3:数据预处理,初始化ApacheLucene的评分器(QueryScorer)以及初始化高亮器(Highlighter);通过评分器(QueryScorer)对Query对象进行评分和分词,得到Query的词组,对需要做高亮的文本进行分词器分词,得到文本词;步骤4:数据处理,遍历文本分词后的结果,与通过评分器(QuerySco ...
【技术保护点】
一种独立搜索的ApacheLucene评分高亮方法;其特征在于:该方法包括如下步骤:步骤1:数据接收,高亮服务接收客户端通过http协议传输过来的搜索语句参数;步骤2:数据转化,将步骤1接收搜索语句参数转成Apache Lucene的Query对象;步骤3:数据预处理,初始化Apache Lucene的评分器(QueryScorer)以及初始化高亮器(Highlighter);通过评分器(QueryScorer)对Query对象进行评分和分词,得到Query的词组,对需要做高亮的文本进行分词器分词,得到文本词;步骤4:数据处理,遍历文本分词后的结果,与通过评分器(QueryScorer)评分后的Query分词结果进行一一匹配;步骤5:数据输出,通过步骤4的匹配,如果能匹配上,则加上高亮标记,否则返回原始内容。
【技术特征摘要】
1.一种独立搜索的ApacheLucene评分高亮方法;其特征在于:该方法包括如下步骤:步骤1:数据接收,高亮服务接收客户端通过http协议传输过来的搜索语句参数;步骤2:数据转化,将步骤1接收搜索语句参数转成ApacheLucene的Query对象;步骤3:数据预处理,初始化ApacheLucene的评分器(QueryScorer)以及初始化高亮器(Highlighter);通过评分器(QueryScorer)对Query对象进行评分和分词,得到Query的词组,对需要做高亮的文本进行分词器分词,得到文本词;步骤4:数据处理,遍历文本分词后的结果,与通过评分器(QueryScorer)评分后的Query分词结果进行一一匹配;步骤5:数据输出,通过步骤4的匹配,如果能匹配上,则加上高亮标记,否则返回原始内容。2.根据权利要求1所述的一种独立搜索的ApacheLucene评分高亮方法;其特征在于:所述的数据转化,编写HighlightHandler类,继承ApacheSolr的RequestHandlerBase抽象类以及实现SolrCoreAware、PluginInfoInitialized接口;然后重写h...
【专利技术属性】
技术研发人员:何小成,黄三伟,
申请(专利权)人:湖南蚁坊软件股份有限公司,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。