一种独立搜索的ApacheLucene评分高亮方法技术

技术编号：15792089 阅读：74 留言：0更新日期：2017-07-09 23:17

本发明专利技术公开了一种独立搜索的ApacheLucene评分高亮方法；其特征在于：该方法如下：数据接收，高亮服务接收客户端通过http协议传输过来的搜索语句参数；数据转化，将步骤1接收搜索语句参数转成Apache Lucene的Query对象；数据预处理，初始化Apache Lucene的评分器(QueryScorer)以及初始化高亮器(Highlighter)；通过评分器(QueryScorer)对Query对象进行评分和分词，得到Query的词组，对需要做高亮的文本进行分词器分词，得到文本词；数据处理，遍历文本分词后的结果，与通过评分器(QueryScorer)评分后的Query分词结果进行一一匹配；数据输出，通过步骤4的匹配，如果能匹配上，则加上高亮标记，否则返回原始内容。

全部详细技术资料下载

【技术实现步骤摘要】
一种独立搜索的ApacheLucene评分高亮方法
本专利技术涉及网络搜索
，确切地说是一种独立搜索的ApacheLucene评分高亮方法。
技术介绍
在当今基于ApacheLucene实现的搜索引擎如：ApacheSolr、ElasticSearch等中，高亮与搜索都是捆绑在一起使用的，因为高亮需要文档的原始内容；但是在亿级数据量的大数据生产环境中，原始内容存储会带来磁盘IO性能瓶颈，以及主备节点数据同步慢的性能问题；本专利技术提供了一种方法，将搜索与高亮分开，既搜索服务只索引不存储原始内容；高亮服务单独部署；这样既可以提升搜索性能，也可以提升高亮的性能以及可扩展性。
技术实现思路
本专利技术要解决的技术问题是将搜索与高亮分开，既搜索服务只索引不存储原始内容；高亮服务单独部署；这样既可以提升搜索性能，也可以提升高亮的性能以及可扩展性。为解决上述技术问题，本专利技术采用如下技术手段：一种独立搜索的ApacheLucene评分高亮方法；其特征在于：该方法包括如下步骤：步骤1：数据接收，高亮服务接收客户端通过http协议传输过来的搜索语句参数；步骤2：数据转化，将步骤1接收搜索语句参数转成ApacheLucene的Query对象；步骤3：数据预处理，初始化ApacheLucene的评分器(QueryScorer)以及初始化高亮器(Highlighter)；通过评分器(QueryScorer)对Query对象进行评分和分词，得到Query的词组，对需要做高亮的文本进行分词器分词，得到文本词；步骤4：数据处理，遍历文本分词后的结果，与通过评分器(QuerySco...
一种独立搜索的ApacheLucene评分高亮方法

【技术保护点】
一种独立搜索的ApacheLucene评分高亮方法；其特征在于：该方法包括如下步骤：步骤1：数据接收，高亮服务接收客户端通过http协议传输过来的搜索语句参数；步骤2：数据转化，将步骤1接收搜索语句参数转成Apache Lucene的Query对象；步骤3：数据预处理，初始化Apache Lucene的评分器(QueryScorer)以及初始化高亮器(Highlighter)；通过评分器(QueryScorer)对Query对象进行评分和分词，得到Query的词组，对需要做高亮的文本进行分词器分词，得到文本词；步骤4：数据处理，遍历文本分词后的结果，与通过评分器(QueryScorer)评分后的Query分词结果进行一一匹配；步骤5：数据输出，通过步骤4的匹配，如果能匹配上，则加上高亮标记，否则返回原始内容。

【技术特征摘要】
1.一种独立搜索的ApacheLucene评分高亮方法；其特征在于：该方法包括如下步骤：步骤1：数据接收，高亮服务接收客户端通过http协议传输过来的搜索语句参数；步骤2：数据转化，将步骤1接收搜索语句参数转成ApacheLucene的Query对象；步骤3：数据预处理，初始化ApacheLucene的评分器(QueryScorer)以及初始化高亮器(Highlighter)；通过评分器(QueryScorer)对Query对象进行评分和分词，得到Query的词组，对需要做高亮的文本进行分词器分词，得到文本词；步骤4：数据处理，遍历文本分词后的结果，与通过评分器(QueryScorer)评分后的Query分词结果进行一一匹配；步骤5：数据输出，通过步骤4的匹配，如果能匹配上，则加上高亮标记，否则返回原始内容。2.根据权利要求1所述的一种独立搜索的ApacheLucene评分高亮方法；其特征在于：所述的数据转化，编写HighlightHandler类，继承ApacheSolr的RequestHandlerBase抽象类以及实现SolrCoreAware、PluginInfoInitialized接口；然后重写h...

【专利技术属性】
技术研发人员：何小成，黄三伟，
申请(专利权)人：湖南蚁坊软件股份有限公司，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人