一种基于elasticsearch的数据检索优化方法及系统技术方案

技术编号:26791363 阅读:44 留言:0更新日期:2020-12-22 17:06
本发明专利技术公开了一种基于elasticsearch的数据检索优化方法及系统,属于大数据领域;所述的方法具体步骤如下:S1根据检索目的选择字段数据生成索引;S2对输入的查询语句经过语法分析和语言分析得到一系列词Term;S3通过语法分析得到一个查询树;S4通过索引存储将索引读入到内存;S5利用查询树搜索索引;S6将搜索到的结果文档对查询的相关性进行排序;S7返回查询结果给用户;当使用elasticsearch的目的是为了给其他系统提供检索功能,只需要得到文档id的话,本发明专利技术可以选择不存储原始文档,这样会降低磁盘占用,减少不必要的存储,优化存储结构与存储时间,增强了系统的存储容量,提高系统效率。

【技术实现步骤摘要】
一种基于elasticsearch的数据检索优化方法及系统
本专利技术公开一种基于elasticsearch的数据检索优化方法及系统,涉及大数据

技术介绍
在大数据时代,随着互联网技术的迅速崛起与普及,人们在不同领域产生到的数据量之大,达到了前所未有的程度。同时,数据的产生、存储和处理方式发生了革命性的变化,人们的工作和生活基本上都可以用数字化表示,因此采用一种有效检索数据的方式愈发重要。在各种全文检索系统中,以elasticsearch为代表的产品以方便易用快速高效获得了大家的认可,被各种团队广泛地使用于各种业务系统中;现行的全文检索系统在检索工作时,无法有效的针对业务需求对检索范围进行调整,同时检索过程中的数据缓存会造成数据检索的延迟,故现专利技术一种基于elasticsearch的数据检索优化方法及系统,以解决上述问题。
技术实现思路
本专利技术针对现有技术的问题,提供一种基于elasticsearch的数据检索优化方法及系统,所采用的技术方案为:一种基于elasticsearch的数据检索优化方法,本文档来自技高网...

【技术保护点】
1.一种基于elasticsearch的数据检索优化方法,其特征是所述的方法具体步骤如下:/nS1根据检索目的选择字段数据生成索引;/nS2对输入的查询语句经过语法分析和语言分析得到一系列词Term;/nS3通过语法分析得到一个查询树;/nS4通过索引存储将索引读入到内存;/nS5利用查询树搜索索引;/nS6将搜索到的结果文档对查询的相关性进行排序;/nS7返回查询结果给用户。/n

【技术特征摘要】
1.一种基于elasticsearch的数据检索优化方法,其特征是所述的方法具体步骤如下:
S1根据检索目的选择字段数据生成索引;
S2对输入的查询语句经过语法分析和语言分析得到一系列词Term;
S3通过语法分析得到一个查询树;
S4通过索引存储将索引读入到内存;
S5利用查询树搜索索引;
S6将搜索到的结果文档对查询的相关性进行排序;
S7返回查询结果给用户。


2.根据权利要求1所述的方法,其特征是所述S1根据检索目的选择字段数据生成索引的具体步骤如下:
S101将索引文件经过语法分析和语言处理形成一系列词Term;
S102经过索引创建形成词典和反向索引表;
S103通过索引存储将索引写入硬盘。


3.根据权利要求2所述的方法,其特征是所述S103通过索引存储选择性的将索引写入硬盘。


4.根据权利要求1-3任一所述的方法,其特征是所述S5利用查询树搜索索引,得到每个词Term的文档链表,对文档链表进行交差,并得到结果文档。


5.一种基于elasticsearch的数...

【专利技术属性】
技术研发人员:王勇庆张帆宋设
申请(专利权)人:浪潮卓数大数据产业发展有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1