【技术实现步骤摘要】
本专利技术涉及文档识别处理,具体涉及一种基于elasticsearch保留查询顺序的方法及系统。
技术介绍
1、在现代信息检索系统中,elasticsearch(搜索数据分析引擎)作为一种流行的开源搜索引擎和分布式文档存储解决方案,被广泛用于实时搜索、分析和数据存储等应用场景。然而,目前的elasticsearch查询结果的排序顺序通常是根据其内部的评分算法来确定的。这种排序方式虽然有效,但其结果排序顺序较难以直接改写,特别是在需要保证性能的情况下。
2、目前,elasticsearch中提供了一种通过boost改分(加速查询boosting query)的方式来增强特定查询子句的重要性,这在许多搜索场景中是非常有用的。通过在查询dsl中设置boost参数,可以显著影响每个子句的得分,并从而影响整个查询的排序结果。
3、然而,随着查询中clause(子句)数量的增加,尤其是在复杂的查询中,例如包含多个布尔逻辑的复合查询或者多字段的模糊查询,boosting query的性能问题可能变得明显。这是因为每个子句的bo
...【技术保护点】
1.一种基于ElasticSearch保留查询顺序的方法,其特征在于,包括:
2.如权利要求1所述的保留查询顺序的方法,其特征在于,所述利用ElasticSearch进行查询,使用哈希算法将文档主键平均分布在ElasticSearch的各个分片中,确保查询时每个分片的数据与查询的数据对齐,具体步骤如下:
3.如权利要求1所述的保留查询顺序的方法,其特征在于,所述利用ElasticSearch进行查询,还包括查询改写部分,将当前文本中主键部分与用户查询部分的主键进行比对,并以用户查询部分的保序流排序,具体步骤如下:
4.如权利要求1所
...【技术特征摘要】
1.一种基于elasticsearch保留查询顺序的方法,其特征在于,包括:
2.如权利要求1所述的保留查询顺序的方法,其特征在于,所述利用elasticsearch进行查询,使用哈希算法将文档主键平均分布在elasticsearch的各个分片中,确保查询时每个分片的数据与查询的数据对齐,具体步骤如下:
3.如权利要求1所述的保留查询顺序的方法,其特征在于,所述利用elasticsearch进行查询,还包括查询改写部分,将当前文本中主键部分与用户查询部分的主键进行比对,并以用户查询部分的保序流排序,具体步骤如下:
4.如权利要求1...
【专利技术属性】
技术研发人员:袁泉,李勇,杨晓妹,
申请(专利权)人:北京星河智源科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。