一种面向多维数据的分段式检索排序系统设计方法技术方案

技术编号：34729760 阅读：21 留言：0更新日期：2022-08-31 18:18

本发明专利技术公开了一种面向多维数据的分段式检索排序系统设计方法，借助搜索设计的ES检索引擎、Colbert

全部详细技术资料下载

【技术实现步骤摘要】
一种面向多维数据的分段式检索排序系统设计方法

[0001]本专利技术属于数据检索
，具体涉及一种面向多维数据的分段式检索排序系统设计方法。

技术介绍

[0002]查询信息的场景在日常系统使用中尤为普遍，对于检索的准确率有着十分强烈的诉求。将搜索结果按照最符合用户期望的序列展示，符合搜索引擎和系统的核心价值。同样在各式各样的行业信息检索中，场景化的结果序列准确对于搜索引擎有着极高的要求，丰富化的个性搜索需要搜索系统和生态设计有相当高的完整度。优质的搜索效果不仅仅会从结果序列的准确性体现，也会在用户的体验感知上得到系统的评价。搜索系统作为最基础的实用功能，但也是最难达到最理想效果的功能，最理想的搜索设计需要做到最理解用户的真实想法。
[0003]当前市场上的搜索引擎和搜索设计，均为普适性的搜索，而且和数据自身的关联性不高。这类搜索最明显的特点就是只能应对标题和正文的日常化搜索，一旦面临高强业务，复杂的场景数据就显得非常不准确了。在实际应用和接入的时候，这部分往往达不到使用人群的要求，只能做和底层搜索逻辑一起的定制开发，不仅会影响原有的搜索逻辑，新加入的搜索逻辑效果也无法得到保证。

技术实现思路

[0004]本专利技术的目的在于提供一种面向多维数据的分段式检索排序系统设计方法，以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的，本专利技术提供如下技术方案：一种面向多维数据的分段式检索排序系统设计方法，包括如下步骤：步骤101）数据准备，将检索用到的数据提前加载到内存中；步骤1

【技术保护点】

【技术特征摘要】
1.一种面向多维数据的分段式检索排序系统设计方法，其特征在于，包括如下步骤：步骤101）数据准备，将检索用到的数据提前加载到内存中；步骤102）数据改写，使用数据准备拓展模块改写内存中数据；步骤103）数据预处理，处理用户检索内容；步骤104）数据预处理改写，改写数据预处理后的对象；步骤105）构建query，根据数据预处理结果及页面选择的筛选条件，构建query；步骤106）ES检索，将ES检索引擎传入已构建完成的query，调用云搜索工具封装好的ES接口，召回query；步骤107）query召回处理，将ES返回的结果进行高亮和基础字段封装处理；步骤108）引入了语义匹配模型，Colbert
‑
search能力模型将ES返回结果的得分与语义匹配模型得分按比例融合，得到综合得分，再根据综合得分排序；步骤109）个性化重排序，根据用户的行为属性数据，以及ES检索引擎和Colbert
‑
search能力模型融合后的综合得分，判断两篇文档的差异，若差异小于设定值，则判断为相近文档，通过比对数据的用户行为属性给文档加上业务相关比重后再次排序，得到最终检索排序；步骤110）个性化重排序改写，对所述步骤109）个性化重排序进行改写。2.根据权利要求1所述的一种面向多维数据的分段式检索排序系统设计方法，其特征在于：所述步骤103）中处理用户检索内容包括使用自然语言中的分词能力进行分词、通过同义词对检索内容进行泛化处理。3.根据权利要求1所述的一种面向多维数据的分段式检索排序系统设计方法，其特征在于：所述数据预处理拓展模块用于定制化处理，改写步骤103）数据预处理结果。4.根据权利要求1所述的一种面向多维数据的分段式检索排序系统设计方法，其特征在于：所述步骤109）中数据的用户行为属性包括文档浏览量、点赞...

【专利技术属性】
技术研发人员：李志昌，
申请(专利权)人：南京云问网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人