一种向量检索方法及装置制造方法及图纸

技术编号：40964010 阅读：16 留言：0更新日期：2024-04-18 20:43

一种向量检索方法及装置，用于解决现有的检索方法存在的检索速度慢的问题。本申请中，方法包括：获取待查询向量；将待查询向量分别与M个聚类分区的分区中心向量做相似度计算，得到M个第一相似度；根据M个第一相似度确定K个检索分区；循环执行如下操作，直至目标检索分区包含目标向量的概率值大于第一预设阈值：在K个检索分区中选择检索分区作为目标检索分区；计算待查询向量与目标检索分区中包含的各向量之间的第二相似度；根据各第二相似度，确定目标检索分区包含目标向量的概率值；基于已经选择的至少一个检索分区，输出查询结果。无需将待查询向量与向量底库中的所有向量计算相似度，从而得到查询结果，可以降低计算量，提高查询速度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及检索，尤其涉及一种向量检索方法及装置。

技术介绍

1、向量检索在信息检索领域发挥着重要作用。向量检索的过程为，首先构造向量底库，向量底库中包含对大量数据进行特征提取后得到的大量向量，数据可以为图片、视频、音频、文本等形式；然后将用户输入的待查询向量与向量底库中的所有向量分别计算相似度，将相似度由高到低进行排序的前w个相似度对应的向量作为待查询向量的查询结果返回。

2、这种方法针对包含亿级乃至十亿级规模的向量的向量底库进行全局的搜索比对，检索吞吐量(query per second，速度)较低，检索速度较低。

技术实现思路

1、本申请提供一种向量检索方法及装置，用于解决现有的向量检索方法存在的检索速度低的问题。

2、第一方面，本申请提供一种向量检索方法，该方法具体可以由计算设备执行或者由计算设备内部的芯片执行，或者由计算设备中的处理器执行。该方法包括：获取待查询向量；

3、将所述待查询向量分别与m个聚类分区的分区中心向量做相似度计算，得到m个第一...

【技术保护点】

1.一种向量检索方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，基于已经选择的至少一个检索分区和所述待查询向量，输出查询结果，包括：

3.如权利要求1所述的方法，其特征在于，基于已经选择的至少一个检索分区和所述待查询向量，输出查询结果，包括：

4.如权利要求1所述的方法，其特征在于，在所述K个检索分区中选择未被选择过的检索分区作为目标检索分区，包括：

5.如权利要求1所述的方法，其特征在于，在所述K个检索分区中选择未被选择过的检索分区作为目标检索分区，包括：

6.如权利要求5所述的方法，其特征在于，根据所述待查...

【技术特征摘要】

1.一种向量检索方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，基于已经选择的至少一个检索分区和所述待查询向量，输出查询结果，包括：

3.如权利要求1所述的方法，其特征在于，基于已经选择的至少一个检索分区和所述待查询向量，输出查询结果，包括：

4.如权利要求1所述的方法，其特征在于，在所述k个检索分区中选择未被选择过的检索分区作为目标检索分区，包括：

5.如权利要求1所述的方法，其特征在于，在所述k个检索分区中选择未被选择过的检索分区作为目标检索分区，包括：

6.如权利要求5所述的方法，其特征在于，根据所述待查询向量与每个检索分区中的多个子分区中心向量的多个第三相似度，对所述k个检索分区进行排序，包括：

7.如权利要求1所述的方法，其特征在于，根据各所述第二相似度，确定所述目标检索分区中包含目标向量的概率值，包括：

8.如权利要求7所述的方法，其特征在于，所述待查询向量为n个，所述n为大于1的正整数；

9.一种向量检索装置，其特征在于，包括：

10.如权利要求9所述的装置，其特征在于，在所述处理单元基于已经选择的至少一个检索分区和所述待查询向量，输出查询结果时，具体用于：

11.如权利要求9所述的装置，其特征在于，在所述处理单元基于已...

【专利技术属性】
技术研发人员：邝达，施佩珍，王兵，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人