【技术实现步骤摘要】
向量检索方法、装置和设备
本说明书一个或多个实施例涉及计算机
,尤其涉及一种向量检索方法、装置和设备。
技术介绍
随着互联网技术的发展,人们在检索感兴趣的内容时,检索对象变得越来越复杂。例如,由搜索文本关键词,逐渐发展为搜索图片、搜索音频数据和视频数据等。随着搜索和查询对象变得更加复杂,搜索的难度指数级增加。通常复杂的检索对象会使用高维向量来表示,因此检索过程中通常需要对比诸多高维向量之间的距离或相似度。当需要检索的数据量很大时,涉及的计算量巨大和耗费较长检索时间太长,因此需要提供一种提高检索性能的向量检索方案。
技术实现思路
本说明书实施例提供一种向量检索方法、装置和设备,可以利用CPU和GPU对数据对象进行检索,提高检索效率。第一方面,本说明书实施例提供一种向量检索方法,包括:提取检索对象的特征向量;从图形处理器GPU中获取与特征向量相似的向量,作为第一部分相似向量;从中央处理器CPU中获取与特征向量相似的向量,作为第二部分相似向量;根据第一部分相似向量和第二部分相似向量,确定检索对象的检索结果。第二方面,本说明书实施例提供一种向量检索装置,包括:向量提取模块,用于提取检索对象的特征向量;第一检索模块,用于从图形处理器GPU中获取与所述特征向量相似的向量,作为第一部分相似向量;第二检索模块,用于从中央处理器CPU中获取与所述特征向量相似的向量,作为第二部分相似向量;结果确定模块,用于根据所述第一部分相似向量和所述第二部分相似向量,确定所述检索对象的检索结果。第三方面,本说明书实施例提供一种向量检索设备,包括:存储器和处理器;该存储器用于存储程序;该处 ...
【技术保护点】
1.一种向量检索方法,包括:提取检索对象的特征向量;从图形处理器GPU中获取与所述特征向量相似的向量,作为第一部分相似向量;从中央处理器CPU中获取与所述特征向量相似的向量,作为第二部分相似向量;根据所述第一部分相似向量和所述第二部分相似向量,确定所述检索对象的检索结果。
【技术特征摘要】
1.一种向量检索方法,包括:提取检索对象的特征向量;从图形处理器GPU中获取与所述特征向量相似的向量,作为第一部分相似向量;从中央处理器CPU中获取与所述特征向量相似的向量,作为第二部分相似向量;根据所述第一部分相似向量和所述第二部分相似向量,确定所述检索对象的检索结果。2.根据权利要求1所述的向量检索方法,其中,所述从图形处理器GPU中获取与所述特征向量相似的向量,作为第一部分相似向量,包括:从所述GPU中选择一个或多个第一中心向量,所述一个或多个第一中心向量中的每个第一中心向量与所述特征向量满足第一预设相似度条件;在所述每个第一中心向量所在的向量分组中,选择所述第一部分相似向量,所述第一部分相似向量与所述特征向量满足第二预设相似度条件。3.根据权利要求2所述的向量检索方法,其中,所述一个或多个第一中心向量,是通过检索预先建立的第一倒排索引数据得到的向量,所述第一倒排索引数据包括每个第一中心向量的索引地址;所述第一部分相似向量,是通过检索预先建立的第一索引数据得到的向量,所述第一索引数据包括所述每个第一中心向量所在的向量分组中向量的索引地址,其中,所述每个向量分组中向量之间的索引地址不同。4.根据权利要求1所述的向量检索方法,其中,所述从中央处理器CPU中获取与所述特征向量相似的向量,作为第二部分相似向量,包括:从所述CPU中选择一个或多个第二中心向量,所述一个或多个第二中心向量中的每个第二中心向量满足第三预设相似度条件;在所述每个第二中心向量所在的向量分组中,选择所述第二部分相似向量,所述第二部分相似向量与所述特征向量满足第四预设相似度条件。5.根据权利要求4所述的向量检索方法,其中,所述一个或多个第二中心向量,是通过检索预先建立的第二倒排索引数据得到的向量,所述第二倒排索引数据包括每个第二中心向量的索引地址;所述第二部分相似向量,是通过检索预先建立的第二索引数据得到的向量,所述第二索引数据包括所述每个第二中心向量所在的向量分组中向量的索引地址,其中,所述每个向量分组中向量之间的索引地址不同。6.根据权利要求1所述的向量检索方法,其中,所述检索对象的检索结果,包括按照相似度由高到低,从所述第一部分相似向量和所述第二部分相似向量选择的指定个数的向量。7.根据权利要求1所述的向量检索方法,其中,所述第一部分相似向量,是从所述GPU预先加载的第一向量子集中获取的与所述特征向量相似的向量;所述第二部分相似向量,是从所述CPU预先加载的第二向量子集中获取的与所述特征向量相似的向量;所述第一向量子集和所述第二向量子集,是对指定的特征向量集合进行切分得到的。8.根据权利要求7所述的向量检索方法,其中,所述切分是基于所述CPU对应的内存大小和所述GPU对应的显存大小进行的切分。9.一种向量检索装置,其特征在于,所述向量检索装置包括:向量提取模块,用于提取检索对象的特征向量;...
【专利技术属性】
技术研发人员:李涛,魏宏,方概,杨文,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。