【技术实现步骤摘要】
一种数据检索方法、装置及设备
[0001]本申请涉及数据处理
,具体涉及一种数据检索方法、装置及设备。
技术介绍
[0002]随着机器学习和神经网络的发展,越来越多的数据以向量的形式存储于数据库中。例如人脸识别中用到的图片特征以及语音识别中用到的语音特征,均可以以向量的形式存储于对应的向量数据库中。
[0003]在获取用户的数据查询请求后,会利用检索算法从向量数据库保存的海量向量数据中检索需要的向量数据。但是,目前数据检索方式无法满足用户需求。
技术实现思路
[0004]有鉴于此,本申请实施例提供一种数据检索方法、装置及设备,在一定程度上减少了数据检索占用的内存并且提高了检索精度。
[0005]为解决上述问题,本申请实施例提供的技术方案如下:
[0006]一种数据检索方法,所述方法包括:
[0007]将待查询特征向量与各个特征向量分组进行比较,得到所述待查询特征向量所属的目标特征向量分组;
[0008]如果所述目标特征向量分组为图索引分组,通过所述目标特征向量分组 ...
【技术保护点】
【技术特征摘要】
1.一种数据检索方法,其特征在于,所述方法包括:将待查询特征向量与各个特征向量分组进行比较,得到所述待查询特征向量所属的目标特征向量分组;如果所述目标特征向量分组为图索引分组,通过所述目标特征向量分组对应的图索引在所述目标特征向量分组中检索与所述待查询特征向量匹配的特征向量;如果所述目标特征向量分组为倒排量化索引分组,通过所述目标特征向量分组对应的倒排量化索引在所述目标特征向量分组中检索与所述待查询特征向量匹配的特征向量。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对第一特征向量进行聚类,得到多个特征向量分组,每个所述特征向量分组包括至少一个所述第一特征向量;按照所述特征向量分组包括的第一特征向量的数量,将第一特征向量的数量排序在前的预设数量个特征向量分组确定为图索引分组,将其他特征向量分组确定为倒排量化索引分组。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取第二特征向量,将所述第二特征向量与各个所述特征向量分组进行比较,得到所述第二特征向量所属的特征向量分组;将所述第二特征向量添加到所述第二特征向量所属的特征向量分组中。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:利用目标图索引分组中的特征向量建立所述目标图索引分组对应的图索引;所述目标图索引分组中的特征向量包括所述目标图索引分组中的第一特征向量以及所述目标图索引分组中的第二特征向量;所述目标图索引分组分别为所述图索引分组中的每一个;利用目标倒排量化索引分组中的特征向量建立所述目标倒排量化索引分组对应的倒排量化索引;所述目标倒排量化索引分组中的特征向量包括所述目标倒排量化索引分组中的第一特征向量以及所述目标倒排量化索引分组中的第二特征向量;所述目标倒排量化索引分组分别为所述倒排量化索引分组中的每一个。5.根据权利要求2所述的方法,其特征在于,所述方法还包括:利用目标图索引分组中的特征向量建立所述目标图索引分组对应的图索引;所述目标图索引分组中的特征向量包括所述目标图索引分组中的第一特征向量;所述目标图索引分组分别为所述图索引分组中的每一个;利用目标倒排量化索引分组中的特征向量建立所述目标倒排量化索引分组对应的倒排量化索引;所述目标倒排量化索引分组中的特征向量包括所述目标倒排量化索引分组中的第一特征向量;所述目标倒排量化索引分组分别为所述倒排量化索引分组中的每一个。6.根据权利要求4或5所述的方法,其特征在于,所述利用目标倒排量化索引分组中的特征向量建...
【专利技术属性】
技术研发人员:白戈,罗建勋,王长虎,
申请(专利权)人:北京有竹居网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。