【技术实现步骤摘要】
一种数据检索方法及相关设备
[0001]本申请涉及计算机领域,尤其涉及一种数据检索方法及相关设备。
技术介绍
[0002]存储在数字信息存储库(例如在线互联网和基于云的数据库)中的数据(例如包括图像数据、视频数据、音频数据和文本数据)的数量正在急剧增长。以准确且资源有效利用的方式处理非结构化数据的搜索查询是一项技术挑战。
[0003]相似度搜索是一种基于检索对象和搜索数据库中的数据对象的相似度之间的比较来搜索非结构化数据对象的数据搜索方法。相似度搜索通常涉及为数据库中存储的每个数据对象创建元数据,为检索对象创建元数据,然后比较所述查询对象的元数据与所述数据对象的元数据。每个数据对象的元数据可以采用特征向量的形式,该特征向量是表示数据对象的多维数值特征向量。在这方面,相似度搜索可以被定义为从数据库中存储的多个特征向量中找到与给定特征向量(例如,查询向量)最相似的特征向量。
[0004]因此,相似度搜索通常涉及使用特征提取算法将检索对象(例如,图像、视频样本、音频样本或文本)翻译为(转换为)表示所述检索对象的第一 ...
【技术保护点】
【技术特征摘要】
1.一种数据检索系统,其特征在于,所述数据检索系统包括路由节点以及多个索引节点,其中,所述路由节点,用于获取第一向量;根据所述第一向量以及路由信息,从所述多个索引节点中得到目标索引节点,其中,所述路由信息包括多个第二向量以及每个所述第二向量对应的索引节点,每个所述第二向量用于表示对应的索引节点上存储的一个或多个第三向量,所述第三向量为对数据对象的表征,所述第一向量与所述多个第二向量中的目标向量之间的向量相似度大于阈值,且所述目标向量在所述路由信息中对应于所述目标索引节点;向所述目标索引节点传递所述第一向量;所述目标索引节点,用于从自身存储的多个第三向量中确定所述第一向量的检索结果。2.根据权利要求1所述的系统,其特征在于,每个所述第二向量对应一个簇,每个所述簇包括一个或多个所述第三向量,且所述多个第二向量中不同第二向量对应不同的簇。3.根据权利要求1或2所述的系统,其特征在于,每个所述第二向量对应一个聚类,每个所述第二向量为所述聚类的聚类中心对应的向量。4.根据权利要求1至3任一所述的系统,其特征在于,每个所述索引节点用于按照簇存储多个所述第三向量,每个所述簇包括至少一个所述第三向量。5.根据权利要求1至4任一所述的系统,其特征在于,每个所述索引节点存储的第三向量为一个或多个簇中包括的向量。6.根据权利要求1至5任一所述的系统,其特征在于,所述第一向量与所述多个第二向量中的至少两个目标向量中的每个目标向量之间的向量相似度大于阈值,所述至少两个目标向量在所述路由信息中对应于所述目标索引节点。7.根据权利要求1至6任一所述的系统,其特征在于,所述目标索引节点包括一个或多个索引节点。8.根据权利要求1至7任一所述的系统,其特征在于,所述检索结果为所述多个第三向量中的部分向量。9.根据权利要求1至8任一所述的系统,其特征在于,所述第一向量为检索对象的表征,所述检索对象包括文本数据、音频数据、图像数据或视频数据中的一个或多个。10.根据权利要求1至9任一所述的系统,其特征在于,所述路由节点,还用于向所述目标索引节点传递所述目标向量;所述目标索引节点具体用于:基于所述目标向量以及第一映射关系,从自身存储的多个第三向量中确定所述一个或多个第三向量,所述第一映射关系指示所述目标向量与所述多个第三向量中的一个或多个第三向量的映射关系;从所述一个或多个第三向量中确定所述第一向量的检索结果。11.根据权利要求1至9任一所述的系统,其特征在于,所述目标索引节点具体用于:根据所述第一向量,从自身存储的多个第三向量中确定部分第三向量,其中所述部分第三向量对应相同的簇,且所述簇的簇中心与所述第一向量之间的向量相似度大于阈值;从所述部分第三向量中确定所述第一向量的检索结果。
12.一种数据检索方法,其特征在于,所述方法包括:获取第一向量;根据所述第一向量以及路由信息,从所述多个索引节点中得到目标索引节点,其中,所述路由信息包括多个第二向量以及每个所述第二向量对应的索引节点,每个所述第二向量用于表示对应的索引节点上存储的一个或多个第三向量,所述第三向量为数据对象的表征,所述第一向量与所述多个第二向量中的目标向量之间的向量相似度大于阈值,且所述目标向量在所述路由信息中对应于所述目标索引节点;向所述目标索引节点传递所述第一向量,所述第一向量用于指示所述目标索引节点从自身存储的多个第三向量中确定所述第一向量的检索结果。13.根据权利要求12所述的方法,其特征在于,每个所述第二向量对应一个簇,每个所述簇包括一个或多个所述第三向量,且所述...
【专利技术属性】
技术研发人员:金钊,刘文杰,李会峰,聂光耀,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。