【技术实现步骤摘要】
一种数据检索方法和装置
本专利技术涉及计算机
,尤其涉及一种数据检索方法和装置。
技术介绍
向量化的数据检索可以分为精确检索与近似检索,精确检索的本质是线性搜索,线性搜索通过在整个向量空间内,遍历所有向量,找到与目标向量最匹配的向量信息;近似检索是通过聚类、降维或者编码等方式,将原来需要在整个高维向量空间内的搜索,转换为在小范围空间或相对低维的空间内进行搜索。现有技术中至少存在如下问题:现有的向量化的数据检索方法中存在计算量大,占用内存大,检索精确度低,检索效率低,适用场景少的技术问题。
技术实现思路
有鉴于此,本专利技术实施例提供一种数据检索方法和装置,能够降低计算量,减少内存占用空间,提高检索精确度,提高检索效率,拓展检索适用场景。为实现上述目的,根据本专利技术实施例的第一方面,提供了一种数据检索方法,包括:接收检索数据,对检索数据进行特征处理,得到检索数据对应的检索特征向量;从拓扑图索引中确定导航节点,从导航节点起查询拓扑图索引,根据第一数量阈值以及导航 ...
【技术保护点】
1.一种数据检索方法,其特征在于,包括:/n接收检索数据,对所述检索数据进行特征处理,得到所述检索数据对应的检索特征向量;/n从拓扑图索引中确定导航节点,从所述导航节点起查询所述拓扑图索引,根据第一数量阈值以及所述导航节点查询的查询节点与所述检索特征向量之间的相似度,确定目标节点集合;其中,所述拓扑图索引是根据夹角阈值、第二数量阈值以及多个特征向量节点之间的相似度进行构建的;/n对所述目标节点集合中各目标节点与所述检索特征向量之间的相似度进行排序,根据排序结果确定检索结果。/n
【技术特征摘要】
1.一种数据检索方法,其特征在于,包括:
接收检索数据,对所述检索数据进行特征处理,得到所述检索数据对应的检索特征向量;
从拓扑图索引中确定导航节点,从所述导航节点起查询所述拓扑图索引,根据第一数量阈值以及所述导航节点查询的查询节点与所述检索特征向量之间的相似度,确定目标节点集合;其中,所述拓扑图索引是根据夹角阈值、第二数量阈值以及多个特征向量节点之间的相似度进行构建的;
对所述目标节点集合中各目标节点与所述检索特征向量之间的相似度进行排序,根据排序结果确定检索结果。
2.根据权利要求1所述的数据检索方法,其特征在于,根据夹角阈值、第二数量阈值以及多个特征向量节点之间的相似度构建所述拓扑图索引的步骤包括:
获取多个存储数据,对所述多个存储数据进行特征提取,得到所述多个存储数据对应的多个特征向量节点,并确定所述多个特征向量节点之间的相似度;
根据所述夹角阈值、所述第二数量阈值以及所述多个特征向量节点之间的相似度,确定每个特征向量节点对应的候选节点;并确定每个特征向量节点与所对应的候选节点之间的连接图;其中,所述夹角阈值指示了每个特征向量节点分别与任意两个特征向量节点之间的连线所形成的夹角对应的阈值;
根据每个特征向量节点对应的连接图构建所述拓扑图索引。
3.根据权利要求2所述的数据检索方法,其特征在于,所述根据所述夹角阈值、所述第二数量阈值以及所述多个特征向量节点之间的相似度确定每个特征向量节点对应的候选节点,还包括:
根据所述多个特征向量节点之间的相似度确定每个特征向量节点对应的多级相邻节点;
根据所述夹角阈值、所述第二数量阈值从所述多级相邻节点中确定每个特征向量节点对应的候选节点。
4.根据权利要求2所述的数据检索方法,其特征在于,所述确定所述多个特征向量节点之间的相似度,还包括:
对所述多个特征向量节点进行聚类处理,根据聚类处理结果确定所述多个特征向量节点之间的相似度。
5.根据权利要求2所述的数据检索方法,其特征在于,
接收节点操作信息,确定所述节点操作信息对应的节点操作类型;
若所述节点操作类型为增加节点,确定所述增加节点与所对应的候选节点之间的连接图,对...
【专利技术属性】
技术研发人员:高彬,施文祥,肖智鹏,李洁,王兴达,倪振云,占超,
申请(专利权)人:北京沃东天骏信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。