【技术实现步骤摘要】
基于向量数据库的检索方法、检索系统及可读存储介质
[0001]本专利技术涉及信息检索
,具体涉及一种基于向量数据库的检索方法、检索系统及可读存储介质。
技术介绍
[0002]随着非结构化数据(如图像、视频和音频)的爆炸性增长,非结构化数据分析在现实世界的丰富应用脉络中的应用愈发广泛存在。许多数据库系统开始纳入非结构化数据分析来满足这些需求。然而,在大多数系统中,对非结构化数据和结构化数据的查询往往被视为不相干的任务,其中混合查询(即涉及两种数据类型混合查询)还没有得到完全支持。
[0003]为了促进对非结构化数据的分析,通常会利用基于内容的检索系统。在这些系统中,每个非结构化数据首先被转换为高维特征向量,然后对这些向量进行后续检索。尽管基于内容的检索系统支持非结构化数据分析,但在许多情况下,由于各种原因,非结构化数据和结构化数据都需要混合查询检索。首先,对非结构化数据的查询可能不足以描述所需的对象,在这种情况下,混合查询有助于提高其表现力。其次,最先进的特征向量提取算法的准确性远远不能令人满意,特别是在大型数据 ...
【技术保护点】
【技术特征摘要】
1.一种基于向量数据库的检索方法,其特征在于,包括以下步骤:确定被输入数据的检索场景,所述检索场景包括流处理场景和批处理场景;若所述检索场景为流处理场景,则调用第一近似最近邻搜索索引在预先获取的向量数据库中对所述被输入数据进行检索,以检索出与所述被输入数据相对应的待输出向量数据;若所述检索场景为批处理场景,则调用第二近似最近邻搜索索引在所述向量数据库中对所述被输入数据进行检索,以检索出与所述被输入数据相对应的待输出向量数据。2.如权利要求1所述的基于向量数据库的检索方法,其特征在于,所述检索方法还包括:将所述向量数据库中的与所述被输入数据的特征向量之间的向量距离按从小到大的顺序排名为前预设位数的向量数据作为与所述被输入数据相对应的待输出向量数据。3.如权利要求1所述的基于向量数据库的检索方法,其特征在于,所述第一近似最近邻搜索索引为基于图的向量索引,在使用基于图的向量索引的所述第一近似最近邻搜索索引在所述向量数据库中进行检索时,使用剪枝算法。4.如权利要求1所述的基于向量数据库的检索方法,其特征在于,所述第二近似最近邻搜索索引为量化向量索引。5.如权利要求1所述的基于向量数据库的检索方法,其特征在于,所述被输入数据...
【专利技术属性】
技术研发人员:李剑楠,苏鹏,阎虎青,黄炎,李恒,
申请(专利权)人:上海爱可生信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。