面向向量数据库的混合加速架构制造技术

技术编号:41206761 阅读:25 留言:0更新日期:2024-05-07 22:33
本申请公开面向向量数据库的混合加速架构,涉及集成电路领域,包括主核和两个副核,主核中任务切分模块进行任务切分,任务调度模块根据调度副核执行加速任务;第一副核根据切分任务执行距离计算流水线,其中的距离计算模块根据向量库和待查询向量计算向量距离,从高速存储器中提取待查询向量和向量库、缓存向量距离,向主核反馈距离计算流水线的计算结果;第二副核根据切分任务执行排序流水线,其中的数据排序模块根据向量距离进行向量排序,向主核反馈排序流水线的排序结果,主核根据排序结果输出向量查询结果。该方案通过硬件实现多流水并行处理,实现各种模式下的混合加速功能,副核自定义加速功能,提供更快处理速度和更高存储访问带宽。

【技术实现步骤摘要】

本申请实施例涉及数据库领域,特别涉及一种面向向量数据库的混合加速架构


技术介绍

1、对于非结构化的数据或知识,可以通过一定的学习和训练将其编码为向量,这些非结构化的数据包括:文本、图像、音频、视频等等。向量数据库的主要作用是存储和处理向量数据,并提供高效的向量检索功能。向量数据库的核心思想就是相似度搜索,通过计算一个向量与其他所有向量之间的距离来找到最相似的向量。

2、为提高向量数据库的性能,以往的研究方向都倾向于更高效率的向量索引结构和更合理的向量查询方法,因此涌现出了各式各样的向量搜索算法。这些算法都有一个特点:为了提高搜索性能,可以仅计算一部分向量的距离。这种方法称为近似最近邻(approximate nearest neighbors:ann),它提高了速度,但牺牲了结果的质量。常用的ann索引包括局部敏感哈希(locally sensitive hashing:lsh)、分层可导航小世界(hierarchical navigable small worlds:hnsw)、倒排文件索引(inverted file index:ivf)本文档来自技高网...

【技术保护点】

1.一种面向向量数据库的混合加速架构,其特征在于,包括主核和两个以多流水线并发处理的第一副核与第二副核,所述主核包含有任务调度模块和任务切分模块;所述任务切分模块根据查询任务进行任务切分,所述任务调度模块根据切分任务调度第一副核和/或第二副核执行相应的流水线加速任务;所述第一副核与第二副核分别连接高速存储器,所述高速存储器中缓存有用于向量加速查询的向量库;

2.根据权利要求1所述的面向向量数据库的混合加速架构,其特征在于,加速架构还包括多流水线并发处理的第三副核;所述第三副核根据接收的切分任务执行查表流水线,每个查表流水线包含有查表距离计算模块,所述查表距离计算模块根据压缩向...

【技术特征摘要】

1.一种面向向量数据库的混合加速架构,其特征在于,包括主核和两个以多流水线并发处理的第一副核与第二副核,所述主核包含有任务调度模块和任务切分模块;所述任务切分模块根据查询任务进行任务切分,所述任务调度模块根据切分任务调度第一副核和/或第二副核执行相应的流水线加速任务;所述第一副核与第二副核分别连接高速存储器,所述高速存储器中缓存有用于向量加速查询的向量库;

2.根据权利要求1所述的面向向量数据库的混合加速架构,其特征在于,加速架构还包括多流水线并发处理的第三副核;所述第三副核根据接收的切分任务执行查表流水线,每个查表流水线包含有查表距离计算模块,所述查表距离计算模块根据压缩向量库和第一副核输出的距离矩阵计算查表距离;

3.根据权利要求2所述的面向向量数据库的混合加速架构,其特征在于, 当所述第一副核接收的切分任务不含查表操作时,所述第一副核查询向量并输出向量距离;

4.根据权利要求2所述的面向向量数据库的混合加速架构,其特征在于,所述主核中设置有所有副核的任务切分模块、队列模块和结果模块;

5.根据权利要求3所述的面向向量数据库的混合加速架构,其特征在于,所述计算管理模块包括query缓存单元、数据分离单元和id距离同步单元;

6.根据权利要求5所述的面向向量数据库的混合加速架构,其特征在于, 所述距离计算模块包括单维距离计算单元和高维距离计算单元;所述单维度计算单元将多维向量按照单维向量逐个计算,...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:深存科技无锡有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1