关联图搜索制造技术

技术编号：35730092 阅读：24 留言：0更新日期：2022-11-26 18:29

关联图搜索系统包括KNN图确定器，其用于提前确定数据集中的每个项目的W个邻居，并且将每个项目和该项目的邻居存储在KNN图中，在关联处理单元(APU)上实现的降维向量查找器，其用于查找查询向量的第一数量的第一最近邻，所述APU以恒定复杂度操作，而与数量的大小无关；结果扩展器，其用于使用KNN图针对每个第一最近邻查找W个第二最近邻，从而创建一组邻居；以及KNN全维向量重排器，其用于从该组邻居中查找全维查询向量的最终数量的全维最近邻。查找全维查询向量的最终数量的全维最近邻。查找全维查询向量的最终数量的全维最近邻。

全部详细技术资料下载

【技术实现步骤摘要】
关联图搜索
[0001]相关申请的交叉引用
[0002]本申请要求享有于2021年5月23日提交的美国临时专利申请63/192,032和于2022年4月25日提交的美国临时专利申请63/334,216的优先权，两者均通过引用并入本文。

[0003]本专利技术总体上涉及关联存储器，并且涉及用于结合APU使用KNN图以提供快速且准确的K个最近邻的方法。

技术介绍

[0004]对象(例如，图片、文本、音乐等)可以通过数字的全维特征向量在数据集中进行语义表示。对象原始数据由数字特征表示，数字特征也称为特征嵌入，其可以在保留初始对象信息的同时被处理。
[0005]特征向量可以通过使用神经网络来获得，神经网络接收对象作为输入并提供全维特征向量(例如，128Kx1024字)作为输出。可以使用本领域已知的K个最近邻(KNN)算法来比较特征向量，并且各种应用使用KNN搜索算法来查找与查询对象最紧密相似的K个(例如，25个)对象(从大型数据集中)。这样的应用包括面部识别、图像识别、文档和文本搜索、音乐识别等。
[0006]应用可以将M个特征向量(M可能是几百万个)的大型数据集存储在关联处理单元(APU)中，例如，美国GSI Technology Inc.的Gemini Associative Processing Unit，其中KNN搜索算法非常快，并且以恒定的复杂度执行，而与数据集的大小无关。Gemini上的KNN实现在美国专利10,929,751中进行了描述，该专利已转让给申请人并通过引用并入本文。在...

【技术保护点】

【技术特征摘要】
1.一种关联图搜索系统，包括：KNN图确定器，其用于提前确定数据集中的每个项目的W个邻居，并且将每个项目和该项目的邻居存储在KNN图中；在关联处理单元(APU)上实现的降维向量查找器，其用于查找查询向量的第一数量的第一最近邻，所述APU以恒定复杂度操作，而与所述第一数量的大小无关；结果扩展器，其用于使用所述KNN图针对每个第一最近邻查找W个第二最近邻，从而创建一组邻居；以及KNN全维向量重排器，其用于从所述一组邻居中查找所述全维查询向量的最终数量的全维最近邻。2.根据权利要求1所述的关联图搜索系统，所述降维向量查找器使用相似性搜索方法，所述相似性搜索方法是以下各项之一：汉明距离、L1、L2和Tanimoto。3.根据权利要求1所述的关联图搜索系统，其中，所述关联图搜索系统通过在所述第二最近邻上激活所述结果扩展器来扩展所述一组邻居。4.一种方法，包括：接收全维查询向量；在关联存储器单元(APU)中，减少所述查询向量的大小；在所述APU中激活第一K个最近邻(KNN)算法以查找所述查询向量的小数量的最近邻，所述KNN算法以恒定复杂度操作，而与所述小数量的大小无关；通过使用KNN图在主机处理器中将所述小数量扩展到较大数量的最近邻；在所述主机处理器中获取与所述较大数量的最近邻相关联的全维向量；以及在所述主机处理器中激活第二K个最近邻(KNN)算法以查找所述查询向量的最终K个全维最近邻。5.根据权利要求4所...

【专利技术属性】
技术研发人员：A，
申请(专利权)人：GSI科技公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人