一种基于非空倒排多索引结构的近似最近邻搜索方法技术

技术编号:41013693 阅读:22 留言:0更新日期:2024-04-18 21:50
本发明专利技术涉及数据挖掘技术领域,具体涉及一种基于非空倒排多索引结构的近似最近邻搜索方法,在IVFADC检索系统的倒排索引结构基础上进行改进,将IVFADC检索系统第一阶段的倒排表定位视为一个独立的最近邻搜索问题,并基于乘积量化的近似最近邻搜索方法解决。具体的,在IVFADC倒排索引结构的基础上,通过乘积量化对索引倒排列表的聚类中心进行量化编码,倒排列表的索引由原来的聚类中心转变成了相应的乘积量化编码,通过乘积量化的非对称距离以及距离查找表机制,能够提升第一阶段倒排表的定位效率,此外,与原始的倒排多索引相比,本发明专利技术方法避免了空表的产生,因此降低了存储倒排多索引结构所需的内存空间。

【技术实现步骤摘要】

本专利技术涉及数据挖掘,具体涉及一种基于非空倒排多索引结构的近似最近邻搜索方法


技术介绍

1、最近邻搜索(nearest neighbor search,nns)在计算机视觉、信息检索、数据压缩、机器学习等领域中都有着广泛的应用。随着大数据时代的到来,互联网、多媒体等信息技术经历了高速的发展,各行各业的数据规模都开始以爆炸式的速度增长,这对于需要进行最近邻搜索任务的领域造成了很大的挑战。为了应对这一挑战,大量的研究人员开始研究新的技术,试图寻求更加高效的方法来处理大规模数据的最近邻搜索问题。

2、与最近邻搜索方法不同,近似最近邻搜索(approximate nearest neighborsearch,anns)通过计算真实距离的近似结果,在损失一定精度的条件下,能以更快的搜索速度和更少的内存负载完成查询项的最近邻搜索。近似最近邻搜索的思想是,通过数据压缩技术将原始数据压缩为方便存储与计算的二值编码,查询项的最近邻搜索可以通过数据向量的二值编码来进行,仅保证以较高的概率获取查询项的真实最近邻结果。近似最近邻搜索能够在精度与资源消耗之间做出有效本文档来自技高网...

【技术保护点】

1.一种基于非空倒排多索引结构的近似最近邻搜索方法,其特征在于,包括下列步骤:

2.如权利要求1所述的基于非空倒排多索引结构的近似最近邻搜索方法,其特征在于,

3.如权利要求2所述的基于非空倒排多索引结构的近似最近邻搜索方法,其特征在于,

4.如权利要求3所述的基于非空倒排多索引结构的近似最近邻搜索方法,其特征在于,

5.如权利要求4所述的基于非空倒排多索引结构的近似最近邻搜索方法,其特征在于,

6.如权利要求5所述的基于非空倒排多索引结构的近似最近邻搜索方法,其特征在于,

【技术特征摘要】

1.一种基于非空倒排多索引结构的近似最近邻搜索方法,其特征在于,包括下列步骤:

2.如权利要求1所述的基于非空倒排多索引结构的近似最近邻搜索方法,其特征在于,

3.如权利要求2所述的基于非空倒排多索引结构的近似最近邻搜索方法,其特征在于,

...

【专利技术属性】
技术研发人员:徐智周孟冬谢锡耀
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1