一种基于局部单调图模型的最邻近搜索算法制造技术

技术编号:20820030 阅读:61 留言:0更新日期:2019-04-10 05:57
本发明专利技术实施例公开了一种基于局部单调图模型的最邻近搜索算法,涉及机器学习算法技术领域。所述最邻近搜索算法的步骤包括:选取图作为搜索数据结构;依据K近邻估计算法将搜索数据结构中每个节点与其最近的K个邻点连接起来;依据K近邻估计算法构建单调搜索网络,并将所述单调搜索网络以二进制文件保存;将搜索数据结构中每个节点的邻点数量设为相同值;从中心节点出发沿着单调搜索网络的单调路径执行搜索任务。本发明专利技术能够解决现有最邻近搜索算法技术不适用于大规模数据集,构件搜索数据结构的时间长、精度低的问题。

【技术实现步骤摘要】
一种基于局部单调图模型的最邻近搜索算法
本专利技术实施例涉及机器学习算法
,具体涉及一种基于局部单调图模型的最邻近搜索算法。
技术介绍
最邻近搜索又称为"最近点搜索",是一个在尺度空间中寻找最近点的优化问题。在尺度空间M中给定一个点集S和一个目标点q∈M,在S中找到距离q最近的点。很多情况下,M为多维的欧几里得空间,距离由欧几里得距离或曼哈顿距离决定。当数据集规模增长时,构建搜索数据结构的时间大大增加,现有的最邻近搜索算法仅适用于规模较小的基础数据集,不适用于大规模的基础数据集。且占用较多的主机内存,例如HNSW算法建立一系列的图层,上层由底层的数据采样得到,这加快了搜索速度,但同时消耗了更多的内存空间。另外,当换用其他相似度计算方式时,需要对现有的搜索数据结构进行较多的修改工作。未使用并行加速技术以及部分算法由于使用了全局变量,导致无法充分利用多核并行计算,无法缩减构建和搜索的时间。介于上述问题,设计一种新的算法很有必要。
技术实现思路
为此,本专利技术实施例提供一种基于局部单调图模型的最邻近搜索算法,以解决现有最邻近搜索算法技术不适用于大规模数据集,构件搜索数据结构的时间长、精本文档来自技高网...

【技术保护点】
1.一种基于局部单调图模型的最邻近搜索算法,其特征在于,所述最邻近搜索算法的步骤包括:选取图作为搜索数据结构;依据K近邻估计算法将搜索数据结构中每个节点与其最近的K个邻点连接起来;依据K近邻估计算法构建单调搜索网络,并将所述单调搜索网络以二进制文件保存;将搜索数据结构中每个节点的邻点数量设为相同值;从中心节点出发沿着单调搜索网络的单调路径执行搜索任务。

【技术特征摘要】
1.一种基于局部单调图模型的最邻近搜索算法,其特征在于,所述最邻近搜索算法的步骤包括:选取图作为搜索数据结构;依据K近邻估计算法将搜索数据结构中每个节点与其最近的K个邻点连接起来;依据K近邻估计算法构建单调搜索网络,并将所述单调搜索网络以二进制文件保存;将搜索数据结构中每个节点的邻点数量设为相同值;从中心节点出发沿着单调搜索网络的单调路径执行搜索任务。2.如权利要求1所述的一种基于局部单调图模型的最邻近搜索算法,其特征在于,所述图由节点的集合组成,节点之间由弧线连接形成具有多层结构的搜索数据结构,所述搜索数据结构具有单调性。3.如权利要求1所述的一种基于局部单调图模型的最邻近搜索算法,其特征在于,所述构建单调搜索网络采用边选择策略,且构建单调搜索网络的时间复杂度为其中d为数据维度,c为常数。4.如权利要求3所述的一种基于局部单调图模型的最邻近搜索算法,其特征在于,所述边选择...

【专利技术属性】
技术研发人员:陈诗昱刘闯
申请(专利权)人:第六镜科技成都有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1