当前位置: 首页 > 专利查询>梧州学院专利>正文

基于四叉树集群的近邻搜索方法、装置、设备及存储介质制造方法及图纸

技术编号:36392707 阅读:23 留言:0更新日期:2023-01-18 09:57
本发明专利技术提供一种基于四叉树集群的近邻搜索方法、装置、设备及存储介质,该方法包括将指定区域按短边的长度以1:1长宽比进行切割,得到多个子区域;分别在多个子区域上并行建立各自的四叉树模型;对建立好的多棵四叉树模型分别并行建立各自的邻居表,并根据不同四叉树之间的空间位置关系建立各邻居表之间的联系;确定该给定点所属四叉树中的叶子结点;确定有效的搜索范围;通过距离排序找到距离给定点最近的K个近邻点。本发明专利技术将指定区域按短边的长度以1:1长宽比进行切割,使得每个子区域的长宽比满足1:1,可以突破给定搜索空间的区域限制,并借助有关联的多个邻居表确定有效搜索范围,同时具备时间复杂度低、查询效率高、执行效率高等优点。高等优点。高等优点。

【技术实现步骤摘要】
基于四叉树集群的近邻搜索方法、装置、设备及存储介质


[0001]本专利技术涉及数据算法
,具体涉及一种基于四叉树集群的近邻搜索方法以及应用于该算法的装置,还涉及一种实现上述方法的计算机设备以及存储介质。

技术介绍

[0002]K最近邻(K

Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,其思路为:在特征空间中,如果一个样本附近的K个最近(即特征空间中最邻近)样本的大多数属于某一个类别,则该样本也属于这个类别。针对KNN问题或者K近邻问题:给定一个数据集以及一个点,从数据集中找到距离给定点最近的K个数据,其在图像分类、信息获取、模式识别等方面有广泛的应用价值。
[0003]四叉树的原理:四叉树索引的基本思想是将地理空间递归划分为不同层次的树结构。它将已知范围的空间等分成四个相等的子空间,如此递归下去,直至树的层次达到一定深度或者满足某种要求后停止分割。空间实体只能存储在叶子节点中,中间节点以及根节点不能存储空间实体信息。四叉树的结构比较简单,并且当空间数据对象分布比较均匀时,具有比较高的空间数据插入和查询效率。
[0004]然而,针对在指定的平面区域内为一个特定的点查找距离最近的K个点的问题,现有KNN算法在搜索近邻点的处理环节中,缺乏一种利用四叉树对指定区域进行结点的划分的算法,在有效搜索范围方面欠缺考虑,导致时间复杂度高,查询效率低。

技术实现思路

[0005]本专利技术提供一种基于四叉树集群的近邻搜索方法、装置、设备及存储介质,用以解决目前存在的时间复杂度高、查询效率低、执行效率低等各种问题。
[0006]第一方面,本专利技术提供的一种基于四叉树集群的近邻搜索方法,该方法包括:
[0007]在确认指定区域的长宽比大于预设值后,将指定区域按短边的长度以1:1长宽比进行切割,得到多个子区域;
[0008]分别在多个子区域上并行建立各自的四叉树模型;
[0009]对建立好的多棵四叉树模型分别并行建立各自的邻居表,并根据不同四叉树模型之间的空间位置关系建立各邻居表之间的联系;
[0010]根据给定点的空间位置,确定该给定点对应的四叉树,并确定该给定点所属四叉树中的叶子结点;
[0011]基于相互关联的多个邻居表的结点区域确定有效的搜索范围;
[0012]根据确定好的有效搜索范围,并行计算该范围内所有点与给定点的距离,按照距离排序找到距离给定点最近的K个近邻点。
[0013]根据本专利技术提供的一种基于四叉树集群的近邻搜索方法,在进行区域切割时,将指定区域按短边的长度以1:1长宽比切割原有区域,当切割到最后一个区域时,若剩余区域不满足长宽比1:1比例,则通过扩展空间的方式补足为一个长宽比1:1比例的区域,以此确
保每个区域都满足长宽比1:1的比例。
[0014]根据本专利技术提供的一种基于四叉树集群的近邻搜索方法,所述分别在多个子区域上并行建立各自的四叉树模型,包括:使用四叉树方式逐层划分空间区域,先将初始空间区域划分为四个子区域,若子区域中点的数量大于预先设定好的阈值,则将该子区域进一步划分为四个更小的子区域,直至每个子区域中点的数量都不超过预先设定好的阈值,以确保每个叶子结点区域中点的分布密度相对均匀。
[0015]根据本专利技术提供的一种基于四叉树集群的近邻搜索方法,在完成四叉树模型的建立后,每个长宽比1:1的子区域均得到与之对应的四叉树。
[0016]根据本专利技术提供的一种基于四叉树集群的近邻搜索方法,所述对建立好的多棵四叉树模型分别并行建立各自的邻居表,包括:根据已有四叉树模型所划分的结点区域,根据空间位置找到每一个结点直接相邻的所有邻居结点;为每棵四叉树并行构建一张包括所有结点的邻居表,用于查找近邻点时快速确定有效搜索范围。
[0017]根据本专利技术提供的一种基于四叉树集群的近邻搜索方法,所述确定该给定点所属四叉树中的叶子结点,包括:若给定点处于两个子区域的边界上,则该给定点属于序号较小的那棵四叉树中的对应结点区域;若该叶子结点中点的个数>K值,则将其作为查询邻居表的结点;若该叶子结点中点的个数<K值,则将其父结点作为查询邻居表的结点。
[0018]根据本专利技术提供的一种基于四叉树集群的近邻搜索方法,所述确定有效的搜索范围包括:
[0019]根据查询邻居表的结点到所属的邻居表中进行查询,查找与该结点直接相邻的邻居结点,将这些结点作为初步的第一搜索范围;
[0020]然后,基于给定点到查询邻居表的结点区域边界的最远距离作为搜索半径,基于第一搜索范围内的结点到邻居表中进行查询,查找与这些结点直接相邻的邻居结点,将处于或部分处于搜索半径内的结点作为更精确的第二搜索范围,基于第一搜索范围和第二搜索范围,从而确定有效搜索范围。
[0021]第二方面,本专利技术还提供一种基于四叉树集群的近邻搜索装置,包括:
[0022]区域分割单元,用于在确认指定区域的长宽比大于预设值后,将指定区域按短边的长度以1:1长宽比进行切割,得到多个子区域;
[0023]四叉树模型建立单元,用于分别在多个子区域上并行建立各自的四叉树模型;
[0024]邻居表单元,用于对建立好的多棵四叉树模型分别并行建立各自的邻居表,并根据不同四叉树模型之间的空间位置关系建立各邻居表之间的联系;
[0025]结点区域单元,用于根据给定点的空间位置,确定该给定点对应的四叉树,并确定该给定点所属四叉树中的叶子结点;
[0026]搜索范围单元,基于相互关联的多个邻居表的结点区域确定有效的搜索范围;
[0027]近邻点单元,用于根据确定好的有效搜索范围,并行计算该范围内所有点与给定点的距离,按照距离排序找到距离给定点最近的K个近邻点。
[0028]由此可见,本专利技术将指定区域按短边的长度以1:1长宽比进行切割,使得每个子区域的长宽比满足1:1,可以突破给定搜索空间的区域限制,并借助有关联的多个邻居表确定有效搜索范围,可以根据点的空间分布密度合理划分搜索空间,从而可以根据不同算法筛选出有效搜索范围,以提高查询效率,从而解决目前存在的时间复杂度高、查询效率低、执
行效率低等各种问题;然后,通过预处理建立的邻居表和计算搜索半径,根据搜索半径确定的范围可进一步精确搜索范围,从而提高搜索效率。
[0029]因此,本专利技术可降低KNN搜索的时间复杂度,且实际搜索效率受指定区域大小和点的密度等因素的影响较小,适合在GPU上大规模并行执行,执行效率高,并行性高。
[0030]第三方面,本专利技术还提供一种电子设备,包括:
[0031]存储器,存储有计算机可执行指令;
[0032]处理器,配置为运行所述计算机可执行指令,
[0033]其中,所述计算机可执行指令被所述处理器运行时实现上述任一种的基于四叉树集群的近邻搜索方法的步骤。
[0034]第四方面,本专利技术还提供一种计算机可读存储介质,其中,所述计算机本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于四叉树集群的近邻搜索方法,其特征在于,包括:在确认指定区域的长宽比大于预设值后,将指定区域按短边的长度以1:1长宽比进行切割,得到多个子区域;分别在多个子区域上并行建立各自的四叉树模型;对建立好的多棵四叉树模型分别并行建立各自的邻居表,并根据不同四叉树模型之间的空间位置关系建立各邻居表之间的联系;根据给定点的空间位置,确定该给定点对应的四叉树,并确定该给定点所属四叉树中的叶子结点;基于相互关联的多个邻居表的结点区域确定有效的搜索范围;根据确定好的有效搜索范围,并行计算该范围内所有点与给定点的距离,按照距离排序找到距离给定点最近的K个近邻点。2.根据权利要求1所述的方法,其特征在于:在进行区域切割时,将指定区域按短边的长度以1:1长宽比切割原有区域,当切割到最后一个区域时,若剩余区域不满足长宽比1:1比例,则通过扩展空间的方式补足为一个长宽比1:1比例的区域,以此确保每个区域都满足长宽比1:1的比例。3.根据权利要求2所述的方法,其特征在于:所述分别在多个子区域上并行建立各自的四叉树模型,包括:使用四叉树方式逐层划分空间区域,先将初始空间区域划分为四个子区域,若子区域中点的数量大于预先设定好的阈值,则将该子区域进一步划分为四个更小的子区域,直至每个子区域中点的数量都不超过预先设定好的阈值,以确保每个叶子结点区域中点的分布密度相对均匀。4.根据权利要求3所述的方法,其特征在于:在完成四叉树模型的建立后,每个长宽比1:1的子区域均得到与之对应的四叉树。5.根据权利要求4所述的方法,其特征在于:所述对建立好的多棵四叉树模型分别并行建立各自的邻居表,包括:根据已有四叉树模型所划分的结点区域,根据空间位置找到每一个结点直接相邻的所有邻居结点;为每棵四叉树并行构建一张包括所有结点的邻居表,用于查找近邻点时快速确定有效搜索范围。6.根据权利要求1至5任一项所述的方法,其特征在于:所述确定该给定点所属四叉树中的叶子结点,包括:若给定点处于两个子区域的边界上,则该给定点属于序号较小的那棵四叉树中的对应结点区域;...

【专利技术属性】
技术研发人员:农健何希陈佳黄宏本朱肖颖庞安隆徐健王银清
申请(专利权)人:梧州学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1