一种并行数据结构构建及其搜索的方法、系统技术方案

技术编号:28874127 阅读:6 留言:0更新日期:2021-06-15 23:08
本发明专利技术提供一种并行数据结构构建及其搜索的方法、系统,所述方法包括:获取待组织数据并进行GPU全局存储模式;根据所述待组织数据的属性确定GPU存储区域对应的区域格;将所述待组织数据构建第一四分树群,且将所述待组织数据对应线程的数据点处理至对应的区域格;根据所述数据点将所有待组织数据部署存储至所述区域格中。本发明专利技术利用GPU高速但有限的片上存储实现四分树的构建和搜索,极大地提升了存储访问的效率。同时,树群以每个CUDA线程块为单位实现一棵较小的四分树,线程并行度相对一个单一的四分树要高许多倍,从而提升了建树的效率。

【技术实现步骤摘要】
一种并行数据结构构建及其搜索的方法、系统
本专利技术涉及数据结构以及存储
,尤其涉及一种并行数据结构构建及其搜索的方法、系统。
技术介绍
图形处理器(GPU)它起源于图形渲染,现在已出现高级语言支持GPU上的便捷编程。NVIDIA为其GPU提供了ComputeUnifiedDeviceArchitecture(CUDA)编程模型,拥有类C语言的编程接口。结合CUDA的GPU提供了强大的计算能力和非常高的存储带宽,适合于高度并行、计算密集的应用。尽管计算能力强大,但NVIDIAGPU的花销较低,而且普遍存在于PC或工作站等不太昂贵的机器中。目前,使用CUDA在GPU上建立一个树型数据结构方面的工作较少。ZhouKun等在GPU上构建了一个针对多维数据的KD-tree,他们将树的节点信息等存储在GPU的全局存储上,并使用该数据结构加速图像渲染中的光线追踪和K个最近邻搜索,但存在效率不高的问题。且现有实验证明该基于CUDA的八分树在树型结构构建全局存储上存在延迟较高的问题。现有工作集中于在GPU的全局存储上构建一个单一的树型数据结构。这样的策略导致大量效率较低的无法优化的对全局存储的访问,而且由于线程竞争着将数据点插入到树中,致使CUDA程序的线程并行度较低,且其性能受到很大影响。
技术实现思路
本专利技术提供的一种并行数据结构构建及其搜索的方法、系统,利用GPU高速但有限的片上存储实现四分树的构建和搜索,极大地提升了存储访问的效率。同时,树群以每个CUDA线程块为单位实现一棵较小的四分树,线程并行度相对一个单一的四分树要高许多倍,从而提升了建树的效率。第一方面,本专利技术实施例提供的一种并行数据结构构建及其搜索的方法,所述方法包括:获取待组织数据并进行GPU全局存储模式;根据所述待组织数据的属性确定GPU存储区域对应的区域格;将所述待组织数据构建第一四分树群,且将所述待组织数据对应线程的数据点处理至对应的区域格;根据所述数据点将所有待组织数据部署存储至所述区域格中。在一种可能的设计中,所述方法,包括:根据所述待组织数据的分布范围和分布密度预估划分第一区域格;所述根据所述待组织数据的属性确定GPU存储区域对应的区域格,包括:若所述第一区域格中包含的数据点个数大于预设阈值,则将所述第一区域格划分为第一子区域格,并将所述第一子区域格作为所述待组织数据在GPU存储区域对应的区域格;其中所述第一子区域格包含至少一个数据点。在一种可能的设计中,所述根据所述待组织数据的属性确定GPU存储区域对应的区域格,还包括:若所述第一区域格中包含的数据点个数不大于预设阈值,则将所述第一区域格作为所述待组织数据在GPU存储区域对应的区域格。在一种可能的设计中,将所述待组织数据对应线程的数据点处理至对应的区域格,包括:将所述待组织数据对应线程的数据点组织到所述第一四分树群对应的区域格。在一种可能的设计中,将所述待组织数据对应线程的数据点处理至对应的区域格,包括:若所述第一四分树群内对应插入的叶节点已被其他数据点占用,则当前线程创建第一四分子树,其中所述第一四分子树具有四个空叶节点;根据所述第一四分子树,将当前线程已有节点和其对应数据点插入所述第一四分子树的所述叶节点对应区域格。在一种可能的设计中,所述方法还包括:搜索所述GPU存储区域已有第二四分树群,为所述第一四分树群对应区域格内的每个数据点获取对应的临近数据点。在一种可能的设计中,为所述第一四分树群对应区域格内的每个数据点获取对应的临近数据点,包括:根据所述第一四分树群内对应区域格中线程的根数据点以及当前访问对应树深度,检测是否满足预设条件;若满足所述预设条件,则根据所述第一四分树群内对应区域格中线程的根数据点以及当前访问对应树深度获取所述第一四分树群对应区域格内的每个数据点对应的临近数据点;或者若不满足所述预设条件,则根据当前访问数据点对应其兄弟节点来确定所述第一四分树群对应区域格内的每个数据点对应的临近数据点。在一种可能的设计中,在根据所述数据点将所有待组织数据部署存储至所述区域格中之后,还包括:根据所述第一四分树群对应区域格内的数据点及其对应的临近数据点,获得目标数据。在一种可能的设计中,每个所述线程对应一个四分树,且具有对应的数据点。第二方面,本专利技术实施例提供的一种并行数据结构构建及其搜索的系统,包括存储器和处理器,存储器中存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行第一方面任一项所述并行数据结构构建及其搜索的方法。本专利技术提供的一种并行数据结构构建及其搜索的方法、系统,利用GPU高速但有限的片上存储实现四分树的构建和搜索,极大地提升了存储访问的效率。同时,树群以每个CUDA线程块为单位实现一棵较小的四分树,线程并行度相对一个单一的四分树要高许多倍,从而提升了建树的效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的并行数据结构构建及其搜索的方法流程示意图;图2为本实施例利用GPU片上树群实现二维数据近邻搜索的结构示意图;图3为本专利技术实施例主机端代码的顺序执行和设备端代码的并行执行的示意图;图4为本实施例区域格的二维层次递归划分的示意图;图5为本实施例区域格四分树形式的数据点组织的示意图;图6为本专利技术实施例提供的并行数据结构构建及其搜索的系统结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。四分树是一种用于组织二维空间数据的多层次树状数据结构,在树内每个非叶节点最多有四个子节点。它将一个正方形区域规则地划分为4个子区域本文档来自技高网...

【技术保护点】
1.一种并行数据结构构建及其搜索的方法,其特征在于,所述方法包括:/n获取待组织数据并进行GPU全局存储模式;/n根据所述待组织数据的属性确定GPU存储区域对应的区域格;/n将所述待组织数据构建第一四分树群,且将所述待组织数据对应线程的数据点处理至对应的区域格;/n根据所述数据点将所有待组织数据部署存储至所述区域格中。/n

【技术特征摘要】
1.一种并行数据结构构建及其搜索的方法,其特征在于,所述方法包括:
获取待组织数据并进行GPU全局存储模式;
根据所述待组织数据的属性确定GPU存储区域对应的区域格;
将所述待组织数据构建第一四分树群,且将所述待组织数据对应线程的数据点处理至对应的区域格;
根据所述数据点将所有待组织数据部署存储至所述区域格中。


2.根据权利要求1所述的方法,其特征在于,所述方法,包括:根据所述待组织数据的分布范围和分布密度预估划分第一区域格;
所述根据所述待组织数据的属性确定GPU存储区域对应的区域格,包括:
若所述第一区域格中包含的数据点个数大于预设阈值,则将所述第一区域格划分为第一子区域格,并将所述第一子区域格作为所述待组织数据在GPU存储区域对应的区域格;其中所述第一子区域格包含至少一个数据点。


3.根据权利要求2所述的方法,其特征在于,所述根据所述待组织数据的属性确定GPU存储区域对应的区域格,还包括:
若所述第一区域格中包含的数据点个数不大于预设阈值,则将所述第一区域格作为所述待组织数据在GPU存储区域对应的区域格。


4.根据权利要求1-3中任一项所述的方法,其特征在于,将所述待组织数据对应线程的数据点处理至对应的区域格,包括:
将所述待组织数据对应线程的数据点组织到所述第一四分树群对应的区域格。


5.根据权利要求1-3中任一项所述的方法,其特征在于,将所述待组织数据对应线程的数据点处理至对应的区域格,包括:
若所述第一四分树群内对应插入的叶节点已被其他数据点占用,则当前线程创建第一四分子树,其中所述第一四分子...

【专利技术属性】
技术研发人员:易卫东万海军
申请(专利权)人:中航万通北京装备科技有限公司
类型:发明
国别省市:北京;11

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1