一种并行数据结构构建及其搜索的方法、系统技术方案

技术编号：28874127 阅读：6 留言：0更新日期：2021-06-15 23:08

本发明专利技术提供一种并行数据结构构建及其搜索的方法、系统，所述方法包括：获取待组织数据并进行GPU全局存储模式；根据所述待组织数据的属性确定GPU存储区域对应的区域格；将所述待组织数据构建第一四分树群，且将所述待组织数据对应线程的数据点处理至对应的区域格；根据所述数据点将所有待组织数据部署存储至所述区域格中。本发明专利技术利用GPU高速但有限的片上存储实现四分树的构建和搜索，极大地提升了存储访问的效率。同时，树群以每个CUDA线程块为单位实现一棵较小的四分树，线程并行度相对一个单一的四分树要高许多倍，从而提升了建树的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种并行数据结构构建及其搜索的方法、系统
本专利技术涉及数据结构以及存储
，尤其涉及一种并行数据结构构建及其搜索的方法、系统。
技术介绍
图形处理器(GPU)它起源于图形渲染，现在已出现高级语言支持GPU上的便捷编程。NVIDIA为其GPU提供了ComputeUnifiedDeviceArchitecture(CUDA)编程模型，拥有类C语言的编程接口。结合CUDA的GPU提供了强大的计算能力和非常高的存储带宽，适合于高度并行、计算密集的应用。尽管计算能力强大，但NVIDIAGPU的花销较低，而且普遍存在于PC或工作站等不太昂贵的机器中。目前，使用CUDA在GPU上建立一个树型数据结构方面的工作较少。ZhouKun等在GPU上构建了一个针对多维数据的KD-tree，他们将树的节点信息等存储在GPU的全局存储上，并使用该数据结构加速图像渲染中的光线追踪和K个最近邻搜索，但存在效率不高的问题。且现有实验证明该基于CUDA的八分树在树型结构构建全局存储上存在延迟较高的问题。现有工作集中于在GPU的全局存储上构建一个单一的树型数据结构。这样的策略导致大量效率较低的无法优化的对全局存储的访问，而且由于线程竞争着将数据点插入到树中，致使CUDA程序的线程并行度较低，且其性能受到很大影响。
技术实现思路
本专利技术提供的一种并行数据结构构建及其搜索的方法、系统，利用GPU高速但有限的片上存储实现四分树的构建和搜索，极大地提升了存储访问的效率。同时，树群以每个CUDA线程块为单位实现一棵较小...

【技术保护点】
1.一种并行数据结构构建及其搜索的方法，其特征在于，所述方法包括：/n获取待组织数据并进行GPU全局存储模式；/n根据所述待组织数据的属性确定GPU存储区域对应的区域格；/n将所述待组织数据构建第一四分树群，且将所述待组织数据对应线程的数据点处理至对应的区域格；/n根据所述数据点将所有待组织数据部署存储至所述区域格中。/n

【技术特征摘要】
1.一种并行数据结构构建及其搜索的方法，其特征在于，所述方法包括：
获取待组织数据并进行GPU全局存储模式；
根据所述待组织数据的属性确定GPU存储区域对应的区域格；
将所述待组织数据构建第一四分树群，且将所述待组织数据对应线程的数据点处理至对应的区域格；
根据所述数据点将所有待组织数据部署存储至所述区域格中。

2.根据权利要求1所述的方法，其特征在于，所述方法，包括：根据所述待组织数据的分布范围和分布密度预估划分第一区域格；
所述根据所述待组织数据的属性确定GPU存储区域对应的区域格，包括：
若所述第一区域格中包含的数据点个数大于预设阈值，则将所述第一区域格划分为第一子区域格，并将所述第一子区域格作为所述待组织数据在GPU存储区域对应的区域格；其中所述第一子区域格包含至少一个数据点。

3.根据权利要求2所述的方法，其特征在于，所述根据所述待组织数据的属性确定GPU存储区域对应的区域格，还包括：
若所述第一区域格中包含的数据点个数不大于预设阈值，则将所述第一区域格作为所述待组织数据在GPU存储区域对应的区域格。

4.根据权利要求1-3中任一项所述的方法，其特征在于，将所述待组织数据对应线程的数据点处理至对应的区域格，包括：
将所述待组织数据对应线程的数据点组织到所述第一四分树群对应的区域格。

5.根据权利要求1-3中任一项所述的方法，其特征在于，将所述待组织数据对应线程的数据点处理至对应的区域格，包括：
若所述第一四分树群内对应插入的叶节点已被其他数据点占用，则当前线程创建第一四分子树，其中所述第一四分子...

【专利技术属性】
技术研发人员：易卫东，万海军，
申请(专利权)人：中航万通北京装备科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人