一种GPU并行计算数据双重映射方法和系统技术方案

技术编号：44586695 阅读：43 留言：0更新日期：2025-03-14 12:47

一种GPU并行计算数据双重映射方法和系统，属于并行计算技术领域，解决了现有技术中并行计算效率低的问题。方法包括：确定核函数需要的线程束数量，生成并行计算的线程并确定线程的原始ID和索引ID；若当前待执行指令为分支计算指令，则当前每个有效线程根据分支判断条件确定该有效线程当前的索引ID对应的实例所属的分组、分块和在分块中的位置；对每个线程束进行引用重定向；每个线程根据该线程所属的线程束对应的分组对该线程进行引用重定向得到该线程新的索引ID；若当前待执行指令为分支计算结束指令，则将每个线程的索引ID值修改为原始ID值；否则，每个有效线程根据索引ID确定对应的实例进行当前待执行指令的计算。实现了高效的并行计算。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及并行计算，尤其涉及一种gpu并行计算数据双重映射方法和系统。

技术介绍

1、gpu并行计算近年来广泛应用于神经网络、图像处理、雷达仿真和复杂控制系统仿真等多个领域，并在其中取得了显著成果。

2、每个线程束按照simd(single instruction multiple date)单指令多线程的并行计算架构执行计算，即线程束内部并行执行同一条指令。该计算架构在模型的分支选择阶段会产生线程束分化，由完全并行转化为分组串行执行，降低计算效率。在gpu并行计算中，执行复杂逻辑分支时产生的分支发散问题一直是众多研究人员致力于解决的问题。目前主要是cpu上线程数据重映射(tdr)。cpu端tdr采用内核分裂的方式，建立反馈-优化循环解决分支条件依赖gpu计算结果和多条件分支两个问题，但是这种方式无疑会带来额外内核启动和往返数据传输的开销，并行计算效率低。

技术实现思路

1、鉴于上述的分析，本专利技术实施例旨在提供一种gpu并行计算数据双重映射方法和系统，用以解决现有线程束...

【技术保护点】

1.一种GPU并行计算数据双重映射方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的GPU并行计算数据双重映射方法，其特征在于，根据并行计算实例数量和核函数最大分支数采用以下公式确定核函数需要的线程束数量：

3.根据权利要求1所述的GPU并行计算数据双重映射方法，其特征在于，根据分支判断条件确定该有效线程当前的索引ID对应的实例所属的分组、分块和在分块中的位置，包括：

4.根据权利要求1所述的GPU并行计算数据双重映射方法，其特征在于，对每个线程束进行引用重定向，确定每个线程束对应的分组，包括：

5.根据权利要求4所述的GPU并行计...

【技术特征摘要】

1.一种gpu并行计算数据双重映射方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的gpu并行计算数据双重映射方法，其特征在于，根据并行计算实例数量和核函数最大分支数采用以下公式确定核函数需要的线程束数量：

3.根据权利要求1所述的gpu并行计算数据双重映射方法，其特征在于，根据分支判断条件确定该有效线程当前的索引id对应的实例所属的分组、分块和在分块中的位置，包括：

4.根据权利要求1所述的gpu并行计算数据双重映射方法，其特征在于，对每个线程束进行引用重定向，确定每个线程束对应的分组，包括：

5.根据权利要求4所述的gpu并行计算数据双重映射方法，其特征在于，根据每个分组中每个分块的实例数量采用以下公式确定每个分组需要的线程束数量：

【专利技术属性】
技术研发人员：甄泽松，周莉莉，史航，佟佳慧，李景，苏银科，韩健，张闻博，
申请(专利权)人：北京机电工程研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人