【技术实现步骤摘要】
本专利技术涉及并行计算,尤其涉及一种gpu并行计算数据双重映射方法和系统。
技术介绍
1、gpu并行计算近年来广泛应用于神经网络、图像处理、雷达仿真和复杂控制系统仿真等多个领域,并在其中取得了显著成果。
2、每个线程束按照simd(single instruction multiple date)单指令多线程的并行计算架构执行计算,即线程束内部并行执行同一条指令。该计算架构在模型的分支选择阶段会产生线程束分化,由完全并行转化为分组串行执行,降低计算效率。在gpu并行计算中,执行复杂逻辑分支时产生的分支发散问题一直是众多研究人员致力于解决的问题。目前主要是cpu上线程数据重映射(tdr)。cpu端tdr采用内核分裂的方式,建立反馈-优化循环解决分支条件依赖gpu计算结果和多条件分支两个问题,但是这种方式无疑会带来额外内核启动和往返数据传输的开销,并行计算效率低。
技术实现思路
1、鉴于上述的分析,本专利技术实施例旨在提供一种gpu并行计算数据双重映射方法和系统,用以解决现有线程束
...【技术保护点】
1.一种GPU并行计算数据双重映射方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的GPU并行计算数据双重映射方法,其特征在于,根据并行计算实例数量和核函数最大分支数采用以下公式确定核函数需要的线程束数量:
3.根据权利要求1所述的GPU并行计算数据双重映射方法,其特征在于,根据分支判断条件确定该有效线程当前的索引ID对应的实例所属的分组、分块和在分块中的位置,包括:
4.根据权利要求1所述的GPU并行计算数据双重映射方法,其特征在于,对每个线程束进行引用重定向,确定每个线程束对应的分组,包括:
5.根据权利要求
...【技术特征摘要】
1.一种gpu并行计算数据双重映射方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的gpu并行计算数据双重映射方法,其特征在于,根据并行计算实例数量和核函数最大分支数采用以下公式确定核函数需要的线程束数量:
3.根据权利要求1所述的gpu并行计算数据双重映射方法,其特征在于,根据分支判断条件确定该有效线程当前的索引id对应的实例所属的分组、分块和在分块中的位置,包括:
4.根据权利要求1所述的gpu并行计算数据双重映射方法,其特征在于,对每个线程束进行引用重定向,确定每个线程束对应的分组,包括:
5.根据权利要求4所述的gpu并行计算数据双重映射方法,其特征在于,根据每个分组中每个分块的实例数量采用以下公式确定每个分组需要的线程束数量:
【专利技术属性】
技术研发人员:甄泽松,周莉莉,史航,佟佳慧,李景,苏银科,韩健,张闻博,
申请(专利权)人:北京机电工程研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。