工作组处理方法、装置、计算机设备、存储介质和计算机程序产品制造方法及图纸

技术编号:42492495 阅读:17 留言:0更新日期:2024-08-21 13:09
本申请涉及一种工作组处理方法、装置、计算机设备、存储介质和计算机程序产品。该方法包括:通过驱动器确定折叠后的工作组的数量;基于折叠后的工作组的数量对初始索引空间进行折叠得到目标索引空间;将目标索引空间所描述的工作组发送至设备端,目标索引空间所描述的工作组用于指示设备端进行线程束构造;通过驱动器获取目标索引空间的工作组的折叠信息,并向编译器发送工作组的折叠信息,并通过编译器基于工作组的折叠信息对目标索引空间中的折叠工作组进行展开以映射为原始索引空间所描述的多个工作组;展开后的工作组在设备端构造的线程束中被处理。采用本方法能够降低硬件线程组构造器工作量,减少线设备端构造/释放资源所带来的硬件开销。

【技术实现步骤摘要】

本申请涉及计算机,特别是涉及一种工作组处理方法、装置、计算机设备、存储介质和计算机程序产品


技术介绍

1、opencl是一个为异构平台编写程序的框架,此异构平台可由cpu(centralprocessing unit,中央处理器)、gpu(graphics processing unit,图形处理器)或其他类型的处理器组成。opencl由一门用于编写kernels(核函数,在opencl设备上运行的函数)的语言(基于c99)和一组用于定义并控制平台的api组成。

2、传统技术中,gpu硬件执行opencl kernel时,kernel将以线程束为单位执行。gpu线程组构造器即负责把工作组分割为多个线程束,并做任务发射。

3、然而,gpu线程组构造器在处理工作组成为线程束、并做任务发射时,会产生诸多硬件开销,主要集中在构造/释放资源(寄存器等上下文硬件资源)。在传统方案中,对于每个工作组,线程组构造器均需要拆分为多个wave调度到pe(执行单元)中并行执行,并在wave结束后收回资源用于下次的工作组拆分和执行,这会产生频繁的构造/释本文档来自技高网...

【技术保护点】

1.一种工作组处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述通过驱动器确定折叠后的工作组的数量,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述折叠后的所述工作组的数量对初始索引空间进行折叠,得到目标索引空间,包括:

4.根据权利要求1所述的方法,其特征在于,所述通过所述驱动器向编译器发送工作组的折叠信息,包括:

5.根据权利要求4所述的方法,其特征在于,所述通过所述编译器基于所述工作组的折叠信息对所述目标索引空间中的折叠工作组进行展开,包括:

6.根据权利要求5所述的方法,其...

【技术特征摘要】

1.一种工作组处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述通过驱动器确定折叠后的工作组的数量,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述折叠后的所述工作组的数量对初始索引空间进行折叠,得到目标索引空间,包括:

4.根据权利要求1所述的方法,其特征在于,所述通过所述驱动器向编译器发送工作组的折叠信息,包括:

5.根据权利要求4所述的方法,其特征在于,所述通过所述编译器基于所述工作组的折叠信息对所述目标索引空间中的折叠工作组进行展开,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于所述各维度的折叠次数、工作组对应的第一折叠步长以及工作项对应的第二折叠步长,分别对所述目标索引空间中的各折叠后的工作组进行展开,包括:

7.根据权利要求6所述的方法,其特征在于,基于所述初始索引空间中各个维度的工...

【专利技术属性】
技术研发人员:常竹林张淮声
申请(专利权)人:格兰菲智能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1