【技术实现步骤摘要】
集群化图形体系结构中的线程组调遣
[0001]本公开大体涉及数据处理并且更具体地涉及集群化的图形体系结构中的线程组调遣。
技术介绍
[0002]当前的并行图形数据处理包括被开发成对图形数据执行特定操作的系统和方法,这些特定操作诸如例如,线性内插、曲面细分、栅格化、纹理映射、深度测试等。传统意义上而言,图形处理器使用固定功能计算单元来处理图形数据。然而,更最近地,已使图形处理器的多个部分可编程,使得此类处理器能够支持更广泛种类的操作以处理顶点数据和片段数据。
[0003]为了进一步提升性能,图形处理器典型地实现诸如管线化之类的处理技术,这些处理技术尝试贯穿图形管线的不同部分并行地处理尽可能多的图形数据。具有单指令多线程(single instruction,multiple thread,SIMT)体系结构的并行图形处理器被设计成使图形管线中的并行处理的量最大化。在SIMT体系结构中,成组的并行线程尝试尽可能频繁地一起同步地执行程序指令以提高处理效率。可在Shane Cook的“CUDA编程”第3章第37
‑< ...
【技术保护点】
【技术特征摘要】
1.一种装置,包括:多个计算前端CFE集群,用于接收调遣的线程组,所述多个CFE集群至少包括第一CFE集群和第二CFE集群;多个处理资源,与所述多个CFE集群耦合,用于执行线程组内的线程;以及多个缓存集群,用于缓存包括线程组的数据;其中,所述装置用于:接收用于调遣的多个线程组,以及根据调遣操作将所述多个线程组调遣到所述多个CFE集群,所述调遣操作包括将多个线程组调遣到所述第一CFE集群中的多个CFE中的每一个CFE和将多个线程组调遣到所述第二CFE集群中的多个CFE中的每一个CFE。2.如权利要求1所述的装置,其中,所述调遣操作包括以下各项中的至少一项:第一调遣操作,包括从所述多个线程组生成线程组的批次,以用于调遣到所述多个CFE集群的CFE;或者第二调遣操作,包括将所述多个线程组划分为多个单独的线程组流,以用于调遣到所述多个CFE集群的CFE。3.如权利要求2所述的装置,其中,所述第一操作中的所述线程组的批次包括用于调遣到所述第一CFE集群中的每个CFE和调遣到所述第二CFE集群中的每个CFE的一批多个线程组。4.如权利要求2所述的装置,其中,所述多个单独的线程组流至少包括用于调遣到所述第一CFE集群的第一线程组流和用于调遣到所述第二CFE集群的第二线程组流。5.如权利要求4所述的装置,其中,所述第一线程组流包括用于调遣到所述第一CFE集群的每个CFE的多个线程组,并且所述第二线程组流包括用于调遣到所述第二CFE集群的每个CFE的多个线程组。6.如权利要求2所述的装置,进一步包括全局CFE(CFEG),用于根据所述第一调遣操作或所述第二调遣操作中的一个或多个将所述多个线程组调遣到所述多个CFE集群。7.如权利要求1所述的装置,其中,所述多个处理资源包括与所述第一CFE集群耦合的第一多个处理资源和与所述第二CFE集群耦合的第二多个处理资源。8.如权利要求1所述的装置,其中,所述装置包括图形处理单元GPU。9.如权利要求8所述的装置,其中,所述GPU包括多个管芯,所述多个管芯至少包括第一管芯和第二管芯,所述第一管芯包括所述第一CFE集群和所述第一缓存集群,所述第二管芯包括所述第二CFE集群和所述第二缓存集群。10.一种方法,包括:接收多个线程组以用于由图形处理器进行调遣,所述图形处理器包括:用于接收调遣的线程组的多个计算前端CFE集群,与所述多个CFE集群耦合、用于执行线程的多个处理资源,以及用于缓存包括线程组的数据的多个缓存集群;以及根据调遣操作将所述多个线程组调遣到所述多个CFE集群;其中,所述调遣操作包括将多个线程组调遣到所述多个CFE集群中的第一CFE集群中的多个CFE中的每一个CFE和将多个线程组调遣到所述多个CFE集群中的第二CFE集群中的多个CFE中的每一个CFE。
11.如权利要求10所述的方法,其中,根据所述调遣操作将所述多个线程组调遣到所述多个CFE集群包括以下各项中的至少一项:执行第一调遣操作,包括从所述多个...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。