【技术实现步骤摘要】
【国外来华专利技术】多加速器计算调度
[0001]相关申请的交叉引用
[0002]本申请要求
2021
年3月
31
日提交的名称为
″
MULTI
‑
ACCELERATOR COMPUTE DISPATCH
″
的待审美国非临时专利申请号
17/218,421
的权益,其全部内容据此以引用方式并入本文
。
技术介绍
[0003]通用计算着色器是执行高度可并行化工作负载的一种日益流行的方式
。
对通用计算着色器的改进正在持续进行
。
附图说明
[0004]可以从以下描述中获得更详细的理解,通过示例结合附图给出,其中:
[0005]图1是可实现本公开的一个或多个特征的示例设备的框图;
[0006]图2是图1的设备的框图,示出了附加的细节;
[0007]图3是根据示例的加速处理设备的各方面的框图,示出了由多个小芯片执行命令队列中的命令;
[0008]图4是示出用于跨小芯片协作地执行内核的示例性操作集合的框图;以及
[0009]图5是根据示例的用于跨多个小芯片执行内核的方法的流程图
。
具体实施方式
[0010]本专利技术提供了用于由多个小芯片执行计算工作的技术
。
该技术包括:将内核调度分组的工作组分配给该小芯片;由每个小芯片执行分配给该小芯片的该工作组;针对每个小芯片,在该内核调度分组的分配给该小芯片的所有工作组完成时,通知其 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.
一种用于由多个小芯片执行计算工作的方法,所述方法包括:将内核调度分组的工作组分配给所述小芯片;由每个小芯片执行分配给所述小芯片的所述工作组;在所述内核调度分组的分配给所述小芯片的所有工作组完成时,由每个小芯片通知其他小芯片此类完成;以及在所述内核调度分组的所有工作组完成时,由所述多个小芯片中的小芯片通知客户端此类完成,并且继续进行后续内核调度分组
。2.
根据权利要求1所述的方法,其中每个小芯片被分配所述内核调度分组的不同的互相排斥的工作组集合
。3.
根据权利要求1所述的方法,其中分配给每个小芯片的所述工作组以预先指定的方式分配
。4.
根据权利要求1所述的方法,其中通知所述其他小芯片此类完成包括广播计数器
。5.
根据权利要求4所述的方法,其中所述计数器是对通过硬件命令队列的进展的指示
。6.
根据权利要求1所述的方法,其中通知所述客户端由所述多个小芯片中被指定为通知器小芯片的一个小芯片执行
。7.
根据权利要求1所述的方法,其中所述内核调度分组和所述后续内核调度分组存储在所述多个小芯片中的每个小芯片的硬件命令队列中
。8.
根据权利要求1所述的方法,其中将内核调度分组的工作组分配给所述小芯片以及通知所述其他小芯片此类完成由所述多个小芯片中的每个小芯片的命令处理器执行
。9.
根据权利要求1所述的方法,还包括:通过确定已经从所述多个小芯片中的每个小芯片接收到通知来确定所述内核调度分组的所有工作组都已完成,其中所述通知指示小芯片已经完成所述内核调度分组的所有工作组
。10.
一种小芯片,包括:计算单元,所述计算单元被配置为执行工作组;以及命令处理器,所述命令处理器被配置为:识别分配给所述小芯片的内核调度分组的工作组;使得所述计算单元执行分配给所述小芯片的所述工作组;在所述内核调度分组的分配给所述小芯片的所有工作组完成时,通知多个小芯片中的其他小芯片此类完成;以及在所述内核调度分组的分配给所述多个小芯片中的所有小芯片的所有工作组完成时,通知客户端此类完成并且继续处理后续内核调度分组的工作组
。11.
根据权利要求
10
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。