基于图形管线中的资源用量来限制着色器制造技术

技术编号:38744096 阅读:21 留言:0更新日期:2023-09-08 23:27
一种处理系统[100],包括执行第一类型的第一着色器[226]和第二类型的第二着色器[234]的图形管线[200]。在一些情况下,该第一着色器是几何着色器并且该第二着色器是像素着色器。该处理系统还包括缓冲器[415],该缓冲器保持由该第一着色器生成的图元并且向该第二着色器提供该图元。该处理系统还包括监测该缓冲器的充溢度的图元集线器[325]。基于该缓冲器的该充溢度来限制波从该第一着色器的发射。着色器处理器输入(SPI)[303]基于来自该图元集线器的指示该充溢度的信号、该图形管线中的几何波和像素波的相对资源用量的指示或该几何波的寿命的指示,来选择性地对由该几何着色器发射的该波进行限制。色器发射的该波进行限制。色器发射的该波进行限制。

【技术实现步骤摘要】
【国外来华专利技术】基于图形管线中的资源用量来限制着色器

技术介绍

[0001]图形处理单元(GPU)实现图形处理管线,该图形处理管线同时处理从命令缓冲器检索的命令的副本。图形管线包括使用图形管线的资源执行的一个或多个着色器以及一个或多个固定功能硬件块。图形管线通常被划分为几何部分,该几何部分对补丁或其他图元(诸如,由顶点和边缘形成并且表示图像的部分的三角形)执行几何操作。几何部分中的着色器可包括顶点着色器、全着色器、域着色器和几何着色器。当由管线的几何部分产生的图元被光栅化(例如,通过一个或多个扫描转换器)以形成表示图像的部分的像素集合时,图形管线的几何部分完成。对像素的后续处理称为像素处理,并且包括由着色器(诸如,使用图形管线的资源执行的像素着色器)执行的操作。GPU和其他多线程处理单元通常实施将多个数据集上的单个程序的多个实例作为单个波同时执行的多个处理元件(其也被称为处理器内核或计算单元)。分级执行模型用于匹配在硬件中实现的分级结构。执行模型限定由所有波(也称为波前、线程、流或工作项)执行的指令的内核。
附图说明
[0002]通过参考附图,本公开被更好地理解,并且其许多特征和优点对于本领域技术人员是显而易见的。在不同附图中使用相同的附图标记表示类似或相同的项目。
[0003]图1是根据一些实施方案的处理系统的框图。
[0004]图2描绘了根据一些实施方案的被配置为提供高阶几何图元的处理以便以预先确定的分辨率生成三维(3D)场景的光栅化图像的图形管线。
[0005]图3是根据一些实施方案的基于不同类型的着色器的资源用量来实现着色器限制的图形管线的部分的框图。
[0006]图4是根据一些实施方案的基于图形管线中的资源用量来选择性地发射几何波的图形管线的部分的框图。
[0007]图5是根据一些实施方案的基于缓冲器充溢度来确定用于选择性地限制几何波的计数器值的方法的流程图。
[0008]图6是根据一些实施方案的基于几何着色器波和像素着色器波的相对资源用量来确定用于选择性地限制几何波的计数器值的方法的流程图。
[0009]图7是根据一些实施方案的基于几何着色器波或其组的寿命来确定用于选择性地限制几何波的计数器值的方法的流程图。
[0010]图8示出了根据一些实施方案的表示在限制几何着色器波之前的“无限制”状态的第一时间间隔。在例示的实施方案中,采样逻辑开始采样。
[0011]图9示出了根据一些实施方案的包括几何着色器波的无限制到限制转变的第二时间间隔。
[0012]图10示出了根据一些实施方案的包括由于来自图元集线器的背压的减小而导致的限制到无限制转变的第三时间间隔。
[0013]图11示出了根据一些实施方案的其中完成了从限制到无限制的转变的第四时间
间隔。
具体实施方式
[0014]着色器(诸如,GPU的图形管线的几何部分中的几何着色器)发射由着色器处理的波。着色器处理的结果被传递到下游实体,诸如管线中的其他着色器。例如,几何着色器波发生器使用贪婪算法来发射波,该贪婪算法尝试使用尽可能多的图形管线的资源。将由几何着色器处理的图元传递到一个或多个扫描转换器,该一个或多个扫描转换器将图元转换为像素以用于在像素着色器中处理。基于用于在一个着色器中处理的贪婪算法来发射波可夺取下游着色器完成其对图元或像素的操作所需的资源。例如,如果几何着色器波发生器发射过多的波并且几何着色器独占图形管线的资源,则像素着色器可能无法访问图形管线的资源以对从扫描转换器接收的像素执行着色。一些图形管线被配置为通过约束可分配给着色器以用于处理波的计算单元的数量来限制飞行中的波的数量。然而,当执行需要较大数量计算单元的绘制调用时,对可用计算单元的数量的静态限制通常降低图形管线的性能。
[0015]图1至图11公开了图形管线的实施方案,该图形管线通过基于由第一着色器和第二着色器消耗的图形管线资源的测量而从第一着色器选择性地发射波,来保持由第一类型的第一着色器和第二类型的第二着色器消耗的资源之间的平衡。在一些实施方案中,第一着色器是几何着色器并且第二着色器是像素着色器。几何着色器基于向扫描转换器提供图元的缓冲器的充溢度以及对几何着色器和像素着色器的资源的相对分配的测量,来选择性地发射几何波。图元集线器监测一组先入先出(FIFO)缓冲器的充溢度,该组FIFO缓冲器从几何着色器接收图元并且向基于所接收的图元生成像素的一组扫描转换器提供图元。图元集线器使用被实现为停顿计数器的停顿信号来限制由几何着色器发射的波,该停顿计数器被递增以指示“死”周期的数量。死周期的数量是基于FIFO缓冲器的至少一个充溢度确定的,并且然后在每个时钟周期处递减。几何着色器响应于具有诸如零的预定值的停顿计数器来发射波。
[0016]图元集线器向着色器处理器输入(SPI)提供指示充溢度的反馈,该SPI基于几何着色器和像素着色器的资源用量来选择性地限制几何着色器波。SPI的一些实施方案确定到飞行中的几何着色器波和飞行中的像素着色器波的本地数据存储(LDS)资源的相对分配、到飞行中的几何着色器波和飞行中的像素着色器波的诸如向量通用寄存器(VGPR)的寄存器的相对分配、或它们的组合。SPI响应于到飞行中的几何着色器波和飞行中的像素着色器波的资源的相对分配超过阈值来使停顿计数器递增,该阈值指示飞行中的几何着色器波正在消耗阻止飞行中的像素着色器波被处理的资源。在一些实施方案中,还基于一个或多个几何着色器组中的几何着色器波的寿命来确定停顿计数器的值,使得如果寿命超过阈值则使停顿计数器递增。
[0017]图1是根据一些实施方案的处理系统100的框图。处理系统100包括或可访问使用非暂态计算机可读介质诸如动态随机存取存储器(DRAM)实现的存储器105或其他存储部件。然而,在一些情况下,存储器105使用其他类型的存储器(包括静态随机存取存储器(SRAM)、非易失性RAM等)来实现。存储器105被称为外部存储器,因为它是在处理系统100中实现的处理单元的外部实现的。处理系统100还包括总线110以支持处理系统100诸如存储
器105中实现的实体之间的通信。处理系统100的一些实施方案包括其他总线、桥接件、交换机、路由器等,其在清楚的情况下未在图1中示出。
[0018]在不同的实施方案中,本文中描述的技术用于多种并行处理器(例如,向量处理器、图形处理单元(GPU)、通用GPU(GPGPU)、非标量处理器、高度并行处理器、人工智能(AI)处理器、推理引擎、机器学习处理器、其他多线程处理单元等)中的任一种处理器。图1示出了根据一些实施方案的并行处理器,特别是图形处理单元(GPU)115的示例。图形处理单元(GPU)115渲染用于在显示器120上呈现的图像。例如,GPU 115渲染对象以产生提供给显示器120的像素值,该显示器使用像素值来显示表示所渲染对象的图像。GPU 115实现并发或并行地执行指令的多个计算单元(CU)121、122、123(本文中统称为“计算单元121至123”)。在一些实施方案中,计算单元121至12本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种装置,包括:图形管线,所述图形管线被配置为执行第一类型的第一着色器和第二类型的第二着色器;至少一个缓冲器,所述至少一个缓冲器被配置为保持由所述第一着色器生成的图元并且向所述第二着色器提供所述图元;和图元集线器,所述图元集线器被配置为监测所述至少一个缓冲器的至少一个充溢度,其中基于所述至少一个充溢度来限制波从所述第一着色器的发射。2.根据权利要求1所述的装置,其中所述第一着色器是几何着色器,其中所述第二着色器是像素着色器,并且其中所述至少一个缓冲器是先入先出(FIFO)缓冲器。3.根据权利要求2所述的装置,还包括:计数器,所述计数器被配置为指示死周期的数量;和着色器处理器输入(SPI),所述SPI被配置为基于所述计数器来选择性地限制由所述几何着色器发射的波。4.根据权利要求3所述的装置,其中所述图元集线器被配置为向所述SPI提供指示所述至少一个充溢度的反馈信号,并且其中基于所述反馈信号来确定死周期的第一数量。5.根据权利要求4所述的装置,其中所述SPI被配置为确定以下中的至少一者:到飞行中的几何着色器波和飞行中的像素着色器波的本地数据存储(LDS)资源的第一相对分配以及到所述飞行中的几何着色器波和所述飞行中的像素着色器波的向量通用寄存器(VGPR)的第二相对分配。6.根据权利要求5所述的装置,其中所述SPI被配置为通过将所述第一相对分配与第一阈值进行比较、将所述第二相对分配与第二阈值进行比较或它们的组合,来确定死周期的第二数量。7.根据权利要求6所述的装置,其中所述SPI被配置为确定由所述几何着色器发射的至少一个波的至少一个寿命,并且基于将所述至少一个寿命与至少一个第三阈值进行比较来确定死周期的第三数量。8.根据权利要求7所述的装置,其中基于死周期的所述第一数量、所述第二数量和所述第三数量中的至少一者来使所述计数器递增,并且其中所述计数器在每个时钟周期处递减。9.根据权利要求8所述的装置,其中所述几何着色器响应于具有预定值的所述计数器来发射波。10.一种方法,包括:在图形管线上执行第一类型的第一着色器和第二类型的第二着色器;在所述图形管线中的图元集线器处监测至少一个缓冲器的至少一个充溢度,所述至少一个缓冲器被配置为保持由所述第一着色器生成的图元并且向所述第二着色器提供所述图元;以及基于所述至少一个充溢度来选择性地限制从所述第一着色器发射的波。11.根...

【专利技术属性】
技术研发人员:尼尚克
申请(专利权)人:超威半导体公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1