当前位置: 首页 > 专利查询>辉达公司专利>正文

用于在纹理处理管线中执行加速的点采样的技术制造技术

技术编号:31563549 阅读:16 留言:0更新日期:2021-12-25 10:48
本发明专利技术公开了一种用于在纹理处理管线中执行加速的点采样的技术。图形处理单元中的纹理处理管线为计算机生成的场景中的对象生成表面外观。在所述纹理处理管线内的多个阶段,该纹理处理管线确定是否可以以加速的速率处理纹理操作和纹理加载。在包括决策点的每个阶段,所述纹理处理管线假定可以加速当前纹理操作或纹理加载,除非特定的、已知的信息表明无法加速纹理操作或纹理加载。结果,相对于未被加速的纹理操作和纹理加载的数量,所述纹理处理管线增加了被加速的纹理操作和纹理加载的数量。数量。数量。

【技术实现步骤摘要】
用于在纹理处理管线中执行加速的点采样的技术


[0001]各种实施例通常涉及并行处理架构,更具体地,涉及用于在纹理处理管线中执行加速的点采样的技术。

技术介绍

[0002]图形处理单元(GPU)被使用以为各种应用程序生成三维(3D)图形对象和二维(2D)图形对象,其包括故事片、计算机游戏、虚拟现实(VR)和增强型现实(AR)体验、机械设计等。现代GPU包括纹理处理硬件,以生成用于3D图形场景中的3D对象的表面外观(在本文中被称为“表面纹理”)。纹理处理硬件通过“包裹(wrapping)”3D对象周围适当的表面纹理来将表面外观应用于3D对象。生成表面纹理并将其应用于3D对象的过程可为3D图形场景中的那些3D对象提供高度逼真的外观。
[0003]纹理处理硬件被配置为执行各种与纹理有关的指令,包括纹理操作和纹理加载。纹理处理硬件通过生成对纹理存储器的存储器引用(在本文中被称为“查询”)来生成访问纹理信息。纹理处理硬件在变化的情况下,例如在3D图形场景中渲染对象表面以在显示设备上显示时,在渲染2D图形场景时或在计算操作期间,从纹理存储器中检索表面纹理信息。
[0004]表面纹理信息包括用于对3D图形场景中的对象表面进行纹理化或着色的纹理元素(在本文中被称为“纹理像素(texel)”)。优化了纹理处理硬件和相关联的纹理高速缓存,以实现高效、高吞吐量的只读访问,以在图形渲染期间支持对纹理信息的高要求,而很少或不支持写操作。此外,纹理处理硬件包括用于执行各种纹理操作的专用功能单元,例如细节水平(LOD)计算、纹理采样和纹理滤波。
[0005]通常,纹理操作涉及查询3D空间中特定兴趣点周围的多个纹理像素,并且然后执行各种滤波和插值操作以确定该兴趣点的最终颜色。相反,纹理加载通常查询单个纹理像素,并将其直接返回给用户应用程序以进行进一步处理。因为滤波和插值操作通常涉及每个处理线程查询四个或更多个纹理像素,所以通常构造纹理处理硬件以适应每个线程生成多个查询。例如,纹理处理硬件可以被构建为在单个存储周期中容纳多达四个纹理存储器查询。以这种方式,纹理处理硬件能够在一个存储周期中查询和接收大多数或所有所需的纹理信息。
[0006]这种用于查询纹理存储器的方法的缺点为,当将纹理处理硬件用于纹理加载时,在单个存储周期中仅执行四个可能的纹理存储器查询之一。结果,在纹理加载期间仅利用了纹理处理硬件的四分之一的存储器访问能力。此外,某些纹理操作(在本文中被称为点采样的纹理操作)仅需要在给定的存储周期中执行一个或两个纹理存储器查询,因此仅利用了纹理处理硬件的四分之一到二分之一的存储器访问能力。当GPU执行纹理加载和点采样的纹理操作时,纹理处理硬件的这种未充分利用会导致效率和性能下降。
[0007]如前所述,本领域中需要的是用于在图形处理单元中查询纹理信息的更有效的技术。

技术实现思路

[0008]本公开内容的各种实施例阐述了用于访问图形处理单元中的纹理存储器的计算机实现的方法。该方法包括在纹理处理管线的第一阶段,生成纹理存储器查询在纹理处理管线内有资格进行加速的第一确定。该方法还包括基于第一确定,使纹理存储器查询进行到纹理处理管线中的第二阶段。该方法还包括在纹理处理管线中的第二阶段处,生成纹理存储器查询在纹理处理管线内有资格进行加速的第二确定。该方法还包括基于第一确定和第二确定中的至少一个在纹理处理管线内处理纹理存储器查询。
[0009]其他实施例包括但不限于实现所公开技术的一个或更多个方面的系统,以及包括用于执行所公开技术的一个或更多个方面的指令的一个或更多个计算机可读介质。
[0010]相对于现有技术,所公开技术的至少一个技术优势在于,利用所公开的技术,在纹理加载期间和简单的纹理操作期间使用了更大百分比的纹理存储器访问能力。结果,相对于现有方法,在纹理加载和纹理操作期间,提高了纹理处理硬件的效率和性能。所公开技术的另一技术优势是纹理处理硬件包括多个阶段,其用于确定是否可以更有效地使用纹理处理硬件的存储器访问能力。结果,相对于仅在纹理处理硬件的单个阶段进行该确定的方法,更多数量的纹理加载和纹理操作能够利用所公开的技术。这些优势表示相对于现有技术方法的一项或更多项技术改进。
附图说明
[0011]为了可以详细理解各个实施例的上述特征的方式,可以通过参考各种实施例来对以上简要概述的专利技术构思进行更详细的描述,其中在附图中示出了一些实施例。然而,应注意,附图仅示出了本专利技术构思的典型实施例,因此不应视为以任何方式限制范围,并且还有其他等效的实施例。
[0012]图1是被配置为实现各种实施例的一个或更多个方面的计算机系统的框图;
[0013]图2是根据各种实施例的、包括在图1的并行处理子系统中的并行处理单元(PPU)的框图;
[0014]图3A是根据各种实施例的、包括在图2的并行处理单元中的通用处理集群的框图;
[0015]图3B是根据各种实施例的、可以在图2的并行处理单元内实现的图形处理管线的概念图;
[0016]图4是根据各种实施例的、可以配置图3A的通用处理集群内的纹理单元来实现的纹理处理管线的概念图;以及
[0017]图5是根据各种实施例的、用于在纹理处理管线中执行存储器访问操作的方法步骤的流程图。
具体实施方式
[0018]在下面的描述中,阐述了许多具体细节以提供对各种实施例的更透彻的理解。然而,对于本领域技术人员将显而易见的是,可以在没有一个或更多个这些具体细节中的情况下实践本专利技术构思。
[0019]系统总览
[0020]图1是被配置为实现各个实施例的一个或更多个方面的计算机系统100的框图。如
图所示,计算机系统100包括但不限于中央处理单元(CPU)102和经由存储器桥105和通信路径113耦合到并行处理子系统112的系统存储器104。存储器桥105还经由通信路径106耦合到I/O(输入/输出)桥107,并且I/O桥107反过来又耦合到交换机116。
[0021]在操作中,I/O桥107被配置为从诸如键盘或鼠标之类的输入设备108接收用户输入信息,并将输入信息转发给CPU 102,以经由通信路径106和存储器桥105进行处理。交换机116被配置为在I/O桥107和计算机系统100的其他组件(例如,网络适配器118和各种附加卡120和121)之间提供连接。
[0022]同样如图所示,I/O桥107耦合到系统磁盘114,该系统磁盘114可被配置为存储内容和应用程序以及数据,以供CPU 102和并行处理子系统112使用。通常,系统磁盘114提供用于应用程序和数据的非易失性存储,并且可能包括固定或可移动的硬盘驱动器、闪存设备以及CD

ROM(光盘只读存储器)、DVD

ROM(数字通用光盘

ROM)、蓝光、HD

DVD(高清DVD)或其他磁性、光学或固态存储器设备。最后,尽管未明确示出,但是诸如通用串行总线或其他端口连接、光本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于访问图形处理单元中的纹理存储器的计算机实现的方法,所述方法包括:在纹理处理管线中的第一阶段处,生成纹理存储器查询在所述纹理处理管线内有资格进行加速的第一确定;基于所述第一确定,使所述纹理存储器查询进行到所述纹理处理管线中的第二阶段;在所述纹理处理管线中的所述第二阶段处,生成所述纹理存储器查询在所述纹理处理管线内有资格进行加速的第二确定;基于所述第一确定和所述第二确定中的至少一个,在所述纹理处理管线内处理所述纹理存储器查询。2.根据权利要求1所述的计算机实现的方法,其中所述纹理存储器查询与纹理指令相关联,所述纹理指令包括纹理存储器中的单个纹理元素的纹理加载。3.根据权利要求1所述的计算机实现的方法,其中所述纹理存储器查询与纹理指令相关联,所述纹理指令包括与纹理存储器中最接近由所述纹理存储器查询指定的位置的单个纹理元素相关联的纹理操作。4.根据权利要求1所述的计算机实现的方法,其中所述纹理存储器查询与纹理存储器指令相关联,并且所述第一确定基于包括在所述纹理存储器指令中的操作码。5.根据权利要求1所述的计算机实现的方法,其中所述纹理存储器查询与纹理存储器指令相关联,并且所述第一确定基于将所述纹理存储器指令识别为针对纹理存储器中的单个纹理元素的纹理加载的操作码,其中所述单个纹理元素位于由所述纹理存储器查询指定的存储器地址处。6.根据权利要求1所述的计算机实现的方法,其中所述纹理存储器查询与纹理存储器指令相关联,并且所述第一确定或所述第二确定中的至少一个基于将所述纹理存储器指令识别为针对纹理存储器中的单个纹理元素的纹理操作的操作码,其中所述单个纹理元素最接近由所述纹理存储器查询指定的存储器地址。7.根据权利要求1所述的计算机实现的方法,其中所述纹理存储器查询与纹理存储器指令相关联,并且所述第二确定基于与所述纹理存储器指令相关联的头部状态数据或采样器状态数据中的一个或更多个。8.一种或更多种非暂时性计算机可读介质,其存储了程序指令,当所述程序指令由一个或更多个处理器执行时,使所述一个或更多个处理器执行以下步骤:在纹理处理管线中的第一阶段处,生成纹理存储器查询在所述纹理处理管线内有资格进行加速的第一确定;基于所述第一确定,使所述纹理存储器查询进行到所述纹理处理管线中的第二阶段;在所述纹理处理管线中的所述第二阶段处,生成所述纹理存储器查询在所述纹理处理管线内有资格进行加速的第二确定;基于所述第一确定和所述第二确定中的至少一个,在所述纹理处理管线内处理所述纹理存储器查询。9.根据权利要求8所述的一种或更多种非暂时性计算机可读介质,其中所述纹理存储器查询与纹理存储器指令相关联,并且所述第一确定基于包括在所述纹理存储器指令中的操作码。10.根据权利要求8所述的一种或更多种非暂时性计算机可读介质,其中所述纹理存储
器查询与纹理存储器指令相关联,并且所述第一确定基于将...

【专利技术属性】
技术研发人员:M
申请(专利权)人:辉达公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1