图形处理单元纹理采样器操作的无序执行制造技术

技术编号：37057909 阅读：15 留言：0更新日期：2023-03-29 19:34

图形处理单元纹理采样器操作的无序执行。本文中描述的实施例一般针对促进GPU纹理采样器操作的无序执行。一种GPU的纹理采样器，其维护：（i）延迟队列，其可操作以存储关于与多个纹理采样器操作中的每个纹理采样器操作相关联的事务的集合的信息，以及（ii）多个虚拟通道（VC）队列，每个虚拟通道队列可操作以存储关于每次相应的单个纹理采样器操作的事务的信息。通过利用延迟队列和VC队列来促进纹理采样器操作的无序处理。例如，在事务处理间隔期间，对于与VC队列中的每个VC队列相关联的事务，可以确定高速缓存中的数据的可用性。可以基于确定的数据的可用性来选择VC队列。然后可以处理与选择的VC队列的头部相关联的事务。选择的VC队列的头部相关联的事务。选择的VC队列的头部相关联的事务。

全部详细技术资料下载

【技术实现步骤摘要】
图形处理单元纹理采样器操作的无序执行

[0001]本文中所描述的实施例一般地涉及图形处理单元（GPU）的领域，并且更特别地涉及GPU纹理采样器操作的无序执行。

技术介绍

[0002]纹理采样器操作在三维（3D）图形中被大量使用，并且通常这样的操作的延迟（latency）对整体工作负载性能有显著影响。传统上，由于纹理采样器操作的长度可变性，纹理采样器单元实现有序流水线（pipeline），因此使得该流水线对系统延迟增加非常敏感。随着GPU的3D流水线在大小和复杂性方面的增加，存储器操作的延迟通常增加，尤其是在高速缓存层级中未命中的情况下。
附图说明
[0003]这里所述的实施例通过示例的方式而非通过限制的方式在附图的图中来说明，其中相似的参考编号指代相似的元件。
[0004]图1是根据实施例的处理系统的框图。
[0005]图2A
‑
2D图示了根据一些实施例的计算系统和图形处理器。
[0006]图3A
‑
3C图示了根据一些实施例的附加图形处理器和计算加速器架构的框图。
[0007]图4是根据一些实施例的图形处理器的图形处理引擎的框图。
[0008]图5A
‑
5B图示了根据一些实施例的包括图形处理器核中采用的处理元件的阵列的线程执行逻辑。
[0009]图6图示了根据实施例的附加执行单元。
[0010]图7是图示根据一些实施例的图形处理器指令格式的框图。
[0011]图8是图形处理器的另一实施...

【技术保护点】

【技术特征摘要】
1.一种图形处理单元（GPU），包括：1级（L1）高速缓存；以及纹理采样器，其耦合到L1高速缓存，包括（i）延迟队列，其可操作以存储关于与多个纹理采样器操作中的每个纹理采样器操作相关联的事务的集合的信息，以及（ii）多个虚拟通道（VC）队列，每个虚拟通道队列可操作以存储关于每次相应的单个纹理采样器操作的事务的信息，其中纹理采样器可操作以在事务处理间隔期间，通过以下步骤来促进多个纹理采样器操作的无序处理：对于与多个VC队列中的每个VC队列相关联的事务，确定与纹理采样器相关联的L1高速缓存中的数据的可用性；基于所确定的数据的可用性来选择多个VC队列中的VC队列；以及处理与所选择的VC队列的头部相关联的事务。2.根据权利要求1所述的GPU，其中纹理采样器进一步可操作以：将关于与延迟队列的头部相关联的事务的信息出列，所述延迟队列的头部是与多个纹理采样器操作中的特定纹理采样器操作相关联的事务的集合的一部分；以及将关于事务的信息入列在当前存储关于与特定纹理采样器操作相关联的事务的信息的多个VC队列的VC队列的尾部处。3.根据权利要求1或2所述的GPU，其中纹理采样器进一步可操作以继续处理与所选择的VC队列的头部相关联的后续事务，直到相应的单个纹理采样器操作的所有的事务已经完成。4.根据权利要求1或2所述的GPU，其中所述基于所确定的数据的可用性来选择多个VC队列中的VC队列包括确定数据在L1高速缓存中对于与所选择的VC队列相关联的至少阈值数量的事务是可用的。5.根据权利要求1或2所述的GPU，其中阈值数量是8。6.根据权利要求1或2所述的GPU，其中所述基于所确定的数据的可用性来选择多个VC队列中的VC队列包括将多个VC队列中的特定VC队列优先于所述多个VC队列中的另一个VC队列，所述特定VC队列包含关于表示相应的单个纹理采样器操作的所有事务的事务的信息，所述另一个VC队列包含关于表示相应的单个纹理采样器操作的少于所有事务的事务的信息。7.根据权利要求1或2所述的GPU，其中所述多个VC队列包括每32个线程8个VC队列。8.根据权利要求1或2所述的GPU，其中所述多个VC队列中的每个VC队列包括16个条目。9.一种方法，包括：在图形处理单元的纹理采样器内维护：（i）延迟队列，其可操作以存储关于与多个纹理采样器操作中的每个纹理采样器操作相关联的事务的集合的信息，以及（ii）多个虚拟通道（VC）队列，每个虚拟通道队列可操作以存储关于每次相应的单个纹理采样器操作的事务的信息；在事务处理间隔期间，通过以下步骤来促进多个纹理采样器操作的无序处理：对于与多个VC队列中的每个VC队列相关联的事务，确定与纹理采样器相关联的高速缓存中的数据的可用性；基于所确定的数据的可用性来选择多个VC队列中的VC队列；以及
处理与所选择的VC队列的头部相关联的事务。10.根据权利要求9所述的方法，进一步包括在事务处理间隔期间：将关于与延迟队列的头部相关联的事务的信息出列，所述延迟队列的头部是与多个纹理采样器操作中的特定纹理采样器操作相关联的事务的集合的一部分；以及将关于事务的信息入列在当前存储关于与特定纹理采样器操作相关联的事务的信息的多个VC队列的VC队列的尾部处...

【专利技术属性】
技术研发人员：C，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人