可编程光线追踪架构上的命中和交叉着色器的推测性执行制造技术

技术编号：24857588 阅读：46 留言：0更新日期：2020-07-10 19:10

用于在可编程光线追踪架构上的命中和交叉着色器的推测性执行的装置和方法。例如，装置的一个实施例包括：用于执行着色器的单指令多数据(SIMD)或单指令多线程(SIMT)执行单元(EU)；以及用于执行光线遍历线程的光线追踪电路，该光线追踪引擎包括：遍历/交叉电路，其响应于遍历线程而使光线遍历通过包括多个分层布置的节点的加速数据结构，以及将光线与节点中的至少一个内包含的基元交叉；以及着色器推迟电路，其用于推迟并聚合由遍历线程产生的多个着色器调用，直到特定的触发事件被检测到为止，其中在检测到触发事件时，多个着色器在单个着色器批中被分派到EU上。

全部详细技术资料下载

【技术实现步骤摘要】
可编程光线追踪架构上的命中和交叉着色器的推测性执行
本专利技术总体上涉及图形处理器领域。更具体地，本专利技术涉及用于执行更高效的光线追踪操作的装置和方法。
技术介绍
光线追踪是一种通过基于物理的渲染来对光传输进行仿真的技术。该技术广泛用于电影渲染，直到几年前，光线追踪被认为对于实时性能而言太过资源密集。光线追踪中的关键操作中的一个是处理针对称为“光线遍历”的光线场景交叉的可见性查询，其通过对包围体积层级(BVH)中的节点进行遍历和交叉来计算光线场景交叉。去噪已成为对平滑无噪声图像进行实时光线追踪的关键特征。渲染可以跨多个设备上的分布式系统完成，但是到目前为止，现有的去噪框架都对单个机器上的单个实例进行操作。如果正在跨多个设备进行渲染，则这些设备可能不具有可用于计算图像的经去噪的部分的所有经渲染的像素。附图说明根据下面的具体实施方式结合附图，可以获得对本专利技术更好的理解，其中：图1是具有处理器的计算机系统的实施例的框图，该处理器具有一个或多个处理器核心和图形处理器；图2是处理器...

【技术保护点】
1.一种装置，包括：/n用于执行着色器的单指令多数据(SIMD)或单指令多线程(SIMT)执行单元(EU)；以及/n用于执行光线遍历线程的光线追踪电路，光线追踪引擎包括：/n遍历/交叉电路，其响应于所述遍历线程而使光线遍历通过包括多个分层布置的节点的加速数据结构，以及将所述光线与所述节点中的至少一个内包含的基元交叉；以及/n着色器推迟电路，其用于推迟并聚合由所述遍历线程产生的多个着色器调用，直到特定的触发事件被检测到为止，/n其中，在检测到所述触发事件时，所述多个着色器在单个着色器批中被分派到所述EU上。/n

【技术特征摘要】
20181228 US 16/236,1761.一种装置，包括：
用于执行着色器的单指令多数据(SIMD)或单指令多线程(SIMT)执行单元(EU)；以及
用于执行光线遍历线程的光线追踪电路，光线追踪引擎包括：
遍历/交叉电路，其响应于所述遍历线程而使光线遍历通过包括多个分层布置的节点的加速数据结构，以及将所述光线与所述节点中的至少一个内包含的基元交叉；以及
着色器推迟电路，其用于推迟并聚合由所述遍历线程产生的多个着色器调用，直到特定的触发事件被检测到为止，
其中，在检测到所述触发事件时，所述多个着色器在单个着色器批中被分派到所述EU上。

2.根据权利要求1所述的装置，其中，所述触发事件包括特定时间事件或处理事件。

3.根据权利要求1或2所述的装置，还包括：
调度器，其响应于所述触发事件而在所述EU上分派所述单个着色器批。

4.根据权利要求1或2所述的装置，其中，所述遍历线程将被挂起，等待在所述EU上执行的所述着色器批的执行结果，其中，在所述遍历线程被挂起时维护所述遍历线程的第一遍历上下文。

5.根据权利要求4所述的装置，其中，所述着色器推迟电路基于所述多个着色器调用与所述第一遍历上下文相关联而聚合所述多个着色器调用。

6.根据权利要求1或5所述的装置，还包括：
着色器调用剔除电路，其用于在确定所述多个着色器调用中的一个或多个不必要时，剔除所述多个着色器调用中的一个或多个，其中，在没有一个或多个经剔除的着色器调用的情况下，所述单个着色器批被分派。

7.根据权利要求1或5所述的装置，其中，在所述EU上执行的主要光线着色器线程产生所述遍历线程。

8.根据权利要求1或5所述的装置，还包括：
分类电路，其用于重新分组与所述单个着色器批相关联的数据，以增加由所述执行单元执行的SIMD和/或SIMT操作的占用。

9.根据权利要求1或5所述的装置，其中，推迟并聚合多个着色器调用包括将数据条目存储在存储器中的列表或表结构中，所述列表或表包括针对每个着色器的至少一个条目，每个条目可用于标识执行对应的着色器所要求的着色器数据和/或程序代码。

10.一种方法，包括：
在单指令多数据(SIMD)或单指令多线程(SIMT)执行单元(EU)上执行着色器；
在光线追踪引擎上执行光线遍历线程；
响应于所述遍历线程而使光线遍历通过包括多个分层布置的节点的加速数据结构；
将所述光线与所述节点中的至少一个内包含的基元交叉；
推迟并聚合由所述遍历线程产生的多个着色器调用，直到特定的触发事件被检测到为止，
在检测到所述触发事件时，在单个着色器批中将所述多个着色器分派到所述EU上。

11.根据权利要求10所述的方法，其中，所述触发事件包括特定时间事件或处理事件。

12.根据权利要求10或11所述的方法，还包括：
响应于所述触发事件而在所述EU上分派所述单个着色器批。
<...

【专利技术属性】
技术研发人员：G·力克托尔，K·维迪雅纳坦，J·阿姆斯特茨，A·桑原，M·多伊尔，T·施鲁斯勒，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人