当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于利用着色器调用图分析进行光线追踪的装置和方法制造方法及图纸

技术编号:37057952 阅读:12 留言:0更新日期:2023-03-29 19:34
用于改善光线追踪效率的装置和方法。例如,装置的一个实施例包括:一种装置,包括:二进制插桩引擎,用于执行对光线追踪着色器的二进制插桩并用于追踪光线追踪着色器的执行以生成执行度量;调用图构造逻辑,用于基于执行度量构造着色器调用图;着色器源映射逻辑,用于将着色器调用图映射到着色器源代码以生成源代码图;效率分析逻辑,用于基于源代码图确定光线追踪着色器执行中的低效率;以及优化逻辑,用于基于低效率标识优化动作。用于基于低效率标识优化动作。用于基于低效率标识优化动作。

【技术实现步骤摘要】
用于利用着色器调用图分析进行光线追踪的装置和方法
[0001]背景


[0002]本专利技术总体上涉及图形处理器领域。更具体地,本专利技术涉及用于利用 着色器调用图分析进行光线追踪的装置和方法。

技术介绍

[0003]光线追踪是在其中通过基于物理的渲染来模拟光传输的技术。尽管在 电影渲染中广泛使用,但是直到仅仅几年前,人们认为其对于实时执行是 过于资源密集型的。光线追踪中的关键操作之一是处理对光线

场景相交的 可见性查询,被称为“光线遍历”,“光线遍历”通过遍历包围体层次体系 (bounding volume hierarchy,BVH)中的节点并使该节点相交来计算光线
‑ꢀ
场景相交。
[0004]栅格化是其中屏幕对象是从由三角形网格创建的对象的3D模型创建 的技术。每个三角形的顶点与具有不同形状和大小的其他三角形的顶点相 交。每个顶点在空间中都有一位置以及关于颜色、纹理及其法线的信息, 该信息用于确定对象的表面正面向的方向。栅格化单元将3D模型的三角形 转换为2D屏幕空间中的像素,并且可以基于顶点数据为每个像素指派初始 颜色值。
附图说明
[0005]结合以下附图,从以下具体实施方式可获得对本专利技术更好的理解,其 中:
[0006]图1是具有处理器的计算机系统的实施例的框图,该处理器具有一个 或多个处理器核心和图形处理器;
[0007]图2A

图2D图示由本专利技术的实施例提供的计算系统和图形处理器;
[0008]图3A

图3C图示附加的图形处理器和计算加速器体系结构的框图;
[0009]图4是用于图形处理器的图形处理引擎的实施例的框图;
[0010]图5A

B图示包括处理元件的阵列的线程执行逻辑;
[0011]图6是包括处理元件的阵列的线程执行逻辑的框图;
[0012]图7图示根据实施例的图形处理器执行单元指令格式;
[0013]图8是图形处理器的另一实施例的框图,该图形处理器包括图形管线、 媒体管线、显示引擎、线程执行逻辑以及渲染输出管线;
[0014]图9A是图示根据实施例的图形处理器命令格式的框图;
[0015]图9B是图示根据实施例的图形处理器命令序列的框图;
[0016]图10图示根据实施例的用于数据处理系统的示例性图形软件体系结 构;
[0017]图11A图示根据实施例的可用于制造集成电路以执行操作的示例性IP 核心开发系统;
[0018]图11B

图11D图示包括小芯片和中介层衬底的示例性封装布置;
[0019]图12图示根据实施例的可使用一个或多个IP核心来制造的示例性片 上系统集成电路;
[0020]图13图示可以使用一个或多个IP核心来制造的片上系统集成电路的 示例性图形处理器;
[0021]图14图示可使用一个或多个IP核心来制造的片上系统集成电路的附 加示例性图形处理器;
[0022]图15图示用于执行机器学习体系结构的初始训练的体系结构;
[0023]图16图示如何在运行时期间持续地训练并更新机器学习引擎;
[0024]图17图示如何在运行时期间持续地并更新训练机器学习引擎;
[0025]图18A

图18B图示如何在网络上共享机器学习数据;以及
[0026]图19图示用于训练机器学习引擎的方法;
[0027]图20图示节点如何交换虚假(ghost)区域数据以执行分布式降噪操作;
[0028]图21图示在其中跨多个节点分布图像渲染和降噪操作的体系结构;
[0029]图22图示用于分布式渲染和降噪的体系结构的附加细节;
[0030]图23图示用于执行分布式渲染和降噪的方法;
[0031]图24图示机器学习方法;
[0032]图25图示多个经互连的通用图形处理器;
[0033]图26图示用于机器学习实现的卷积层和全连接层的集合;
[0034]图27图示卷积层的示例;
[0035]图28图示机器学习实现中经互连的节点的集合的示例;
[0036]图29图示在其中神经网络使用训练数据集进行学习的训练框架;
[0037]图30A图示模型并行性和数据并行性的示例;
[0038]图30B图示片上系统(system on a chip,SoC);
[0039]图31图示处理体系结构,该处理体系结构包括光线追踪核心和张量核 心;
[0040]图32图示光束的示例;
[0041]图33图示用于执行光束追踪的装置;
[0042]图34图示光束层次体系的示例;
[0043]图35图示用于执行光束追踪的方法;
[0044]图36图示分布式光线追踪引擎的示例;
[0045]图37

图38图示在光线追踪系统中执行的压缩;
[0046]图39图示在光线追踪体系结构构上实现的方法;
[0047]图40图示示例性混合式光线追踪装置;
[0048]图41图示用于光线追踪操作的栈;
[0049]图42图示混合式光线追踪装置的附加细节;
[0050]图43图示包围体层次体系;
[0051]图44图示调用栈和遍历状态存储;
[0052]图45图示用于遍历和相交的方法;
[0053]图46A

图46B图示如何需要多个调遣周期来执行某些着色器;
[0054]图47图示单个调遣周期如何执行多个着色器;
[0055]图48图示单个调遣周期如何执行多个着色器;
[0056]图49图示用于执行光线追踪指令的体系结构;
[0057]图50图示用于在线程内执行光线追踪指令的方法;
[0058]图51图示用于异步光线追踪的体系结构的一个实施例;
[0059]图52A图示光线遍历电路的一个实施例;
[0060]图52B图示在一个实施例中执行的用于管理光线存储区块的进程;
[0061]图53图示优先级选择电路/逻辑的一个实施例;
[0062]图54和图55A

图55B图示在本专利技术的一个实施例中使用的不同类型 的光线追踪数据,包括标志、异常和剔除数据;
[0063]图56图示用于确定光线追踪管线早出(early out)的一个实施例;
[0064]图57图示优先级选择电路/逻辑的一个实施例;
[0065]图58图示用于光线遍历操作的示例包围体层次体系(BVH);
[0066]图59A

59B图示附加的遍历操作;
[0067]图60图示用于管理BVH栈的栈管理电路的一个实施例;
[0068]图61A

图61B图示示例数据结构、子结构和对光线、命本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种方法,包括:执行对光线追踪着色器的二进制插桩;追踪所述光线追踪着色器的执行以生成执行度量;基于所述执行度量构造着色器调用图;将所述着色器调用图映射到着色器源代码以生成源代码图;基于所述源代码图确定光线追踪着色器执行中的低效率;以及基于所述低效率标识优化动作。2.如权利要求1所述的方法,其中,构造所述着色器调用图进一步包括:将所述执行度量与光线追踪着色器的着色器记录相关联。3.如权利要求2所述的方法,其中,构造所述着色器调用图进一步包括:将所述着色器记录映射到主光线。4.如权利要求1至3中任一项所述的方法,进一步包括:将所述执行度量转换为性能数据;以及使用所述性能数据构造所述着色器调用图。5.如示例1至4中任一项所述的方法,其中,将所述着色器调用图映射到着色器源代码进一步包括:确定二进制代码范围与所述源代码之间的源

行映射;以及使用所述源

行映射将追踪点映射到所述源代码。6.如示例1至5中任一项所述的方法,其中,确定光线追踪着色器执行中的低效率包括:标识第一处理资源分配,所述第一处理资源分配比第二处理资源分配负荷更重。7.如权利要求6所述的方法,其中,所述第一处理资源分配包括第一双子切片DSS,并且所述第二处理资源分配包括第二DSS。8.如权利要求7所述的方法,其中,响应于所述着色器调用图指示高于阈值的终止主光线的数量,所确定的低效率包括由于早期光线终止而导致的不平衡,并且所述优化动作包括减少经由未命中着色器在早期终止的光线的数量。9.如权利要求1至8中任一项所述的方法,其中,确定光线追踪着色器执行中的低效率包括针对特定着色器记录的低SIMD占用,并且所述优化动作包括:切割较长的调用路径以增加时间上的调用局部性,或改变光线投射模式以增加相对于调遣片的局部性。10.如权利要求9所述的方法,其中,所述优化动作中的一个优化动作是基于分析所述着色器调用图而被选择的。11.一种装置,包括:二进制插桩引擎,用于执行对光线追踪着色器的二进制插桩,并用于追踪所述光线追踪着色器的执行以生成执行度量;调用图构造逻辑,用于基于所述执行度量构造着色器调用图;着色器源映射逻辑,用于将所述着色器调用图映射到着色器源代码以生成源代码图;效率分析逻辑,用于基于所述源代码图确定光线追踪着色器执行中的低效率;以及优化逻辑,用于基于所述低效率标识优化动作。12.如权利要求11所述的装置,其中,为了构造所述着色器调用图,所述调用图构造逻辑用于将执行度量与光线追踪着色器的着色器记录相关联。
13.如权利要求例12所述的装置,其中,为了构造所述着色器调用图,所述调用图构造逻辑用于将所述着色器记录映射到主光线。14.如权利要求11至13中任一项所述的装置,其中,所述二进制...

【专利技术属性】
技术研发人员:S
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1