当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于压缩光线追踪加速结构构建数据的装置和方法制造方法及图纸

技术编号:32432837 阅读:23 留言:0更新日期:2022-02-24 18:52
用于在光线追踪实现中压缩加速结构构建数据的装置和方法。例如,一种装置的一个实施例包括:穿过硬件逻辑,其用于穿过穿过包括多个图元的图形场景的光线;加速数据结构处理单元,包括:边界框压缩器,其用于压缩一组边界框以生成多个边界框压缩块,以及索引压缩器,其用于压缩一组索引以生成多个索引压缩块,以及用于基于边界框压缩块和索引压缩块来构造加速结构的加速数据结构构建器。速结构的加速数据结构构建器。速结构的加速数据结构构建器。

【技术实现步骤摘要】
用于压缩光线追踪加速结构构建数据的装置和方法
[0001]相关申请的交叉引用
[0002]本申请要求于2020年8月17日提交的共同未决美国临时申请第 63/066,799号的权益,该申请全文通过引用并入本文。


[0003]概括而言,本专利技术涉及图形处理器领域。更具体地,本专利技术涉及一种 用于压缩光线追踪加速结构构建数据的装置和方法。

技术介绍

[0004]光线追踪是一种通过基于物理的渲染来模拟光传输的技术。它广泛用 于电影渲染,直到几年前,它还被认为对实时性能来说过于占用资源。光 线追踪中的关键操作之一是处理称为“光线穿过(ray traversal)”的光线场 景相交的可见性查询,它通过穿过边界体积层次结构(BVH)以及与BVH中 的节点相交来计算光线场景相交。
附图说明
[0005]结合以下附图,可以通过下面的详细描述更好地理解本专利技术,其中:
[0006]图1是带有具有一个或多个处理器核和图形处理器的处理器的计算机 系统的实施例的框图;
[0007]图2A

2D图示了由本专利技术的实施例提供的计算系统和图形处理器;
[0008]图3A

3C图示了附加图形处理器和计算加速器架构的框图;
[0009]图4是用于图形处理器的图形处理引擎的实施例的框图;
[0010]图5A

5B图示了包括处理元件阵列的线程执行逻辑;
[0011]图6是包括处理元件阵列的线程执行逻辑的框图;
[0012]图7图示了根据实施例的图形处理器执行单元指令格式;
[0013]图8是包括图形管线、媒体管线、显示引擎、线程执行逻辑和渲染输 出管线的图形处理器的另一实施例的框图;
[0014]图9A是图示根据实施例的图形处理器命令格式的框图;
[0015]图9B是图示根据实施例的图形处理器命令序列的框图;
[0016]图10图示了根据实施例的用于数据处理系统的示例性图形软件架构;
[0017]图11A示出了根据实施例的可用于制造集成电路以执行操作的示例性 IP核开发系统;
[0018]图11B

11D示出了包括小芯片和中介层基板的示例性封装布置;
[0019]图12图示了根据实施例的可以使用一个或多个IP核制造的示例性片 上系统集成电路;
[0020]图13图示了可以使用一个或多个IP核制造的片上系统集成电路的示 例性图形处理器;
[0021]图14图示了可以使用一个或多个IP核制造的片上系统集成电路的附 加示例性图形处理器;
[0022]图15图示了用于执行机器学习架构的初始训练的架构;
[0023]图16图示了机器学习引擎如何在运行时期间持续被训练和更新;
[0024]图17图示了机器学习引擎如何在运行时期间被持续训练和更新;
[0025]图18A

18B图示了机器学习数据如何在网络上共享;以及
[0026]图19图示了用于训练机器学习引擎的方法;
[0027]图20图示了节点如何交换重影区域数据以执行分布式去噪操作;
[0028]图21图示了跨多个节点分布图像渲染和去噪操作的架构;
[0029]图22图示了用于分布式渲染和去噪的架构的附加细节;
[0030]图23图示了用于执行分布式渲染和去噪的方法;
[0031]图24图示了机器学习方法;
[0032]图25图示了多个互连的通用图形处理器;
[0033]图26图示了用于机器学习实现的一组卷积层和全连接层;
[0034]图27图示了卷积层的示例;
[0035]图28图示了机器学习实现中的一组互连节点的示例;
[0036]图29图示了训练框架,在该框架中神经网络使用训练数据集进行学习;
[0037]图30A图示了模型并行性和数据并行性的示例;
[0038]图30B图示了片上系统(SoC);
[0039]图31图示了包括光线追踪核和张量核的处理架构;
[0040]图32图示了光束的示例;
[0041]图33图示了用于执行光束追踪的装置;
[0042]图34图示了光束层次结构的示例;
[0043]图35图示了用于执行光束追踪的方法;
[0044]图36图示了分布式光线追踪引擎的示例;
[0045]图37

38图示了在光线追踪系统中执行的压缩;
[0046]图39图示了在光线追踪架构上实现的方法;
[0047]图40图示了示例性混合光线追踪装置;
[0048]图41图示了用于光线追踪操作的堆栈;
[0049]图42图示了混合光线追踪装置的附加细节;
[0050]图43图示了边界体积层次结构;
[0051]图44图示了调用栈和穿过状态存储装置;
[0052]图45图示了一种用于穿过和相交的方法;
[0053]图46A

46B图示了如何需要多个分派周期来执行某些着色器;
[0054]图47图示了单个分派周期如何执行多个着色器;
[0055]图48图示了单个分派周期如何执行多个着色器;
[0056]图49图示了用于执行光线追踪指令的架构;
[0057]图50图示了用于在线程内执行光线追踪指令的方法;
[0058]图51图示了用于异步光线追踪的架构的一个实施例;
[0059]图52A图示了光线穿过电路的一个实施例;
[0060]图52B图示了在一个实施例中执行以管理光线存储库(storage bank) 的过程;
[0061]图53图示了优先级选择电路/逻辑的一个实施例;
[0062]图54和图55A

55B图示了在本专利技术的一个实施例中使用的不同类型的 光线追踪数据,包括标志、异常和剔除数据;
[0063]图56图示了用于确定光线追踪管线的早期退出(early out)的一个实 施例;
[0064]图57图示了优先级选择电路/逻辑的一个实施例;
[0065]图58图示了用于光线穿过操作的示例边界体积层次结构(BVH);
[0066]图59A

59B图示了附加的穿过操作;
[0067]图60图示了用于管理BVH堆栈的堆栈管理电路的一个实施例;
[0068]图61A

61B图示了示例数据结构、子结构和针对光线、命中和堆栈执 行的操作;
[0069]图62图示了具有N位比较操作掩码的细节级别选择器的实施例;
[0070]图63图示了根据本专利技术的一个实施例的加速数据结构;
[0071]图64图示了包括残差值和元数据的压缩块的一个实施例;
[0072]图65图示了根据本专利技术的一个实施例的方法;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种装置,包括:穿过硬件逻辑,其用于将光线穿过包括多个图元的图形场景;以及加速数据结构处理单元,其包括:边界框压缩器,其用于压缩一组边界框以生成多个边界框压缩块,索引压缩器,其用于压缩一组索引以生成多个索引压缩块,以及加速数据结构构建器,其用于处理所述边界框压缩块和索引压缩块以生成加速数据结构。2.如权利要求1所述的装置,其中,所述加速数据结构包括边界体积层次结构(BVH),所述边界体积层次结构(BVH)将由所述穿过硬件逻辑使用以将所述光线穿过所述图形场景,所述BVH的边界框被存储为包括所述多个图元的层次结构表示的多个轴对齐边界框(AABB)。3.如权利要求2所述的装置,其中,所述边界框压缩器用于使用增量压缩来将所述边界框中的第一多个边界框压缩在第一边界框压缩块中,并且所述索引压缩器用于使用增量压缩来将所述索引中的第一多个索引压缩在第一索引压缩块中。4.如权利要求3所述的装置,其中,所述第一多个边界框以序列被压缩到所述第一边界框压缩块,并且其中,增量压缩包括:确定当前边界框的值与被压缩到所述第一边界框压缩块的先前边界框的值之间的一个或多个差,以及将所述一个或多个差作为第一残差值存储在所述边界框压缩块中。5.如权利要求4所述的装置,其中,所述第一多个索引以序列被压缩到所述第一索引压缩块,并且其中,增量压缩包括:确定当前索引值与被压缩到所述第一索引压缩块的先前索引值之间的一个或多个差,以及将所述一个或多个差作为第二残差值存储在所述索引压缩块中。6.如权利要求5所述的装置,其中,所述第一边界框压缩块还包括:第一元数据,其用于指示被压缩在所述第一边界框压缩块中的边界框的数量,以及第一残差大小矢量,其用于指示所述第一边界框压缩块中的每个残差值的位长度,其中,所述第一索引压缩块还包括:第二元数据以及第二残差大小矢量,所述第二元数据用于指示被压缩在所述第一索引压缩块中的索引的数量,所述第二残差大小矢量用于指示包括所述第二残差值的所述第一索引压缩块中每个残差值的位长。7.如权利要求6所述的装置,其中,被压缩到所述边界框压缩块的边界框值包括整数边界框值,所述装置还包括:量化硬件逻辑,其用于将原始单精度浮点边界框值量化为整数边界框值。8.如权利要求7所述的装置,还包括:变换硬件逻辑,其用于将所述整数边界框值重新排列为数据格式以改进增量压缩。9.如权利要求6至8中任一项所述的装置,其中,所述索引压缩器还包括:索引转换器,其用于将每个索引值转换为第一值和第二值,所述第一值标识边界框压缩块,所述第二值针对与所述索引值相关联的边界框指示残差值或残差值集合在所述边界框压缩块中的位置。10.如权利要求9所述的装置,其中,所述第二值包括到所述边界框压缩块中的偏移或位字段中的位值。
11.如权利要求10所述的装置,其中,如果所述第二值包括到所述边界框压缩块中的偏移,则所述索引转换器实现块偏移索引(BOI)以生成所述偏移,并且如果所述第二值包括位字段中的位值,则所述索引转换器实现层次结构位矢量索引(HBI)。12.如权利要求1至11中任一项所述的装置,其中,所述加速数据结构处理单元还包括:索引解压缩器,其用于对所述索引压缩块进行解压缩;以及边界框解压缩器,其用于对所述边界框压缩块进行解压缩以生成对应的边界框。13.一种方法,包括:压缩构建数据以用于构建加速数据结构,所述构建数据包...

【专利技术属性】
技术研发人员:M
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1