当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于光线追踪架构中的负载平衡的方法和装置制造方法及图纸

技术编号:18610299 阅读:17 留言:0更新日期:2018-08-04 23:00
一种用于光线追踪架构中的负载平衡的装置和方法。例如,图形处理装置的一个实施例包括:交叉单元引擎,所述交叉单元引擎用于针对多个图元测试多条光线,以标识每条光线与之交叉的最接近的图元;交叉单元队列,所述交叉单元队列用于存储要由所述交叉单元引擎执行的工作;以及交叉单元卸载引擎,所述交叉单元卸载引擎用于监测所述交叉单元队列以确定所述交叉单元引擎上的压力水平,所述交叉单元卸载引擎用于响应地将所述交叉单元队列中的工作中的一些卸载到在所述图形处理器的一个或多个执行单元上执行的交叉程序代码。

【技术实现步骤摘要】
【国外来华专利技术】用于光线追踪架构中的负载平衡的方法和装置
技术介绍

本专利技术总体涉及计算机处理器领域。更具体地,本专利技术涉及用于光线追踪架构中的负载平衡的装置和方法。相关技术描述光线追踪是一种图形处理技术,用于通过遍历每条光线通过像平面中的像素的路径并模拟其入射到不同对象上的效果来生成图像。在遍历计算之后,通常会测试每条光线与场景中的对象的某一子集的交叉。一旦已经标识出最近的物体,就对交叉点处的入射光进行估算,物体的材料属性就被确定,并且该信息被用于计算像素的最终颜色存在当前构建固定功能光线追踪架构的若干公司。这些架构的想法是要设计用于光线遍历的固定功能(FF)单元以及用于光线交叉的FF单元,并且然后允许图形处理单元(GPU)处置着色和光线生成。FF单元的设计者必须决定遍历单元和交叉单元之间应该存在哪种关系。如果每件事都被完美平衡,则这两个单元将始终处于完全忙碌。然而,当渲染真实场景时,遗憾的是,这种情况极少可能发生。相反,它们中的一个可能成为瓶颈,而另一个将是空闲的。本专利技术描述了用于解决该问题的新颖方法,并且我并不知晓解决该问题的任何其他方案。附图说明结合以下附图,从以下具体实施方式中可获得对本专利技术更好的理解,其中:图1是具有处理器的计算机系统的实施例的框图,所述处理器具有一个或多个处理器核以及图形处理器;图2是处理器的一个实施例的框图,所述处理器具有一个或多个处理器核、集成存储器控制器以及集成图形处理器;图3是图形处理器的一个实施例的框图,所述图形处理器可以是分立的图形处理单元,或者可以是与多个处理核集成的图形处理器;图4是用于图形处理器的图形处理引擎的实施例的框图;图5是图形处理器的另一实施例的框图;图6是包括处理元件的阵列的线程执行逻辑的框图;图7示出根据实施例的图形处理器执行单元指令格式;图8是图形处理器的另一实施例的框图,所述图形处理器包括图形流水线、媒体流水线、显示引擎、线程执行逻辑以及渲染输出流水线。图9A是示出根据实施例的图形处理器命令格式的框图;图9B是示出根据实施例的图形处理器命令序列的框图;图10示出根据实施例的用于数据处理系统的示例性图形软件架构;图11示出根据实施例的可用于制造集成电路以执行操作的示例性IP核开发系统;图12示出根据一个实施例的可以使用一个或多个IP核制造的芯片集成电路上的示例性系统;图13示出了包括遍历单元和交叉单元的示例性光线追踪架构;图14示出了用于从交叉单元卸载工作的本专利技术的一个实施例;图15示出了用于从遍历单元卸载工作的本专利技术的一个实施例;图16示出了用于从交叉单元和遍历单元卸载工作的本专利技术的一个实施例;以及图17示出了根据本专利技术的一个实施例的方法。具体实施方式在下面的描述中,出于解释的目的,阐述了众多具体细节以便提供对以下描述的本专利技术的各实施例的透彻理解。然而,对本领域技术人员显而易见的是,可以在没有这些具体细节中的一些细节的情况下实践本专利技术的各实施例。在其他实例中,公知的结构和设备以框图形式示出,以避免使本专利技术的各实施例的基本原理变得模糊。示例性图形处理器架构和数据类型系统概览图1是根据实施例的处理系统100的框图。在各实施例中,系统100包括一个或多个处理器102以及一个或多个图形处理器108,并且可以是单处理器台式机系统、多处理器工作站系统或具有大量处理器102或处理器核107的服务器系统。在一个实施例中,系统100是被纳入到用于在移动设备、手持式设备或嵌入式设备中使用的芯片上系统(SoC)集成电路内的处理平台。系统100的实施例可以包括或并入基于服务器的游戏平台、游戏控制台,包括游戏与媒体控制台、移动游戏控制台、手持式游戏控制台、或在线游戏控制台。在一些实施例中,系统100是移动电话、智能电话、平板计算设备或移动互联网设备。数据处理系统100还可包括可穿戴设备(诸如智能手表可穿戴设备、智能眼镜设备、增强现实设备、或虚拟现实设备)、与所述可穿戴设备耦合、或者集成在所述可穿戴设备中。在一些实施例中,数据处理系统100是电视或机顶盒设备,所述电视或机顶盒设备具有一个或多个处理器102以及由一个或多个图形处理器108生成的图形界面。在一些实施例中,一个或多个处理器102每个包括用于处理指令的一个或多个处理器核107,所述指令在被执行时执行系统和用户软件的操作。在一些实施例中,一个或多个处理器核107中的每个处理器核被配置成用于处理特定的指令集109。在一些实施例中,指令集109可以促进复杂指令集计算(CISC)、精简指令集计算(RISC)、或经由超长指令字(VLIW)的计算。多个处理器核107可以各自处理不同的指令集109,所述指令集可以包括用于促进对其他指令集进行仿真的指令。处理器核107还可以包括其他处理设备,如数字信号处理器(DSP)。在一些实施例中,处理器102包括高速缓存存储器104。取决于架构,处理器102可以具有单个内部高速缓存或内部高速缓存的多个级。在一些实施例中,在处理器102的各部件当中共享高速缓存存储器。在一些实施例中,处理器102还使用外部高速缓存(例如,3级(L3)高速缓存或末级高速缓存(LLC))(未示出),可以使用已知的高速缓存一致性技术来在处理器核107当中共享外部高速缓存。另外地,寄存器堆106包括在处理器102中,所述处理器可以包括用于存储不同类型的数据的不同类型的寄存器(例如,整数寄存器、浮点寄存器、状态寄存器、和指令指针寄存器)。一些寄存器可以是通用寄存器,而其他寄存器可以特定于处理器102的设计。在一些实施例中,处理器102耦合至处理器总线110,所述处理器总线用于在处理器102与系统100内的其他部件之间传输通信信号,例如地址、数据、或控制信号。在一个实施例中,系统100使用示例性‘中枢’系统架构,包括存储器控制器中枢116和输入输出(I/O)控制器中枢130。存储器控制器中枢116促进存储器设备与系统100的其他部件之间的通信,而I/O控制器中枢(ICH)130经由本地I/O总线提供与I/O设备的连接。在一个实施例中,存储器控制器中枢116的逻辑集成在处理器内。存储器设备120可以是动态随机存取存储器(DRAM)设备、静态随机存取存储器(SRAM)设备、闪存设备、相变存储器设备、或具有合适的性能用作处理存储器的某个其他存储器设备。在一个实施例中,存储器设备120可作为系统100的系统存储器进行操作,以存储数据122和指令121,以供在一个或多个处理器102执行应用或进程时使用。存储器控制器中枢116还与可选的外部图形处理器112耦合,所述可选的外部图形处理器可以与处理器102中的一个或多个图形处理器108通信,从而执行图形和媒体操作。在一些实施例中,ICH130使得外围部件经由高速I/O总线连接至存储器设备120和处理器102。I/O外围装置包括但不限于:音频控制器146、固件接口128、无线收发机126(例如,Wi-Fi、蓝牙)、数据存储设备124(例如,硬盘驱动器、闪存等)、以及用于将传统(例如,个人系统2(PS/2))设备耦合至所述系统的传统I/O控制器140。一个或多个通用串行总线(USB)控制器142连接多个输入设备,例如键盘和鼠标144组合。网络控制器134还可以耦合至ICH130。在一些本文档来自技高网...

【技术保护点】
1.一种图形处理装置,包括:交叉单元引擎,所述交叉单元引擎用于针对多个图元测试多条光线,以标识每条光线与之交叉的最接近的图元;交叉单元队列,所述交叉单元队列用于存储要由所述交叉单元引擎执行的工作;以及交叉单元卸载引擎,所述交叉单元卸载引擎用于监测所述交叉单元队列以确定所述交叉单元引擎上的压力水平,所述交叉单元卸载引擎用于响应地将所述交叉单元队列中的工作中的一些卸载到在所述图形处理器的一个或多个执行单元上执行的交叉程序代码。

【技术特征摘要】
【国外来华专利技术】2015.12.22 US 14/979,1921.一种图形处理装置,包括:交叉单元引擎,所述交叉单元引擎用于针对多个图元测试多条光线,以标识每条光线与之交叉的最接近的图元;交叉单元队列,所述交叉单元队列用于存储要由所述交叉单元引擎执行的工作;以及交叉单元卸载引擎,所述交叉单元卸载引擎用于监测所述交叉单元队列以确定所述交叉单元引擎上的压力水平,所述交叉单元卸载引擎用于响应地将所述交叉单元队列中的工作中的一些卸载到在所述图形处理器的一个或多个执行单元上执行的交叉程序代码。2.如权利要求1所述的图形处理装置,其特征在于,所述交叉单元卸载引擎用于在将工作卸载到所述交叉程序代码之前确定所述交叉单元队列何时达到指定的工作阈值。3.如权利要求1所述的图形处理装置,其特征在于,所述交叉单元引擎实现基于Plucker的测试以标识最接近的图元,并且在所述执行单元上运行的所述交叉程序代码使用测试来标识最接近的图元。4.如权利要求3所述的图形处理装置,其特征在于,所述多个图元包括多个三角形。5.如权利要求1所述的图形处理装置,进一步包括:遍历单元引擎,所述遍历单元引擎用于针对包围体层级结构(BVH)或者其他数据结构遍历每条光线。6.如权利要求5所述的图形处理装置,进一步包括:遍历单元队列,所述遍历单元队列用于存储要由所述遍历单元引擎执行的工作;以及遍历单元卸载引擎,所述遍历单元卸载引擎用于监测所述遍历单元队列以确定所述遍历单元引擎上的压力水平,所述遍历单元卸载引擎用于响应地将所述遍历单元队列中的工作中的一些卸载到在所述图形处理器的执行单元中的一个或多个上执行的遍历程序代码。7.如权利要求6所述的图形处理装置,其特征在于,由所述遍历单元引擎与所述遍历单元程序代码所生成的至少一些结果将被存储在所述交叉单元队列中。8.如权利要求7所述的图形处理装置,其特征在于,在所述遍历单元卸载引擎卸载工作之前,在至少一个执行单元上开始遍历线程,并且在所述交叉单元卸载引擎卸载工作之前,在至少一个其他执行单元上开始交叉线程。9.如权利要求1所述的图形处理装置,其特征在于,所述交叉程序代码包括多个单指令多数据(SIMD)指令以用于标识每条光线与之交叉的最接近的图元。10.如权利要求9所述的图形处理装置,其特征在于,所述SIMD操作包括SIMD4操作,所述SIMD4操作包括以下操作:边缘0=v1–v0;其中,每个v0和v1由x、y、z、0组成,并且其中,0是填补。11.如权利要求1所述的图形处理装置,进一步包括:遍历单元程序代码,所述遍历单元程序代码由执行单元(EU)执行,所述遍历单元程序代码用于针对包围体层级结构(BVH)或其他数据结构遍历每条光线。12.如权利要求6所述的图形处理装置,其特征在于,如果确定执行单元繁忙程度低于指定阈值,则不管所述遍历单元队列和/或所述交叉单元队列上的所述压力水平如何,所述遍历单元卸载引擎和/或所述交叉单元卸载引擎用于分别将工作卸载到在所述执...

【专利技术属性】
技术研发人员:T·G·阿凯奈莫勒
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1