促进计算设备上的图形处理单元上的工作负荷执行的动态流水线化制造技术

技术编号：16049194 阅读：94 留言：0更新日期：2017-08-20 08:58

描述了一种机制，该机制用于促进计算设备上的图形处理单元处的工作负荷执行的动态流水线化。如本文中所描述的各实施例的一种方法包括：产生命令缓冲区，该命令缓冲区具有与要在图形处理单元(GPU)处被执行的多个工作负荷相关的多个内核；使要在GPU处进行处理的工作负荷流水线化，其中流水线化包括基于资源线程的可用性和与每个内核相关的一个或多个依赖性事件的状态中的至少一者而对要被执行的每个内核相对于所述多个内核的其他内核进行调度。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】促进计算设备上的图形处理单元上的工作负荷执行的动态流水线化
本文中所描述的各实施例一般涉及计算机。更具体地，各实施例涉及用于促进计算设备上的图形处理单元处的工作负荷执行的动态流水线化的机制。背景在计算设备中，图形处理单元(GPU)擅长(excelat)并行处理，因为它们能够繁衍(spawn)数千个线程以用并行方式处理数据，诸如，使用解决并行数据处理问题的通用图形处理单元(GPGPU)。然而，常规技术在节约计算资源方面(诸如在最大化线程与高速缓存利用率等方面)不够有效。附图说明各实施例作为示例而非限制在所附附图中示出，在附图中，同样的参考编号指代同样的元件。图1是根据实施例的数据处理系统的框图。图2是处理器的实施例的框图，所述处理器具有一个或多个处理器核、集成存储器控制器以及集成图形处理器。图3是图形处理器的一个实施例的框图，所述图形处理器可以是分立的图形处理单元，或可以是与多个处理核集成的图形处理器。图4是用于图形处理器的图形处理引擎的实施例的框图；图5是图形处理器的另一实施例的框图。图6示出线程执行逻辑，所述线程执行逻辑包括在图形处理引擎的一个实施例中采用的...
促进计算设备上的图形处理单元上的工作负荷执行的动态流水线化

【技术保护点】
一种设备，所述设备用于促进计算设备上的图形处理单元处的工作负荷执行的动态流水线化，所述设备包括：合并内核逻辑，所述合并内核逻辑用于产生命令缓冲区，所述命令缓冲区具有与在图形处理单元(GPU)处要被执行的多个工作负荷相关的多个内核；以及状态管理逻辑，所述状态管理逻辑用于使要在所述GPU处被处理的所述工作负荷流水线化，其中，流水线化包括：基于资源线程的可用性和与每个内核相关的一个或多个依赖性事件的状态中的至少一者而对要在所述GPU上被执行的每个内核相对于所述多个内核中的其他内核进行调度。

【技术特征摘要】
【国外来华专利技术】2014.12.18 US 14/574,6061.一种设备，所述设备用于促进计算设备上的图形处理单元处的工作负荷执行的动态流水线化，所述设备包括：合并内核逻辑，所述合并内核逻辑用于产生命令缓冲区，所述命令缓冲区具有与在图形处理单元(GPU)处要被执行的多个工作负荷相关的多个内核；以及状态管理逻辑，所述状态管理逻辑用于使要在所述GPU处被处理的所述工作负荷流水线化，其中，流水线化包括：基于资源线程的可用性和与每个内核相关的一个或多个依赖性事件的状态中的至少一者而对要在所述GPU上被执行的每个内核相对于所述多个内核中的其他内核进行调度。2.如权利要求1所述的设备，进一步包括依赖性检查逻辑，所述依赖性检查逻辑用于确定所述一个或多个依赖性事件的所述状态，其中，所述状态指示所述一个或多个依赖性事件是否保持未被解决，其中，依赖性事件包括与所述多个内核的基本内核相关的偶然性事件，该偶然性事件使得所述基本内核将被至少部分地执行以解析所述偶然性事件并发起对所述多个内核的一个或多个后续内核的执行。3.如权利要求1或2所述的设备，进一步包括数据一致性管理逻辑，所述数据一致性管理逻辑用于基于所述一个或多个依赖性事件来确定资源线程的所述可用性，其中，确定所述可用性包括检测由于所述一个或多个依赖性事件保持未被解析而保持未被使用的一个或多个空闲资源线程。4.如权利要求1所述的设备，其特征在于，所述状态管理逻辑进一步用于获取所述一个或多个空闲资源线程，并且使所述多个内核的一个或多个非依赖性内核流水线化，以用于在不需要延迟所述处理或停止所述GPU的情况下，在所述一个或多个后续内核等待满足所述一个或多个依赖性事件时即在所述一个或多个空闲资源线程上进行处理，其中所述状态管理逻辑进一步用于使所述一个或多个后续内核流水线化，以用于在不需要停止所述GPU的情况下，在满足所述一个或多个依赖性事件时即在所述GPU处进行处理。5.如权利要求1或4所述的设备，其特征在于，所述状态管理逻辑进一步用于使所述一个或多个后续内核流水线化，以用于在不需要停止所述GPU的情况下,在满足所述一个或多个依赖性事件时即在所述GPU处进行处理。6.如权利要求1所述的设备，其特征在于，所述资源线程包括GPU硬件线程、命令缓冲区、可执行代码以及存储器堆中的一个或多个。7.如权利要求1所述的设备，其特征在于，所述命令缓冲区包括与所述多个工作负荷相关联的多个命令，其中所述命令包括与所述多个工作负荷相关的一个或多个处理命令，并进一步包括具有与所述多个工作负荷相关的状态数据的数据，其中所述处理命令以及所述数据在流水线中被分派给所述GPU。8.如权利要求1或2所述的设备，其特征在于，所述一个或多个依赖性事件包括与所述基本内核相关联的基本命令的处理的未完成、以及所述资源线程中的一个或多个的不可用性中的至少一者，其中所述一个或多个后续内核与依赖于所述基本命令的一个或多个后续命令相关联。9.一种方法，所述方法...

【专利技术属性】
技术研发人员：J·N·拉奥，P·K·兰卡，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人