高效线程组调度制造技术

技术编号：19240225 阅读：36 留言：0更新日期：2018-10-24 03:50

本发明专利技术涉及高效线程组调度。描述了用于促进自主机器处的智能线程调度的机构。如本文所描述，实施例的方法包括：检测关于与多个工作负荷相对应的多个线程的依赖性信息，所述多个工作负荷关联于与包括图形处理器的处理器相关的任务。所述方法可以进一步包括：基于所述依赖性信息来生成线程组的树，其中每一个线程组包括多个线程；以及调度与类似依赖性相关联的线程组中的一个或多个，以避免依赖性冲突。

全部详细技术资料下载

【技术实现步骤摘要】
高效线程组调度
本文所述的实施例大体上涉及数据处理，并且更具体地涉及促进高效线程组调度。
技术介绍
当前的并行图形数据处理包括被开发以对图形数据执行特定操作的系统和方法，这些特定操作诸如例如线性内插、镶嵌、栅格化、纹理映射、深度测试等。传统上，图形处理器使用了固定功能计算单元来处理图形数据；然而，最近，图形处理器的多个部分已变得可编程，从而使得这样的处理器能够支持用于处理顶点和片段数据的更广泛种类的操作。为了进一步提高性能，图形处理器通常实现处理技术（诸如，流水线操作），这些处理技术试图贯穿图形流水线的不同部分来并行处理尽可能多的图形数据。具有单指令多线程（SIMT）架构的并行图形处理器被设计成最大化图形流水线中的并行处理量。在SIMT架构中，多组并行线程试图尽可能经常地一起同步执行程序指令，以提高处理效率。用于SIMT架构的软件和硬件的一般性概述可以在ShaneCook的CUDA编程（CUDAProgramming），第3章，第37-51页（2013年）和/或NicholasWilt的CUDA手册，对GPU编程的全面向导（CUDAHandbook,AComprehensiveGuidetoGPUProgramming），第2.6.2至3.1.2节（2013年6月）中找到。机器学习已经在解决许多种类的任务方面成功。当训练和使用机器学习算法（例如，神经网络）时发生的计算自然地服从高效并行实现。相应地，诸如通用图形处理单元（GPGPU）之类的并行处理器已经在深度神经网络的实际实现中扮演重要作用。具有单指令多线程（SIMT）架构的并行图形处理器被设计成最大化图形...

【技术保护点】
1.一种用于促进智能线程调度的装置，所述装置包括：检测/观察逻辑，要检测关于与多个工作负荷相对应的多个线程的依赖性信息，所述多个工作负荷关联于与包括图形处理器的处理器相关的任务；以及线程依赖性逻辑，要基于所述依赖性信息来生成线程组的树，其中每一个线程组包括多个线程；以及调度器，要调度与类似依赖性相关联的线程组中的一个或多个，以避免依赖性冲突。

【技术特征摘要】
2017.04.09 US 15/4828011.一种用于促进智能线程调度的装置，所述装置包括：检测/观察逻辑，要检测关于与多个工作负荷相对应的多个线程的依赖性信息，所述多个工作负荷关联于与包括图形处理器的处理器相关的任务；以及线程依赖性逻辑，要基于所述依赖性信息来生成线程组的树，其中每一个线程组包括多个线程；以及调度器，要调度与类似依赖性相关联的线程组中的一个或多个，以避免依赖性冲突。2.如权利要求1所述的装置，其中所述树包括多个节点，其中每一个节点表示线程组或线程。3.如权利要求1所述的装置，进一步包括：部分应用抢占逻辑，要在遇到条件时挂起一个或多个线程组，其中所述一个或多个线程要存储与所述条件相关的上下文信息的一个或多个集合，其中所述部分抢占逻辑进一步要在所述一个或多个线程组依然被挂起的同时促进另一线程组的分派。4.如权利要求3所述的装置，其中所述部分应用抢占逻辑进一步要在满足所述条件且使用上下文信息的所述一个或多个集合时重新开始所述一个或多个线程组的处理。5.如权利要求1所述的装置，进一步包括：多层处理逻辑，要使用所述图形处理器的多个处理层来促进所述多个线程组的处理，其中每一个处理层包括一个或多个流送多处理器。6.如权利要求5所述的装置，进一步包括：优先化逻辑，要基于与所述多个线程组中的第一线程组相关联的第一任务的优先级优于与所述多个线程组中的第二线程组相关联的第二任务，来相比于所述第二线程组优先化所述第一线程组，其中所述任务包括所述第一和第二任务。7.如权利要求1所述的装置，其中所述图形处理器与应用处理器协同定位在公共半导体封装上。8.一种用于促进智能线程调度的方法，所述方法包括：检测关于与多个工作负荷相对应的多个线程的依赖性信息，所述多个工作负荷关联于...

【专利技术属性】
技术研发人员：S雅哈吉达尔，A科克，V兰加纳坦，B温布，J雷，R巴里克，A阿普，NG冯博里斯，林宗翰，K辛哈，E努尔维塔迪，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人