单指令多线程计算系统及其方法技术方案

技术编号：14313529 阅读：63 留言：0更新日期：2016-12-30 14:50

本发明专利技术提供一种单指令多线程计算系统。该单指令多线程计算系统包括多个处理器和用于调度线程至每个处理器的调度器。每个处理器包括一个标量单元和多个矢量单元，标量单元提供一个标量通道用于标量执行，矢量单元提供N个并行通道用于矢量执行。处理器在执行期间检测出一条N线程的指令已被编译器预测出其具有(N-M)个空闲线程，且该指令在M个有效线程上具有相同的源操作数，其中N>M≥1；以及完成检测之后，传送该指令至标量单元用于标量执行。本发明专利技术所提出的单指令多线程计算系统，可提高系统性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及矢量处理方法，更具体地，涉及一种在单指令多线程的(Single-Instruction-Multiple-Thread,以下简称为SIMT)计算系统中的矢量处理方法。
技术介绍
单指令多线程是一些现在的图形处理单元(graphics processing unit,以下简称为GPU)所采用的一种并行执行模式。这种GPU可以利用多个并行的数据路径以锁步方式(lock-step)而在多个线程上同时执行单一指令。已经开发设计的单程序多数据(Single-Program-Multiple-Data,SPMD)加速器语言，如和可用以提高具有SIMT架构类型的GPU的计算性能。一些现在的GPU可在比并行数据路径数目更多的线程上执行单一指令。例如，具有32条并行数据路径的处理器可在4个连续的周期内在128个线程上执行一条指令。在下面的描述中，将该128个线程称为线程块(thread block)。线程块中的所有线程，例如，4个连续周期中每个周期内的32个线程，均共享一个程序计数器和指令提取(instruction fetch)，且以锁步方式执行。SIMT减少了程序计数器的数量以及指令提取的开销，但是，在某些情况下，锁步执行方式(lock-step execution model)会导致计算资源的利用率很差。举例来说，处理器中的多个线程遵循不同的控制流路径来处理if-else语块，则，当遵循“if”路径的线程被执行时，那么遵循“else”路径的线程将被禁用(等待中)，反之亦然。也就是说，一次只能执行一条控制流路径，即使该控制流路径对其它的线...
<a href="http://www.xjishu.com/zhuanli/55/201510852483.html" title="单指令多线程计算系统及其方法原文来自X技术">单指令多线程计算系统及其方法</a>

【技术保护点】
一种在单指令多线程计算系统上执行的多线程指令序列的处理方法，其特征在于，包括：在编译期间，对在所述单指令多线程计算系统中的处理器上执行的所述指令序列进行分析，其中，所述处理器包括一个标量单元和多个矢量单元，所述标量单元提供一个标量通道以用于标量执行，而所述多个矢量单元提供N个并行通道以用于N个线程上的矢量执行；预测所述被分析的指令序列中的一条指令具有(N‑M)个空闲线程，且所述指令在M个有效线程上具有相同的源操作数，其中N>M≥1；以及为所述指令生成代码，以被所述标量单元执行。

【技术特征摘要】
2015.06.17 US 14/741,5051.一种在单指令多线程计算系统上执行的多线程指令序列的处理方法，其特征在于，包括：在编译期间，对在所述单指令多线程计算系统中的处理器上执行的所述指令序列进行分析，其中，所述处理器包括一个标量单元和多个矢量单元，所述标量单元提供一个标量通道以用于标量执行，而所述多个矢量单元提供N个并行通道以用于N个线程上的矢量执行；预测所述被分析的指令序列中的一条指令具有(N-M)个空闲线程，且所述指令在M个有效线程上具有相同的源操作数，其中N>M≥1；以及为所述指令生成代码，以被所述标量单元执行。2.如权利要求1所述的方法，其特征在于，进一步包括：在为所述指令生成的所述代码中设定一个指定位以指明为用于所述标量执行。3.如权利要求1所述的方法，其特征在于，进一步包括：预测所述被分析的指令序列中的第二指令在所述N个线程上具有相同的源操作数；在为所述第二指令所生成的所述代码中设定一个指定位以指明为用于所述标量执行。4.如权利要求1所述的方法，其特征在于，进一步包括：将所述指令替换为标量指令以指明为用于所述标量执行。5.如权利要求1所述的方法，其特征在于，对所述指令序列进行分析的步骤进一步包括：判断所述指令所在的基本块是否为多个分支的目标；以及判断所述指令是否从超过一个分支处获取操作数。6.如权利要求1所述的方法，其特征在于，进一步包括：在执行期间，检测出所述指令已经被编译器预测出所述指令用于所述标量执行；调度所述指令至所述标量单元；以及传输所述标量执行的结果至所述M个有效线程的目标。7.如权利要求6所述的方法，其特征在于，进一步包括：调度另一指令至所述矢量单元以与所述指令同时执行。8.一种在单指令多线程计算系统中执行N线程指令序列的方法，其特征在于，所述方法包括：在执行期间，检测出所述指令序列中的一条指令具有(N-K)个空闲线程，且所述指令在所述单指令多线程计算系统中的处理器的K个有效线程上具有相同的源操作数，其中，所述处理器包括一个标量单元和多个矢量通道，所述标量单元提供一个标量通道以用于标量执行，而所述多个矢量通道提供N个并行通道以用于所述N个线程上的矢量执行，且1≤K≤阈值<N；调度所述指令用于所述标量执行；以及使用所述标量单元执行所述指令。9.如权利要求8所述的方法，其特征在于，检测所述指令的步骤进一步包括：检测出指定的状态寄存器中具有K个位被设定为指示值，以指明对...

【专利技术属性】
技术研发人员：张嘉洋，
申请(专利权)人：联发科技股份有限公司，
类型：发明
国别省市：中国台湾;71

全部详细技术资料下载我是这个专利的主人