用于将执行线程分组的系统和方法技术方案

技术编号：2841396 阅读：192 留言：0更新日期：2012-04-11 18:40

将多个线程划分成具有两个或两个以上线程的伙伴组，以使得每个线程被指定给其一个或一个以上伙伴线程。每个伙伴组中只有一个线程活动地执行指令，且这允许伙伴线程共用硬件资源，例如寄存器。当一活动线程遇到一交换事件（例如一交换指令）时，所述活动线程暂停执行，且其伙伴线程中的一者使用那个线程的私用硬件资源和所述伙伴组的共用硬件资源开始执行。因此，可在不复制所有每个线程的硬件资源的情况下增加线程计数。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术的实施例大体上涉及多线程处理，且更确切地说，涉及一种用于将执行线程分组以实现改进的硬件利用率的系统和方法。
技术介绍
一般来说，计算机指令需要执行多个时钟周期。为此原因，多线程处理器以连续的方式执行若干并行指令线程，以使得可尽可能地将用于执行指令的硬件保持繁忙。举例来说，当执行具有以下所示的特征的指令线程时，多线程处理器可连续调度四个并行线程。通过以此方式调度线程，多线程处理器能够在23个时钟周期之后完成4个线程的执行，其中在时钟周期1-20期间执行第一线程，在时钟周期2-21期间执行第二线程，在时钟周期3-22期间执行第三线程，且在时钟周期4-23期间执行第四线程。比较来说，如果处理器直到处理中的线程完成执行时才调度一线程，那么会花费80个时钟周期来完成4个线程的执行，其中在时钟周期1-20期间执行第一线程，在时钟周期21-40期间执行第二线程，在时钟周期41-60期间执行第三线程，且在时钟周期61-80期间执行第四线程。指令等待时间需要的资源1 4个时钟周期3个寄存器2 4个时钟周期4个寄存器3 4个时钟周期3个寄存器4 4个时钟周期5个寄存器5 4个时钟周期3个寄存器然而，上述并行处理需要更大量的硬件资源，例如更大数目的寄存器。在上文给出的实例中，并行处理所需的寄存器数目为20，而相比之下，非并行处理需要5个。在许多情况下，执行的等待时间并不统一。举例来说，在图形处理的情况下，指令线程通常包括等待时间通常小于10个时钟周期的数学操作和等待时间超过100个时钟周期的存储器存取操作。在此类情况下，对并行线程的执行进行连续...

【技术保护点】
一种在一处理单元中执行多个指令线程的方法，其包含以下步骤：将所述处理单元的第一、第二和共用组硬件资源分配给第一和第二指令线程；使用所述第一和共用组硬件资源来执行所述第一指令线程，直到发生一预定事件为止；和响应于所述预定事件的所述发生，暂停所述第一指令线程的执行，并使用所述第二和共用组硬件资源来执行所述第二指令线程。

【技术特征摘要】
US 2005-12-16 11/305,5581.一种在一处理单元中执行多个指令线程的方法，其包含以下步骤将所述处理单元的第一、第二和共用组硬件资源分配给第一和第二指令线程；使用所述第一和共用组硬件资源来执行所述第一指令线程，直到发生一预定事件为止；和响应于所述预定事件的所述发生，暂停所述第一指令线程的执行，并使用所述第二和共用组硬件资源来执行所述第二指令线程。2.根据权利要求1所述的方法，其中执行所述第二指令线程，直到发生另一预定事件为止，且响应于所述另一预定事件的所述发生，暂停所述第二指令线程的执行，并重新开始所述第一指令线程的所述执行。3.根据权利要求2所述的方法，其中所述第一指令线程包含一交换指令，且当执行所述第一线程中的所述交换指令时发生所述预定事件，且其中所述第二指令线程包含一交换指令，且当执行所述第二线程中的所述交换指令时发生所述另一预定事件。4.根据权利要求1所述的方法，其进一步包含将一第三组硬件资源和所述共用组硬件资源分配给一第三指令线程的步骤，其中执行所述第二指令线程，...

【专利技术属性】
技术研发人员：布雷特W库恩，约翰埃里克林霍尔姆，
申请(专利权)人：辉达公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人