用于算术逻辑单元的基于软件的指令记分板制造技术

技术编号：38993203 阅读：13 留言：0更新日期：2023-10-07 10:23

一种基于软件的指令记分板(126)指示发出到算术逻辑单元(ALU)流水线(218)的紧密发出的指令(302,304,306)之间的相依性。该基于软件的指令记分板将一个或多个控制字(308)在这些相依指令之间插入到命令流(300)中，然后该命令流由该ALU流水线执行。这些控制字标识这些相依指令所相依于的指令(父指令)，使得处理器硬件(104)可确保该ALU流水线在该相依指令等待来自该父指令的结果时不会停止。等待来自该父指令的结果时不会停止。等待来自该父指令的结果时不会停止。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于算术逻辑单元的基于软件的指令记分板

技术介绍

[0001]常规处理系统包括实施音频应用程序、视频应用程序和多媒体应用程序以及在一些情况下通用计算的处理单元诸如中央处理单元(CPU)和图形处理单元(GPU)。GPU的物理资源包括用于实施用户定义的可重新配置虚拟流水线的着色器引擎和固定功能硬件单元。例如，用于处理三维(3
‑
D)图形的常规图形流水线由可编程着色器所支持的固定功能硬件块布置的序列形成。GPU上的处理通常通过由CPU处理的应用程序编程接口(API)调用(例如，绘制调用)来发起。绘制调用是由CPU生成并传输到CPU以指示CPU在帧中渲染对象(或对象的一部分)的命令。
[0002]GPU中的图形硬件通常包括算术逻辑单元(ALU)，诸如标量ALU或向量ALU，该ALU实施为对应流水线并且用于执行算术运算(诸如，加法、减法、乘法、除法以及移动)以及执行各种超越函数。在一些情况下，一个流水线用于实施大多数算术函数，并且单独流水线用于实施更复杂的超越函数。用于ALU的指令保持在指令缓冲器中，直到仲裁器挑选这些指令以用于在这些流水线中的一个流水线上执行为止。指令缓冲器中的一些指令相依于其他指令，例如第一(相依)指令的源寄存器从第二指令的目的地寄存器接收输入。因此，第二指令必须在执行第一指令之前完成。
附图说明
[0003]通过参考附图，本公开可以被更好地理解，并且其许多特征和优点对于本领域技术人员是显而易见的。在不同附图中使用相同的附图标记表示类似或相同的项目。
[0004]图1是根据一些实施方...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法，包括：将控制字插入到包括用于在算术逻辑单元(ALU)流水线处执行的第一指令的命令流中，所述控制字指示所述第一指令对用于在所述ALU流水线处执行的第二指令的第一相依性，所述ALU流水线包括多个级。2.根据权利要求1所述的方法，还包括：基于所述控制字来在所述ALU流水线处延迟所述第一指令的执行。3.根据权利要求1或2所述的方法，其中插入所述控制字包括：响应于所述第一指令和所述第二指令在没有任何中间指令的情况下发出，插入所述控制字；或者响应于所述第一指令在发出所述第二指令之后小于阈值指令数量发出，插入所述控制字。4.根据权利要求3所述的方法，其中所述阈值数量基于所述ALU流水线的级数量。5.根据权利要求1至4中任一项所述的方法，其中所述控制字包括：正在其处执行所述第二指令的所述ALU的标识符；以及在发出所述第二指令与发出所述第一指令之间发出的指令数量的指示。6.根据权利要求1至5中任一项所述的方法，还包括：在所述控制字中指示至少一个第三指令对用于在所述ALU流水线处执行的至少一个第四指令的至少一个第二相依性。7.一种方法，包括：基于指示第一指令相依于第二指令的控制字来在包括多个级的算术逻辑单元(ALU)流水线处延迟所述第一指令的执行。8.根据权利要求7所述的方法，还包括：响应于所述第一指令和所述第二指令在没有任何中间指令的情况下发出并且响应于所述第一指令在发出所述第二指令之后小于阈值指令数量发出而在指令流中接收所述控制字。9.根据权利要求8所述的方法，其中所述阈值数量基于所述ALU流水线的所述级数量。10.根据权利要求...

【专利技术属性】
技术研发人员：布莱恩，
申请(专利权)人：超威半导体公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人