当前位置: 首页 > 专利查询>辉达公司专利>正文

图形处理器单元管线中的条件执行位制造技术

技术编号:2951971 阅读:204 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及图形处理器单元管线中的条件执行位。一种在图形处理器单元中的算术逻辑级包含若干算术逻辑单元(ALU)。将指令应用于包括与不同像素相关联的像素数据的多组操作数。条件执行位的值确定所述ALU如何处理一组操作数中的所述像素数据。

【技术实现步骤摘要】

本专利技术的实施例大体上涉及计算机图形。
技术介绍
近年来在计算机性能方面的进步已令图形系统能够使用个人计算机、家庭电子游戏 计算机、手持装置等来提供更加真实的图形图像。在此类图形系统中,执行若干程序, 以便将图元渲染或绘制到系统的屏幕。图元是图形的基本组成部分,例如是点、线、多 边形等。所渲染的图像由这些图元的组合形成。可利用许多程序来执行三维(3-D)图 形渲染。已经研发出专用的图形处理单元(GPU),以提高图形渲染程序的执行速度。GPU 通常并入有一个或一个以上渲染管线。每一渲染管线包含若千经设计以用于高速执行图 形指令/数据的基于硬件的功能单元。 一般来说,将指令/数据馈送到管线前端,且计算 出的结果出现在管线后端。GPU的基于硬件的功能单元、高速缓冲存储器、固件等经 设计以对基本图元进行操作,并产生实时渲染的3-D图像。人们越来越关注于在例如手机、个人数字助理(PDA)和其它装置等便携或手持装 置中渲染3-D图形图像。然而,便携或手持装置通常相对于例如台式计算机等更大的装 置来说具有限制。举例来说,因为便携装置通常用电池供电,所以功率消耗成了人们关注的一个问题。此外,由于其尺寸较小,所以便携装置内部的可用空间有限。需要在手 持装置中在此类装置的限制内快速地执行真实的3-D图形渲染。
技术实现思路
本专利技术的实施例提供用于在图形处理器单元管线中快速且高效地处理数据的方法 和系统。用于一像素群组的像素数据沿着图形管线共同前进到算术逻辑单元(ALU)。在 ALU中,以SIMD (单个指令、多个数据)的方式向一群组中的所有像素应用同一指令。 举例来说,在给定的时钟循环中,指令将指定从用于所述像素群组中的第一像素的像素 数据中选出的一组操作数。在下一时钟循环中,指令将指定从用于所述群组中的第二像 素的像素数据中选出的另一组操作数,依此类推。根据本专利技术的实施例, 一条件执行位 与每一组操作数相关联。所述条件执行位的值确定ALU如何(是否)处理相应组的操 作数。一般来说,如果一条件执行位被设置成不执行,那么ALU不对与所述条件执行位 相关联的像素数据进行操作。更具体来说,在一个实施例中,如果条件执行位被设置成 不执行,则ALU不锁存像素数据;此可通过将到ALU的输入触发器选通以使得所述触 发器不在像素数据中计时来实现。因此,ALU不改变状态_—ALU中的锁存器(触发 器)保持处于其在前一时钟循环中所处的状态。通过不为触发器计时节省了功率,而且 还因为对组合逻辑的输入保持不变且因此没有任何晶体管改变状态而节省了功率(触发 器之所以不从一个状态过渡成另一个状态,是因为如果条件位被设置成不执行,那么操 作数从一个时钟循环到下一时钟循环保持不变)。总的来说,在一像素群组上应用指令,但可能不必对所述群组中的每一像素均执行 所述指令。为了在管线中维持适当的次序,向群组中的每一像素应用所述指令一一针对 群组中的每一像素选择一组操作数。然而,如果与一组操作数相关联的条件执行位被设 置成不执行,那么ALU不对那些操作数进行操作一一不对操作数执行相关联的指令, 而是改为复制下游操作数。因此,不必对触发器计时,且不必切换组合逻辑,因而节省 了功率。由此,本专利技术的实施例非常适合于手持和其它便携的用电池操作的装置中的图 形处理(但本专利技术不限于在那些类型的装置上使用)。所属领域的技术人员在阅读了以下对各种图式中所说明的实施例的详细描述后,将 认识到本专利技术的各种实施例的这些和其它目的和优点。 附图说明5在附图各图中是以举例的方式而不是以限制的方式来说明本专利技术,且其中相同参考 数字指代类似元件。图1是展示根据本专利技术一个实施例的计算机系统的组件的方框图。图2是展示根据本专利技术一个实施例的图形处理单元(GPU)的组件的方框图。图3说明根据本专利技术一个实施例的GPU管线中的级。图4说明根据本专利技术一实施例的一连串行的像素数据。图5是根据本专利技术一个实施例的GPU中的算术逻辑级的方框图。图6说明退出根据本专利技术一实施例的算术逻辑单元的像素数据。图7A说明根据本专利技术一个实施例的ALU的各个级中的像素数据。图7B说明根据本专利技术一实施例的ALU的各个级。图8是根据本专利技术一个实施例的用于处理像素数据的由计算机实施的方法的流程图。具体实施例方式现在将详细参看本专利技术的实施例,在附图中说明所述实施例的实例。虽然将结合这 些实施例描述本专利技术,但将了解,这些实施例并不意欲将本专利技术限于这些实施例。相反, 本专利技术意欲涵盖所附权利要求书所界定的本专利技术的精神和范围内可包含的替代方案、修 改和等效物。此外,在对本专利技术实施例的以下详细描述中,为了提供对本专利技术的全面理 解而阐述了许多具体细节。然而,所属领域的技术人员将认识到,可在没有这些具体细 节的情况下实践本专利技术。在其它例子中,并未详细描述众所周知的方法、程序、组件和 电路,以免不必要地模糊本专利技术实施例的各方面。在程序、步骤、逻辑区块、处理和对计算机存储器内的数据位的操作的其它符号表 示方面呈现以下详细描述的一些部分。这些描述和表示是数据处理领域的技术人员用以 最有效地向所属领域的其他技术人员传达其工作的主旨的手段。此处,程序、由计算机 执行的步骤、逻辑区块、过程等大体上被设想成产生所要结果的自相一致的步骤或指令 序列。所述步骤是要求对物理量进行物理操纵的步骤。通常(但不必要),这些量采用 能够在计算机系统中存储、传送、组合、比较和以其它方式操纵的电信号或磁信号的形 式。事实证明,将这些信号称为位、值、元素、符号、字符、项、数字等有时候较方便, 主要原因是通用。然而,应牢记,所有这些和类似的术语将与适当的物理量相关联,而且只是应用于 这些量的便利标记。如从以下论述将明白,除非另外明确声明,否则应了解,在本专利技术各处,利用例如"确定"或"使用"或"设置"或"锁存"或"计时"或"识别"或"选 择"或"处理"或"控制"等术语的论述是指代计算机系统(例如图1的计算机系统 100)或类似的电子计算装置的动作和过程,所述动作和过程对表示为计算机系统的寄 存器和存储器内的物理(电子)量的数据进行操纵并将其转换成以类似方式表示为计算 机系统存储器或寄存器或其它此类信息存储、传输或显示装置内的物理量的其它数据。 图1展示根据本专利技术一个实施例的计算机系统100。所述计算机系统包含根据本专利技术实施例的为特定的基于硬件和基于软件的功能性提供执行平台的基本计算机系统的组件。 一般来说,所述计算机系统包括至少一个中央处理单元(CPU) 101、系统存储 器115和至少一个图形处理器单元(GPU) 110。 GPU可经由桥接组件/存储器控制器(未 图示)耦合到系统存储器,或者可经由CPU内部的存储器控制器(未图示)直接耦合 到系统存储器。GPU耦合到显示器112。 一个或一个以上额外GPU可视情况而耦合到 系统100,以便进一步提高其计算能力。GPU耦合到CPU和系统存储器。计算机系统 可实施成(例如)台式计算机系统或服务器计算机系统,其具有耦合到专用图形渲染 GPU的强大的通用CPU。在此实施例中,可包含添加外围总线、专用图形存储器、输 入/输出(I/O)装置等的组件。类似地,计算机系统可实施成手持装置(例如手机等) 或机顶视频游戏控制台装置。GPU可实施本文档来自技高网...

【技术保护点】
一种图形处理器单元(GPU)管线,其包括: 多个算术逻辑单元(ALU),其可操作以用于根据指令执行算术运算,其中将所述指令应用于多组包括像素数据的操作数,所述多组操作数中的每一组操作数与多个像素中的相应像素和相应的条件执行位相关联,且 其中与所述多组操作数中的第一组操作数相关联的条件执行位的值确定所述ALU如何处理所述第一组操作数中的所述像素数据。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:泰森J伯兰格克雷格M奥克鲁丽卡
申请(专利权)人:辉达公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利