当前位置: 首页 > 专利查询>辉达公司专利>正文

图形管线中基于瓦片的精度的光栅化制造技术

技术编号:2945893 阅读:193 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种在图形处理器的光栅级中用于基于瓦片的精度的光栅化的方法。所述方法包括:接收图形图元以在图形处理器的光栅级中进行光栅化;及以第一级别精度来光栅化所述图形图元以产生多个像素瓦片。接着以第二级别精度来光栅化所述瓦片,以产生覆盖的像素。接着输出所述覆盖的像素,以在所述图形处理器的随后级中进行渲染操作。

【技术实现步骤摘要】

本专利技术大体上涉及硬件加速图形计算机系统。技术背景计算机性能的最近进展已使得图形系统能够通过使用个人计算机、家用视频游戏计 算机、手持装置等来提供更逼真的图形图像。在此类图形系统中,执行多个程序以向系 统屏幕"渲染"或绘制图形图元。"图形图元"是图形图片的基本组成部分,例如顶点、 多边形等。经渲染的图像由这些图形图元的组合形成。可利用许多程序来执行3-D图形 渲染。已研发出多种专用图形处理单元(例如,GPU等)以优化执行图形渲染程序所需的 计算。GPU经配置以进行高速操作且通常并入有一个或一个以上渲染管线。每一管线包 括多个基于硬件的功能单元,所述功能单元经优化以高速执行图形指令/数据,其中将指 令/数据馈入到管线的前端中,且在管线的后端处出现计算结果。GPU的基于硬件的功能 单元、高速缓冲存储器、固件等经优化以对低级图形图元(例如,包含"点"、"线"、"三 角形"等)进行操作且产生经实时渲染的3-D图像。使用光栅显示技术来产生经实时渲染的3-D图像。光栅显示技术广泛用于计算机图 形系统中,且一般指代组成图像的多个像素的栅格受图形图元影响的机制。对于每个图 元,典型的光栅化系统一般逐像素步进,且按照图元的贡献来确定是否要"渲染"给定 像素或将其写入到帧缓冲器或像素映射中。这又确定如何将数据写入代表每个像素的显 示缓冲器。己研发出各种遍历算法和各种光栅化方法,用于以覆盖组成给定3-D场景的图元内 所有像素的方式从基于图形图元的描述计算为基于像素的描述(例如,对于每个图元进 行逐像素光栅化)。典型的解决方案涉及以单向方式通过系统地逐行步进越过场景(例如,从左到右) 来产生像素,且访问所述场景的每一像素。按照组成所述场景的各个图元的贡献来确定 每个像素的覆盖度。其它传统的解决方案涉及利用每像素评估技术来精密评估组成显示 器的像素中的每一者,且确定哪些像素由哪些图元覆盖。一旦图元被光栅化为其组成像素,便接着在光栅化级随后的管线级中寻址这些像素,其中执行渲染操作。 一般来说,这些渲染操作根据组成场景的图元的覆盖度来向显示器 的像素中的每一者分配颜色。还根据分配给图元的纹理映射信息、光照信息等来确定每 像素的颜色。然而,现有技术3-D渲染结构在符合处理当今应用的日益复杂的3-D场景的能力方 面存在问题。计算机屏幕现通常具有1920X1200个像素或更大的屏幕分辨率。现有技术 光栅化解决方案越来越成为3-D渲染过程的瓶颈。由于显示屏幕的尺寸不可动摇地增加 到(例如)1920个像素宽或更大,因而现有技术的用于光栅化的逐行步进和每像素评估 解决方案越来越需要更大的资源来处理计算负荷。为了处理此类大屏幕尺寸,GPU的光 栅化资源需要在每时钟周期基础上处理较大数目的每图元评估操作(例如,多边形边缘 等式),且需要每图元评估操作处理相应较大数目的像素。因此,典型的现有技术GPU 不具有足够的光栅化资源来符合大屏幕尺寸且同时维持可接受的实时3-D渲染性能。增加3-D渲染性能的传统方法(例如,增加时钟速度)具有例如增加功率消耗和增 加由GPU集成电路小芯片产生的热量的负面影响。用于增加性能的其它方法(例如并入 较大数目的并行执行单元来并行执行GPU操作)具有例如增加集成电路小芯片尺寸、减 少GPU制造过程的产率、增加功率需求等负面影响。因此,需要一种光栅化过程,其能够符合图形应用需求的要求并提供增加的性能, 而不会招致例如功率消耗增加和/或制作产率降低的不利结果。
技术实现思路
本专利技术实施例提供一种用于光栅化过程的方法和系统,其能够符合图形应用需求的 要求并提供增加的性能,而不会招致例如功率消耗增加和/或制作产率降低的不利结果。在一个实施例中,本专利技术实施为一种用于在图形处理器的光栅级中进行基于瓦片的 精度的光栅化的方法。所述方法包括接收图形图元以在图形处理器的光栅级中进行光栅 化,以及以第一级别精度来光栅化图形图元以产生多个像素瓦片。接着以第二级别精度 来光栅化所述瓦片,以产生覆盖的像素。接着输出所述覆盖的像素,以在图形处理器的 随后级中进行渲染操作。第一级别精度通常高于第二级别精度,以使得用于以第一级别 精度寻址所述多个瓦片的整数值大于用于以第二级别精度寻址多个像素的整数值。以此方式,可根据需要处理的各个像素或样品的数目来调节所需精度。举例来说, 在一个实施例中,以第一级别精度来光栅化图形图元,以寻址组成屏幕图像的多个像素。 相应地,在一个实施例中,以第二级别精度来光栅化图形图元,以寻址组成所述多个瓦 片中的每一者的多个像素。通过这种做法,本专利技术实施例有效利用GPU的光栅化资源来在每时钟周期基础上寻址每图元评估操作(例如,多边形边缘等式),以有效符合大屏幕尺寸且同时维持可接受的实时3-D渲染性能。附图说明在附式中以实例方式而非以限制方式来说明本专利技术,其中相同参考标号指代类 似元件。图1展示根据本专利技术一个实施例的计算机系统。图2展示根据本专利技术一个实施例描绘位于屏幕上用于光栅化的多边形201的图。 图3展示根据本专利技术一个实施例的三角形和沿着光栅化线产生的覆盖瓦片。 图4展示根据本专利技术一个实施例描绘示范性瓦片的尺度的图。图5展示根据本专利技术一个实施例在光栅级内实施的基于瓦片的精度的光栅化过程的图。图6展示根据本专利技术实施例描绘包括扩展位的示范性整数操作数的图。 图7展示根据本专利技术一个实施例的GPU的内部组件的图。具体实施方式现将详细参看本专利技术的优选实施例,附图中说明了所述优选实施例的实例。尽管将 结合优选实施例来描述本专利技术,但将了解不希望其将本专利技术限于这些实施例。相反,希 望本专利技术涵盖可包含在如所附权利要求书所界定的本专利技术精神和范围内的替代物、修改 和等效物。此外,在本专利技术实施例的以下详细描述中,陈述多个特定细节以提供对本发 明的彻底理解。然而,所属领域的技术人员将认识到可在不存在这些特定细节的情况下 实践本专利技术。在其它例子中,未详细描述众所周知的方法、程序、组件和电路以免不必 要地混淆本专利技术实施例的方面。符号和术语从计算机存储器内对数据位所进行的操作的程序、步骤、逻辑块、处理和其他符号 表示的角度来展现以下详细描述的某些部分。这些描述和表示是数据处理领域的技术人 员用以将其作品实质最有效地传达给所属领域的其他技术人员的方式。程序、计算机执 行步骤、逻辑块、处理等在此处且一般被认为是导致希望结果的自相容歩骤或指令序列。 所述步骤是需要对物理量进行物理操作的步骤。通常(尽管不必要),这些量采用能在计算 机系统中存储、传递、组合、比较和以其他方式操纵的电信号或磁信号的形式。已多次 证实将这些信号称为位、值、元素、符号、字符、项、数字或类似形式是便利的,主要 是因为常见用法的缘故。然而,应记住所有这些和类似术语与适当物理量相关联且仅仅是应用于这些量的方便标记。除非从以下论述中容易看出另有特别规定,否则理解为在本专利技术中,使用例如 "处理"或"存取"或"执行"或"存储"或"渲染"等术语的论述始终指代计算机系 统(例如图1的计算机系统100)或类似电子计算装置的行为和处理,其操纵表示为计 算机系统的寄存器和存储器内的物理(电子)量的数据并将其变换为类似地表示为计算 机系统存储器或寄存器或其它此类信息存储、传输或显示装置内的物理量的其本文档来自技高网
...

【技术保护点】
一种在图形处理器的光栅级中用于基于瓦片的精度的光栅化的方法,其包含:    接收图形图元以在图形处理器的光栅级中进行光栅化;    以第一级别精度来光栅化所述图形图元以产生多个像素瓦片;以及    以第二级别精度来光栅化所述瓦片以产生覆盖的像素;以及    输出所述覆盖的像素以在所述图形处理器的随后级中进行渲染操作。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:富兰克林C克罗布莱兹A维尼翁
申请(专利权)人:辉达公司
类型:发明
国别省市:US[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1