绘图处理单元制造技术

技术编号:8453442 阅读:192 留言:0更新日期:2013-03-21 18:53
本发明专利技术涉及增进绘图处理单元的总处理量的方法与系统,此系统包含可执行多个线程的执行单元,该执行单元可同时处理对常数闪速存储器、顶点属性闪速存储器、至少一个共同暂存器文件以及执行单元数据路径的存取要求。

【技术实现步骤摘要】

本专利技术涉及改善绘图处理单元的总处理量的方法与系统,特别是涉及可同时处理多个线程的多个存取要求的执行单元改善方法和系统。
技术介绍
众所皆知,三维计算机绘图技术着重于将三维(3D)物体以二维(2D)影像的方式呈现出来,并显示于诸如阴极线真空管(CRT)屏幕或液晶屏幕(LCD)之类的显示装置上。此三维物体可以是简单的几何基元(primitive),例如点、线段、三角形或是多边形 (polygon)。较为复杂的物体则是以一系列相连的平面多边形的方式呈现在显示装置上,例如一连串的平面三角形。所有的图形基元都可以单一顶点或一组顶点的方式来表示,例如以座标(Χ,Υ,Ζ)来定义一个点,或是线段的某一端点,或是多边形的某一个顶点。为了产生用来代表三维物体的二维投影数据使物体可呈现在显示装置上,图形基元的顶点需要经过一连串的操作,以及绘图显像管线的多个阶段来处理。一般的管线是由一连串相连的处理单元或阶段所组成,上一阶段的输出可做为下一阶段的输入。对于绘图处理单元而言,管线阶段包括以下逐一顶点操作,基元合成操作,像素操作,像素合成操作,光栅扫描(rasterization)操作以及碎型(fragment)操作等等。在典型的绘图显示系统中,可利用影像数据库来储存场景中物体的叙述符 。物体可以多个小多边形来表示,这些小多边形是涵盖物体表面的多边形,如同墙面上的磁砖。每一个多边形又可以顶点座标清单以及表面材质特性来表示,甚或再包括每一顶点相对于表面的法线向量。顶点座标清单可以是模型空间的XYZ座标,表面材质特性可包括颜色,纹理或亮度等。对于具有复杂曲面的三维物体,通常是以三角形或四边形来表示,而四边形又可拆解为一对三角形。当使用者决定了观看的角度,转换引擎单元便将物体座标转换至相对于观赏角度。此外,使用者可以指定视野范围,所产生的影像的大小,以及可见物体的后方是否包含某一背景或是将背景删除。当视野区域选定之后,裁剪单元将位于视野区域之外的多边形剔除,并且将部份位于视野区域之外部份位于视野区域之内的多边形加以裁剪。裁减后的多边形对应至原多边形位于视野区域之内的部份,其裁减后的边缘对应至视野区域的边界。接着多边形的顶点会传递到下一个管线阶段,包含每一顶点在视野区域的座标(XY)以及其相对的深度值 (Z)。之后一般的绘图处理系统会进行光源模型处理,再将多边形以及其颜色值传递至光栅扫描器。对每一个多边形而言,光栅扫描器会判断哪些像素位在此多边形,并将其对应的颜色值和深度值写入帧缓冲器(frame buffer)。光栅扫描器会比较目前处理的多边形其像2/11 页素的深度值与原先储存在帧缓冲器相对应位置的像素的深度值,如果多边形像素的深度值较小,表示其位于帧缓冲器所储存的像素的前方,则以多边形像素的深度值取代原帧缓冲器的深度值,因为目前处理的多边形会遮蔽原先储存于帧缓冲器内的多边形。上述步骤会持续重复直到所有的多边形都已显像处理过。之后,影像控制器会将帧缓冲器的内容以逐一扫描线的方式呈现在显示装置上。实现即时显像的典型方式是以像素来显示多边形,此像素可能位于多边形之内或之外,所产生的多边形边缘在静态显示之下可能产生不规则外观,而在动态显示之下则是模糊的影像。其问题的背后成因在于锯齿(aliasing)效应,而用以降低此效应的方法就称为反锯齿(anti-aliasing)技术。以屏幕为基础的反锯齿方法并不需要欲显像的物体的相关信息,因为此种方法只需要绘图管线的输出样本。其中一种典型的反锯齿方法是利用扫描线反锯齿技术,称为多取样反锯齿(Multi-Sample Anti-Aliasing, MSAA)方法,此方法在每一次传递时都对单一像素作一个以上的取样。从每一个像素所取样出来的样本,或称做次像素的数量即是所谓的取样率,一般来说取样率越高就会耗费越多的存储器流量。虽然上文仅简略说明绘图处理单元的各个元件的大致操作,本领域的技术人员应可理解绘图数据的处理十分繁复,因此提高处理效能与降低设计复杂度为常见考量和需求。若能提高绘图处理单元的数据总处理量(throughput),不仅可达到提高处理效能的目的,亦可在维持一定效能之下,减少硬件需求的复杂度。
技术实现思路
本专利技术的一实施例提供一种绘图处理单元,包含一执行单元,用以处理可编程着色器操作,并可用以同时处理多个线程的处理操作;一第一存储器单元,用以形成一暂存器文件来调节该多个线程的暂存器操作,该存储器单元包含多个存储库,其中多个第一存储库分配给多个第一线程,多个第二存储库分配给多个第二线程;一第二存储器单元,用以形成一常数闪速存储器来调节该执行单元的该多个线程所对应的多个着色器操作的常数存取,该常数闪速存储器用以储存对应于该多个着色器操作的多个内文,并用以储存该多个内文的多个常数的多个版本;以及一第三存储器单元,用以形成一顶点属性闪速存储器来调节该执行单元的该多个线程所对应的多个着色器操作的顶点属性存取。本专利技术的另一实施例提供一种绘图处理单元,包含一执行单元,可用以执行多线程操作,该执行单元包含一线程控制器,该线程控制器包含一第一指令撷取仲裁器和一第二指令撷取仲裁器;其中该第一指令撷取仲裁器用以代表该执行单元的多个第一线程来撷取指令;以及该第二指令撷取仲裁器用以代表该执行单元的多个第二线程来撷取指令。本专利技术的又一实施例一种适用于执行单元的指令处理方法,包含对应于多个有效线程的一第一有效线程,从一指令闪速存储器撷取一执行单元的一第一指令;传播该第一指令给该多个有效线程;维持该第一指令于对应于该多个有效线程至少其中一个的一指令队列中;解码该指令队列中的一第二指令;以及发送该第二指令的数据存取要求给至少下列一个一常数闪速存储器、一顶点属性闪速存储器、一共同暂存器文件和一执行单元数据路径。附图说明图1为现有技术的计算机系统的绘图管线的部份元件的功能方块图。图2为本专利技术一实施例的绘图处理管线的部分元件方块图。图3为本专利技术一实施例的绘图处理器的方块图。图4为本专利技术一实施例的执行单元的内部方块图。图5为本专利技术一实施例的常数闪速存储器的功能方块图。图6为本专利技术另一实施例的执行单元的内部方块图。图7为本专利技术一实施例的操作流程图。附图符号说明100:绘图处理管线110:顶点着色器120:几何着色器 130:三角形设置单元140:跨距/像砖产生器150:属性设置单元160:像素着色器170:帧缓冲器200:绘图处理管线250:存储器单元252:命令串流处理器254:顶点着色器256:几何着色器257:三角形设置单元258:跨距/像砖产生器259:属性设置单元260:像素着色器262:帧缓冲器304:执行单元集区控制单元306:执行单元集区308:顶点着色器310:几何着色器312:像素着色器318:跨距/像砖产生器320:三角形设置单元322:属性设置单元400、600:执行单元402、604:线程控制器404,606:指令撷取仲裁器O406、608:指令撷取仲裁器I408、602:指令闪速存储器410,624:常数闪速存储器412 :L2闪速存储器存取单元413:指令传播总线414,628:顶点属性闪速存储器416,632:共同暂存器文件O417,610,612:偶数线程418,634:共同暂存器文件I本文档来自技高网
...

【技术保护点】
一种绘图处理单元,包含:一执行单元,可用以执行多线程操作,该执行单元包含一线程控制器,该线程控制器包含一第一指令撷取仲裁器和一第二指令撷取仲裁器;其中该第一指令撷取仲裁器用以代表该执行单元的多个第一线程来撷取指令;以及该第二指令撷取仲裁器用以代表该执行单元的多个第二线程来撷取指令。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:洪洲焦阳
申请(专利权)人:威盛电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1