具有混合精度指令执行的可编程串流处理器制造技术

技术编号:5087121 阅读:260 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种可编程串流处理器,其能够使用不同执行单元来执行混合精度(例如,全精度、半精度)指令。所述各种执行单元各自能够使用图形数据来在特定精度级别下执行指令。示范性可编程着色器处理器包括一控制器及多个执行单元。所述控制器经配置以接收供执行的指令及接收对所述指令的执行的数据精度的指示。所述控制器还经配置以接收单独转换指令,所述单独转换指令在经执行时将与所述指令相关联的图形数据转换到所述所指示的数据精度。当可操作时,所述控制器基于所述所指示的数据精度来选择所述执行单元中的一者。所述控制器接着使所述选定执行单元使用与所述指令相关联的所述图形数据以所述所指示数据精度执行所述指令。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及图形处理,且更特定来说,涉及图形处理器架构。
技术介绍
图形装置广泛用于渲染用于例如视频游戏、图形程序、计算机辅助设计(CAD) 应用程序、模拟及视觉化工具、成像及其类似者等各种应用的二维(2-D)及三维(3-D) 图像。图形装置可执行各种图形操作以渲染图像。所述图形操作可包括光栅化、模板及 深度测试、纹理映射、着色(shading)及其类似者。3-D图像可用若干表面来建模,且可 用多边形(例如,三角形)来近似每一表面。为渲染目的而用于表示3-D图像的三角形 的数目视所述表面的复杂性以及所述图像的所要分辨率而定。每一三角形可由三个顶点来界定,且每一顶点与各种属性(例如,空间坐标、 色值及纹理坐标)相关联。当图形装置在渲染过程期间使用顶点处理器时,所述顶点处 理器可处理所述各个三角形的顶点。每一三角形还由图片元素(像素)构成。当所述图 形装置还(或单独地)在渲染过程期间使用像素处理器时,所述像素处理器通过确定每 一三角形内的每一像素的分量的值来渲染所述三角形。在许多情况下,图形装置可利用着色器处理器来执行某些图形操作,例如着 色。着色为涉及照明及阴影的高复杂的图形操作。当执行渲染时,所述着色器处理器 可能需要执行多种不同指令,且通常包括一个或一个以上执行单元以辅助这些指令的执 行。举例来说,所述着色器处理器可包括算术逻辑单元(ALU)和/或初等函数单元 (EFU)作为执行单元。常常,这些执行单元能够使用全数据精度电路来执行指令。然 而,此电路可常常要求更多功率,且所述执行单元可占据由所述图形装置所使用的着色 器处理器集成电路内的更多物理空间
技术实现思路
大体上,本专利技术涉及图形装置的可编程串流处理器,所述可编程串流处理器能 够使用不同执行单元来执行混合精度(例如,全精度、半精度)指令。举例来说,所述 可编程处理器可包括一个或一个以上全精度执行单元以及一个或一个以上半精度执行单 元。在接收到二进制指令及对所述指令的执行的数据精度的指示后,所述处理器即能够 选择适当执行单元以用于在所指示的数据精度下执行接收到的指令。所述处理器可包含 用于移动图形应用程序的基于指令的适应性串流处理器。通过此做法,所述处理器可避免使用一个执行单元来执行具有各种不同数据精 度的指令。结果,可减少或消除不必要的精度提升。另外,应用程序程序员在编写应用 程序代码时可具有增大的灵活性。应用程序程序员可为不同应用程序指令指定不同数据 精度级别,所述不同数据精度级别接着经编译成由所述处理器处理的一个或一个以上二 进制指令。在一个方面中,本专利技术是针对一种方法,其包括接收供在可编程串流处理器内10执行的图形指令;接收对所述图形指令的执行的数据精度的指示;以及接收转换指令, 所述转换指令在由所述处理器执行时将与所述图形指令相关联的图形数据转换到所指示 的数据精度,其中所述转换指令不同于所述图形指令。所述方法进一步包括基于所述所 指示的数据精度来选择所述处理器内的多个执行单元中的一者,以及使用所述选定执行 单元以使用与所述图形指令相关联的图形数据来在所述所指示的数据精度下执行所述图 形指令。在一个方面中,本专利技术是针对一种计算机可读媒体,其包括用于使可编程串流 处理器进行以下操作的指令接收供在所述处理器内执行的图形指令;接收对所述图形 指令的执行的数据精度的指示;以及接收转换指令,所述转换指令在由所述处理器执行 时将与所述图形指令相关联的图形数据转换到所指示的数据精度,其中所述转换指令不 同于所述图形指令。所述计算机可读媒体进一步包括用于使所述处理器进行以下操作的 指令基于所述所指示的数据精度来选择所述处理器内的多个执行单元中的一者,以及 使用所述选定执行单元以使用与所述图形指令相关联的图形数据来在所述所指示的数据 精度下执行所述图形指令。在一个方面中,本专利技术是针对一种可编程串流处理器,其包括一控制器及多个 执行单元。所述控制器经配置以接收供执行的图形指令及接收对所述图形指令的执行的 数据精度的指示。所述控制器还经配置以接收转换指令,所述转换指令在由所述处理器 执行时将与所述图形指令相关联的图形数据转换到所指示数据精度,其中所述转换指令 不同于所述图形指令。当可操作时,所述控制器基于所指示的数据精度来选择所述执行 单元中的一者。所述控制器接着使所述选定执行单元使用与所述图形指令相关联的图形 数据在所指示数据精度下执行所述图形指令。在另一方面中,本专利技术是针对一种计算机可读媒体,其包括用于使处理器进行 以下操作的指令分析图形应用程序的多个应用程序指令;以及对于指定执行的第一数 据精度级别的每一应用程序指令,产生各自指示执行的所述第一数据精度级别的一个或 一个以上对应经编译指令。所述计算机可读媒体包括用于使所述处理器进行以下操作的 其它指令产生一个或一个以上转换指令以在所述一个或一个以上经编译指令经执行时 将图形数据从第二不同数据精度级别转换到所述第一数据精度级别。在一个方面中,本专利技术是针对一种计算机可读数据存储媒体,其具有一个或一 个以上第一可执行指令,所述一个或一个以上第一可执行指令在由可编程串流处理器执 行时支持图形应用程序的一个或一个以上功能,其中所述第一可执行指令中的每一者指 示其执行的第一数据精度级别。所述计算机可读数据存储媒体进一步包括一个或一个以 上第二可执行指令,所述一个或一个以上第二可执行指令在由所述处理器执行时支持所 述图形应用程序的一个或一个以上功能,其中所述第二可执行指令中的每一者指示其执 行的不同于所述第一数据精度级别的第二数据精度级别。所述计算机可读数据存储媒体 进一步包括一个或一个以上第三可执行指令,所述一个或一个以上第三可执行指令在由 所述处理器执行时支持所述图形应用程序的一个或一个以上功能,其中所述第三可执行 指令中的每一者在所述一个或一个以上第一可执行指令经执行时将图形数据从所述第二 数据精度级别转换到所述第一数据精度级别。在随附图式及以下描述中阐述本专利技术的一个或一个以上方面的细节。其它特11征、目标及优点将从描述及图式以及从权利要求书而显而易见。 附图说明图1为根据本专利技术的一方面说明可包括于图形处理系统内的各种组件的框图。图2A为根据本专利技术的一方面说明包括可编程着色器处理器的示范性图形处理系 统的框图。图2B为根据本专利技术的一方面说明图2A中所示的着色器处理器的其它细节的框 图。图2C为根据本专利技术的一方面说明图2B中所示的执行单元及寄存器组的其它细 节的框图。图3为根据本专利技术的一方面说明可由图2A到图2B中所示的着色器处理器执行 的示范性方法的流程图。图4为根据本专利技术的一方面说明可用以产生待由图1中所示的串流处理器或由图 2A到图2B中所示的着色器处理器执行的图形指令的编译器的框图。具体实施例方式图1为根据本专利技术的一个方面说明可包括于图形处理系统内的各种组件的框 图。此图形处理系统可为独立系统或可为例如计算系统或无线通信装置(例如,无线通 信装置手持机)等较大系统的部分,或数码相机或其它视频装置的部分。图1中所示的示 范性系统可包括一个或一个以上图形应用程序102A到102N、图形装置100,及外部存储 器104。图形装置100可通信地耦合到外部存储器104及图形应用程序102A到102N中本文档来自技高网
...

【技术保护点】
一种方法,其包含:  接收供在可编程串流处理器内执行的图形指令;接收对所述图形指令的执行的数据精度的指示;  接收转换指令,所述转换指令在由所述处理器执行时将与所述图形指令相关联的图形数据转换到所述所指示数据精度,所述转换指令不同于所述图形指令;  基于所述所指示数据精度来选择所述处理器内的多个执行单元中的一者;以及  使用所述选定执行单元来使用与所述图形指令相关联的所述图形数据以所述所指示数据精度执行所述图形指令。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:杜云于春焦国方斯蒂芬莫洛伊
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1