当前位置: 首页 > 专利查询>辉达公司专利>正文

对系统存储器的GPU渲染技术方案

技术编号:3026283 阅读:223 留言:0更新日期:2012-04-11 18:40
一种图形处理子系统使用系统存储器作为其用于渲染并扫描输出图像图形存储器。为了防止数据总线的死锁,图形处理子系统可使用数据总线的交替虚拟信道来从系统存储器存取完成第一数据的写入操作所需的附加数据。在与系统存储器的通信中,包括扩展字节启用信息的数据包允许图形处理子系统将具有任意字节屏蔽的大量数据写入系统存储器。为了提高经渲染图像数据的二维局部性的等级,图形处理子系统以平铺式格式将图像数据排列在系统存储器中。平铺块翻译单元将图像数据虚拟地址转换成对应的系统存储地址。图形处理子系统从系统存储器中读取图像数据并将其转换成显示信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及计算机图形学的领域。通过算术模拟光与从给定观看点观看的三维场景的相互作用来创建很多计算机图形图像。被称为渲染的此过程产生从给定观看点观看的场景的二维图像,且类似于拍摄一张现实场景的照片。
技术介绍
随着对计算机图形且尤其对实时计算机图形的需求增加,具有适合于加速渲染过程的图形处理子系统的计算机系统已经变得普遍。在这些计算机系统中,渲染过程在计算机的通用中央处理单元(CPU)与图形处理子系统之间分配。通常,CPU执行高等级操作,例如确定给定场景中对象的位置、运动和碰撞。根据这些高等级操作,CPU产生界定所需渲染图像的一组渲染命令和数据。举例来说,渲染命令和数据可为场景界定场景几何形状、照明、着色、纹理、运动和/或摄影参数。图形处理子系统从所述组渲染命令和数据中创建一个或一个以上渲染图像。典型图形处理子系统包括一个或一个以上图形处理单元(GPU)或协处理器。每个GPU均执行由CPU产生的渲染命令。除一个或一个以上GPU外,图形处理子系统还包括存储器。图形子系统存储器用于存储要输出到显示设备的一个或一个以上渲染图像、几何形状数据、纹理数据、照明和着色数据和用于产生一个或一个以上渲染图像的其它数据。为了最大化渲染性能,图形子系统存储器通常与由计算机系统使用的通用系统存储器分离。这允许图形处理子系统最大化存储器存取性能,且因此最大化渲染性能。然而,具有用于图形处理子系统的独立存储器显著增加了成本,不仅是因为额外存储器(其可为数百兆字节或更多)的费用,而且是由于例如功率调节器、滤波器和冷却设备的支持组件的成本以及电路板的附加复杂性的缘故。此外,独立的图形处理子系统存储器所需的额外空间可带来困难,尤其对于笔记本式计算机或移动设备来说。对与独立的图形处理子系统存储器相关的问题的一种解决方案是使用统一存储器结构,其中图形处理子系统所需的所有数据,例如几何形状数据、纹理数据、照明和着色数据以及渲染图像,均存储在计算机系统的通用系统存储器中。传统上,连接图形处理子系统与系统存储器的数据总线限制了统一存储器结构系统的性能。例如PCI-Express数据总线标准的改进的数据总线标准增加了可用于存取存储器的带宽;然而,用统一存储器结构来达到最佳渲染性能仍需要对存储器带宽和等待时间的仔细关注。此外,PCI-Express数据总线标准带来其自身的问题,包括系统死锁和用于选择性存储器存取的高开销。另外,扫描输出(将渲染图像从存储器转移到显示设备的过程)需要精确的计时以防止视觉不连续性和误差。因此,执行从存储在系统存储器中的渲染图像的扫描输出较困难。因此,需要一种图形处理子系统,其使用统一存储器结构来提供良好的渲染性能和从系统存储器无误差的扫描输出。此外,需要所述图形处理子系统防止例如系统死锁和用于选择性存储器存取的高开销的问题。
技术实现思路
本专利技术的实施例使图形处理子系统能够使用系统存储器作为其用于渲染和扫描输出图像图形存储器。为了防止数据总线的死锁,图形处理子系统可使用数据总线的交替虚拟信道来从系统存储器存取完成第一数据的写入操作所需的附加数据。在与系统存储器的通信中,包括扩展字节启用信息(extended byte enable information)的数据包允许图形处理子系统将具有任意字节屏蔽的大量数据写入系统存储器。为了提高经渲染图像数据的二维局部性的等级,图形处理子系统以平铺式格式将图像数据排列在系统存储器中。平铺块翻译单元将图像数据虚拟地址转换成对应的系统存储地址。图形处理子系统从系统存储器读取图像数据并将其转换成显示信号。在实施例中,图形处理子系统包含渲染单元,其适合于响应于渲染数据而产生渲染图像的图像数据;和数据总线接口,其适合于经由数据总线而与计算机系统的系统存储器设备连接。响应于将第一数据写入到与图形处理子系统相关的图形存储器的写入操作,图形处理子系统适合于检索完成第一数据的写入操作所必需的第二数据。接着,图形处理子系统从第二数据确定系统存储器中第一数据的目的地,并将第一数据的写入操作重新定向到系统存储器中第一数据的目的地。在进一步实施例中,系统存储器中第一数据的目的地位于指定为与图形处理子系统相关的图形存储器的系统存储器的一部分内。在另一实施例中,第二数据包括地址翻译信息,且图形处理子系统适合于将与图形存储器相关的虚拟地址翻译成系统存储器中对应的目的地。在实施例中,图形处理子系统适合于经由数据总线接口从数据总线的第一虚拟信道接收第一数据的写入操作,并使用数据总线的第二虚拟信道经由数据总线接口从系统存储器检索第二数据。在替代实施例中,图形处理子系统适合于从与图形处理子系统连接的局部存储器检索第二数据。在进一步实施例中,图形处理子系统包括平铺块地址翻译单元,其适合于将对应于图像中的位置的虚拟存储地址转换成系统存储器中的图像数据的平铺式排列内的存储地址。平铺块地址翻译单元可进一步适合于响应对应于图像的连续部分的虚拟存储地址的范围而通过数据总线经由数据总线接口来起始复数个系统存储器存取。取决于虚拟存储地址的范围,所述复数个系统存储器存取可用于系统存储器的非连续部分。在另一实施例中,数据总线接口适合于响应指示与系统存储器相关的存储器控制器与第一数据包类型兼容的指令而经由数据总线使用第一数据包类型的数据包与系统存储器通信第三数据。第一数据包类型包括扩展字节启用数据。响应于指示存储器控制器与第一数据包类型不兼容的指令,数据总线接口通过使用第二数据包类型的复数个数据包经由数据总线与系统存储器通信第三数据。在附加实施例中,图形处理子系统包括显示设备控制器,其适合于与显示设备通信与渲染图像对应的显示信号。在一个实施例中,显示设备控制器适合于从与图形处理子系统连接的局部存储器检索与渲染图像对应的图像数据。在另一实施例中,显示设备控制器适合于从系统存储器检索与渲染图像对应的图像数据。在实施例中,显示设备控制器适合于从系统存储器中的图像数据的平铺式排列检索与渲染图像的第一行对应的第一图像数据,并与显示设备通信第一图像数据。图形处理子系统可从系统存储器检索与包括渲染图像的第一行的渲染图像的一组平铺块对应的一组图像数据。图形处理子系统可丢弃所述组图像数据的不包括图像数据的所述第一行的一部分。在替代实施例中,显示设备控制器包括图像数据高速缓冲存储器,其适合于存储包括在所述组平铺块中且与渲染图像的至少一个附加行对应的第二图像数据。显示设备控制器适合于在检索第一图像数据后从图像数据高速缓冲存储器检索第二图像数据,并与显示设备通信第二图像数据。附图说明将参考附图来描述本专利技术,其中图1是适合实践本专利技术实施例的计算机系统的方框图;图2说明根据本专利技术实施例的用于防止系统死锁的一般技术;图3说明根据本专利技术另一实施例的用于防止系统死锁的一般技术;图4A和4B说明根据本专利技术实施例的用于通过数据总线选择性地存取存储器的系统;图5A和5B说明根据本专利技术实施例的组织系统存储器中的显示信息以改进渲染性能的系统;图6A和6B说明根据本专利技术实施例的用于存取显示信息的系统;和图7A-7C说明根据本专利技术实施例的用于将系统存储器中的显示信息输出到显示设备的系统。在附图中,使用相同参考数字来指示相同组件。具体实施例方式图1是适合于实践本专利技术实施例的计算机本文档来自技高网
...

【技术保护点】
一种图形处理子系统,其包含:一渲染单元,其适合于响应于渲染数据而产生一渲染图像的图像数据;和一数据总线接口,其适合于经由一数据总线与一计算机系统的一系统存储器设备连接;其中响应于一将一第一数据写入到一与所述图形处理子系统相关的图形存储器的写入操作,所述图形处理子系统适合于检索完成所述第一数据的所述写入操作所必需的一第二数据,从所述第二数据确定所述系统存储器中所述第一数据的一目的地,并将所述第一数据的所述写入操作重新定向到所述系统存储器中的所述第一数据的所述目的地。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:奥伦鲁宾斯坦戴维G里德乔纳M阿尔本
申请(专利权)人:辉达公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利