一种图形处理器深度值提前测试电路制造技术

技术编号:17880112 阅读:35 留言:0更新日期:2018-05-06 01:36
本发明专利技术一种图形处理器深度值提前测试电路,包括提前测试的光栅化单元(1)、深度压缩和解压缩单元(2)、深度Tile Cache和深度TileTable Cache单元(3)、存储深度和Tile的Zmin和Zmax的DDR存储器(4)。在深度压缩时按Tile提取深度的最大值和最小值,并与采用基于Tile的光栅化单元配合使用,能够在图形处理器进行光栅化时按Tile进行提前深度值测试,消去大量不需要绘制的三角形,减轻图形处理器染色流水线的负载,降低存储带宽需求,提高图形绘制性能。

An advanced test circuit for depth value of a graphic processor

An advanced test circuit for a depth value of a graphic processor, including an early test rasterization unit (1), a depth compression and decompression unit (2), a depth Tile Cache and a deep TileTable Cache unit (3), a Zmin and Zmax DDR memory (4) for storage depth and Tile. When the depth is compressed, the maximum and minimum value of the depth is extracted by Tile. With the use of the rasterization unit based on Tile, it can test the depth of the depth in advance by Tile, eliminate a large number of triangles which do not need to be drawn, reduce the load of the dyeing assembly line at the graph and reduce the storage. Storage bandwidth needs to improve the graphics performance.

【技术实现步骤摘要】
一种图形处理器深度值提前测试电路
本专利技术涉及计算机硬件
,涉及一种图形处理器深度值提前测试电路。
技术介绍
3D图形绘制时片段进行深度测试需要对应深度缓冲区的一读一写两次操作,深度缓冲区的访问对DDR的带宽需求极大。在标准的OpenGL实现中,深度测试是在染色流水线的片段处理单元中进行的。片段处理单元通过访问深度缓冲Z-buffer对即将写入帧缓冲区的片段进行深度测试,并将不能通过深度测试的片段丢弃。为了提高系统性能,减少无效图形的绘制,降低存储器带宽需求,目前常用的图形处理器都采用某种技术将深度测试提前。如ATI的HyperZ技术利用两级深度缓冲区,当图形绘制从前向后进行时能够获取很好的效率。但3D绘制的提前深度测试必须与图形绘制的光栅化单元结构一致,没有很好的通用性,必须结合3D绘制流水线进行深度提前测试电路的设计。
技术实现思路
本专利技术的目的是:本专利技术提供一种提高系统性能、减少无效图形绘制、降低存储器带宽需求的图形处理器深度值提前测试电路。本专利技术的技术方案是:一种图形处理器深度值提前测试电路,包括:一种提前测试的光栅化单元1、深度压缩和解压缩单元2、深度TileCache和深度TileTableCache单元3、存储深度和Tile的Zmin和Zmax的DDR存储器4;在光栅化单元1进行片段深度测试后对通过测试的深度数据送到深度压缩和解压缩单元2进行压缩,并产生每个Tile数据的深度最大值和最小值,光栅化时对基于Tile的片段数据进行提前深度测试:其中,提前深度测试失败的Tile被直接丢弃;通过提前深度测试的Tile会被发送到染色器任务调度单元调度到染色器上执行像素染色功能,片断进行像素染色后送到片断处理单元进行深度测试及混合操作,最后通过深度TileCache和深度TileTableCache单元3写入到DDR存储器4中。本专利技术的有益效果是:本专利技术所述的一种图形处理器深度值提前测试电路能够按Tile对光栅化数据进行提前深度测试,将不能通过提前深度测试的数据直接从流水线中消去,大大减少了深度数据对于系统存储带宽的需求,降低了光栅化后续流水线的负载。附图说明图1是本专利技术中一种图形处理器深度值提前测试电路的总体框图;图2是本专利技术中的光栅化单元框图;图3是本专利技术中深度TileCache和TileTableCache单元框图;图4(a)是本专利技术中深度压缩和解压缩单元中深度压缩部分的框图;图4(b)是本专利技术中深度压缩和解压缩单元中深度解压缩部分的框图。具体实施方式下面结合附图和具体实施例,对本专利技术的技术方案进行清楚、完整地表述。显然,所表述的实施例仅是本专利技术一部分实施例,而不是全部的实施例,基于本专利技术中的实施例,本领域技术人员在没有做出创造性劳动前提所获得的所有其他实施例,都属于本专利技术的保护范围。如图1所示,一种图形处理器深度提前测试电路,包括:一种提前测试的光栅化单元1、深度压缩和解压缩单元2、深度TileCache和深度TileTableCache单元3、存储深度和Tile的Zmin和Zmax的DDR存储器4;在光栅化单元1进行片段深度测试后对通过测试的深度数据送到深度压缩和解压缩单元2进行压缩,并产生每个Tile数据的深度最大值和最小值,光栅化时对基于Tile的片段数据进行提前深度测试:其中,提前深度测试失败的Tile被直接丢弃;通过提前深度测试的Tile会被发送到染色器任务调度单元调度到染色器上执行像素染色功能,片断进行像素染色后送到片断处理单元进行深度测试及混合操作,最后通过深度TileCache和深度TileTableCache单元3写入到DDR存储器4中。如图2所示,所述光栅化单元1包括图元顶点命令接收单元、点图元光栅化单元、线图元光栅化单元和三角形图元光栅化单元。图元顶点命令接收单元接收到图元顶点命令,并根据图元属性分别进行点图元光栅化、线图元光栅化或三角形图元光栅化,通过光栅化的数据按Tile与来自深度TileCache和深度TileTableCache单元3的Zmin和Zmax进行逐Tile的提前深度测试,如果当前Tile能够通过提前深度测试则按Tile发送到光栅化后的染色流水线,否则直接丢弃当前Tile数据。如图3所示,深度TileCache和深度TileTableCache单元3中非阻塞的TileCache和TileTableCache具有相同的内部结构,Cache采用全相联和非阻塞设计,当某个Cache请求缺失时,将缺失的请求存储到非阻塞单元的MSHR中,由非阻塞单元启动更新;同时可接收下一组请求,最多可以缓存32个访问请求。如图4(a)所示,本专利技术中深度压缩和解压缩单元中深度压缩部分,将TileCache写回的Tile深度数据进行压缩并存储到DDR存储器4中。深度偏移压缩算法首先计算Tile数据的Zmin和Zmax并将该Tile的Zmin和Zmax送到TileTableCache。同时使用当前深度值与Zmin或Zmax的差值对当前Tile的深度进行编码,编码成功则可以将数据压缩到原始数据的1/4大小并存储到DDR存储器4中,如果压缩失败,则存储原始数据到DDR存储器4中。如图4(b)所示,本专利技术中深度压缩和解压缩单元中深度解压缩部分,从DDR存储器4中读取压缩后的一个Tile数据,将开始的两个32位数据作为Zmin和Zmax存储起来,后续的数据与Zmin或Zmax进行加法得到原始的深度数据,并更新到深度TileCache中。最后应说明的是,以上实施例仅用以说明本专利技术的技术方案,而非对其限制;尽管参照前述实施例对本专利技术进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各实施例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本专利技术各实施例技术方案的精神和范围。本文档来自技高网...
一种图形处理器深度值提前测试电路

【技术保护点】
一种图形处理器深度值提前测试电路,其特征为所述电路包括提前测试的光栅化单元(1)、深度压缩和解压缩单元(2)、深度Tile Cache和深度TileTable Cache单元(3)、存储深度和Tile的Zmin和Zmax的DDR存储器(4);在光栅化单元(1)进行片段深度测试后对通过测试的深度数据送到深度压缩和解压缩单元(2)进行压缩,并产生每个Tile数据的深度最大值和最小值,光栅化时对基于Tile的片段数据进行提前深度测试:其中,提前深度测试失败的Tile被直接丢弃;通过提前深度测试的Tile会被发送到染色器任务调度单元调度到染色器上执行像素染色功能,片断进行像素染色后送到片断处理单元进行深度测试及混合操作,最后通过深度Tile Cache和深度TileTable Cache单元(3)写入到DDR存储器(4)中。

【技术特征摘要】
1.一种图形处理器深度值提前测试电路,其特征为所述电路包括提前测试的光栅化单元(1)、深度压缩和解压缩单元(2)、深度TileCache和深度TileTableCache单元(3)、存储深度和Tile的Zmin和Zmax的DDR存储器(4);在光栅化单元(1)进行片段深度测试后对通过测试的深度数据送到深度压缩和解压缩单元(2)进行压缩,并产生每个Tile数据的深度最大值和最小值,光栅化时对基于Tile的片段数据进行提前深度测试:其中,提前深度测试失败的Tile被直接丢弃;通过提前深度测试的Tile会被发送到染色器任务调度单元调度到染色器上执行像素染色功能,片断进行像素染色后送到片断处理单元进行深度测试及混合操作,最后通过深度TileCache和深度TileTableCache单元(3)写入到DDR存储器(4)中。2.根据权利要求1所述的图形处理器深度值提前测试电路,其特征为:所述光栅化单元(1)包括图元顶点命令接收单元、点图元光栅化单元、线图元光栅化单元和三角形图元光栅化单元。3.根据权利要求1所述的图形处理器深度值提前测试电路,其特征为:所述深度TileCache和深度TileTableCache单元(...

【专利技术属性】
技术研发人员:郑新建张骏韩立敏任向隆
申请(专利权)人:中国航空工业集团公司西安航空计算技术研究所
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1