当前位置: 首页 > 专利查询>天津大学专利>正文

嵌入式GPU中面积有效、功能复用的裁剪模块制造技术

技术编号:9922052 阅读:116 留言:0更新日期:2014-04-14 18:25
本实用新型专利技术涉及计算机图形学和集成电路设计领域,为提高裁剪率,减少裁剪周期,提高嵌入式GPU的整体性能,本实用新型专利技术采取的技术方案是,嵌入式GPU中面积有效、功能复用的裁剪模块,包括6个小模块:寄存器组(Register?Group)、编码单元(Outcoding?Unit)、预裁剪单元(Pre-Clipping?Unit)、SH(Sutherland-Hodgeman)裁剪单元(SH?Clipping?Unit)、共用运算单元(Shared?Arithmetic?Unit)、以及控制单元(Control?Unit);方法分为预裁剪和裁剪两部分,预裁剪将会处理一些容易判断位置的图形。而当预裁剪判定该图形需要裁剪时,则需要对图形进行裁剪,得到新的图形输出到下一个阶段。本实用新型专利技术主要应用于计算机图形学和集成电路设计。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【专利摘要】本技术涉及计算机图形学和集成电路设计领域,为提高裁剪率,减少裁剪周期,提高嵌入式GPU的整体性能,本技术采取的技术方案是,嵌入式GPU中面积有效、功能复用的裁剪模块,包括6个小模块:寄存器组(Register?Group)、编码单元(Outcoding?Unit)、预裁剪单元(Pre-Clipping?Unit)、SH(Sutherland-Hodgeman)裁剪单元(SH?Clipping?Unit)、共用运算单元(Shared?Arithmetic?Unit)、以及控制单元(Control?Unit);方法分为预裁剪和裁剪两部分,预裁剪将会处理一些容易判断位置的图形。而当预裁剪判定该图形需要裁剪时,则需要对图形进行裁剪,得到新的图形输出到下一个阶段。本技术主要应用于计算机图形学和集成电路设计。【专利说明】嵌入式GPU中面积有效、功能复用的裁剪模块
本技术涉及计算机图形学和集成电路设计领域,具体讲,涉及嵌入式GPU中面积有效、功能复用的裁剪单元。技术背景目前在图形学中传统的裁剪算法主要有Cohen-Sutherland算法、Liang-Barsky算法、Nicholl-Lee-Nicholl算法、Sutherland-Hodgeman算法。其中前三者是相对于线段而言,最后一个是对于多边形的裁剪。在嵌入式GPU领域,目前对于裁剪模块有研究的有韩国科学技术学院(KAIST)的Lee-Sup Kim教授带领的课题组,其成果主要是2005年发表的论文“AnllM-triangles/sec3D Graphics Clipping Engine for Triangle Primitives” 和 2008 年发表的论文“Clipping-Ratio_Independent3D Graphics Clipping Engine by Dual-ThreadAlgorithm”和台湾国立中山大学在2008年发表的论文“Efficient Pre-Clipping andClipping Algorithms for3D Graphics Geometry Computation,,。第一篇论文在预裁剪阶段采用的是编码方法,在裁剪阶段,论文改进了裁剪算法,从而增强了性能,并且提出了相关的硬件架构,给出了最终的时钟频率和所占面积。第二篇论文提出了一种新的硬件架构,该架构同时处理两个三角形的裁剪。第三篇论文提出了一种更加有效的预裁剪算法,提高裁剪率,而在裁剪算法里,改进了 Sutherland-Hodgeman算法,用相对应的两个平面来做裁剪,减少了裁剪周期。台湾国立中山大学在2008年发表的一篇论文中,在预裁剪阶段增加了斜率判定,提高了剔除率,但是由于该算法只是理论研究,实际在硬件实现上存在两个问题:1:在时间上,计算斜率涉及到除法运算,在硬件上,除法消耗的周期较长。2:在面积上,由于增加了斜率判定,必定会增加许多运算单元,这在嵌入式GPU来说是致命的问题。
技术实现思路
为克服现有技术的不足,提高裁剪率,减少裁剪周期,提高嵌入式GPU的整体性能,为此,本技术采用的技术方案是,嵌入式GPU中面积有效、功能复用的裁剪模块,包括6个小模块:寄存器组(Register Group)、编码单元(Outcoding Unit)、预裁剪单元(Pre-Clipping Unit)、SH (Sutherland-Hodgeman)裁剪单兀(SH Clipping Unit)、共用运算单元(Shared Arithmetic Unit)、以及控制单元(Control Unit);在以上的各个模块中,数据通路如下:裁剪模块接收到顶点数据,将数据存放在寄存器组;编码单元对顶点数据编码,得到的编码存放回寄存器组,编码完后预裁剪单元判定三角形是否需要裁剪,产生相关信号并将信号传给控制单元;控制单元根据预裁剪单元传回的信号,判定是否需要进行SH裁剪,如果根据信号判定三角形和可视窗口相交则需要SH裁剪,将顶点数据传入SH裁剪单元,经过三级裁剪-X和-x,Y和-Y,Z和-Z ;产生新的数据并传回顶点寄存器组,最后将新的顶点数据重组若干个三角形输出,如果信号表明三角形在可视窗口内,则控制单元直接将顶点数据传给下一个模块;如果信号表明三角形在可视窗口外,则控制单元删除顶点数据,并接收下一组顶点数;共用运算单元由两个4维向量内积运算单元(Floating_point4D Vector DotProduct, DP4)组成;一共有4对四维向量输入,来自预裁剪单元2对,来自SH裁剪单元2对,并根据控制信号来选择哪2对进行运算,如果控制信号显示目前处于预裁剪阶段,则选择来自预裁剪单元的向量,反之,则选择裁剪单元的向量;所述寄存器组:裁剪模块中需要存放三种不同的数据,输入的三角形顶点数据,顶点的编码和新生成的顶点,其中每个顶点所占的位宽为16*4*4=256字节,而每个编码占6位;所述编码单元(Outcoding Unit),由浮点比较器构成,一个顶点需要6个浮点比较器。所述预裁剪单元用于:首先从寄存器组中获得顶点的编码并对编码进行与和或运算依次来判定三角形和可视窗口的位置关系,如果编码能判定,则输出相关信号给控制单元,如果不能,则进行斜率判定。所述SH裁剪单元用于求交计算,由DP4、除法器、寄存器、3、4级寄存、乘法器组成,DP4的周期为4,除法器的周期为3,DP4_1在第一个周期,输入是分母的一对4维向量((xb, wb, xa,wa), (1,1,-1,-1)根据公式9),计算分母的值,结果传入到除法器中求倒数,然后将倒数放在寄存器中,从第二个周期起,输入是分子的一对4维向量,由于在第5个周期时,DP4已经计算完分子的值,而分母的倒数没有计算完,所以在设计上加上3级寄存,以等待倒数计算完成,一起做乘法,得到新顶点的每个分量值;DP4_2从第一个周期起,就开始计算分子的值,所以在乘法器之前需要4级寄存,由于每求一个顶点需要计算63个分量,而DP4_1在第一个周期计算分母,所以DP_1计算31个分量,DP4计算32个分量,每个DP4都刚好计算32对向量。本技术具有如下技术效果:本技术采用6个嵌入式GPU中面积有效、功能复用的裁剪模块,因而本技术能够提高裁剪率,减少裁剪周期,具有较高的整体性能。【专利附图】【附图说明】附图1图形流水线。附图23D空间的编码。附图3三角形和区域。附图4率判定原理。附图5斜率判定。附图6边和裁剪线的四种关系。附图7线段和裁剪线的九种关系。附图8裁剪单元的硬件框架。附图9编码单元。附图10共用运算单元架构图。附图11裁剪单元的求交计算。附图12GPU硬件框架。【具体实施方式】嵌入式GPU是嵌入式系统的图形处理单元,将输入的图形数据经过图形流水线处理,并最终显示在屏幕上。图形流水线如附图1所示。从图形流水线中可知,裁剪是其中重要的一步,所以裁剪单元的性能影响着嵌入式GPU的整体性能。裁剪模块是GPU中一个重要的模块。该模块接收来自图元组装模块的数据,然后剔除处于可视窗口之外的点和图形,或者计算交点,产生新的点和图形,最后进行透视除法并将数据组成新的三角形传递给光栅化模块本文档来自技高网
...

【技术保护点】
一种嵌入式GPU中面积有效、功能复用的裁剪模块,其特征是,包括6个小模块:寄存器组(Register?Group)、编码单元(Outcode?Unit)、预裁剪单元(Pre?Clipping?Unit)、SH(Sutherland?Hodgeman)裁剪单元(SH?Clipping?Unit)、共用运算单元(Shared?Arithmetic?Unit)、以及控制单元(Control?Unit);在以上的各个模块中,数据通路如下:裁剪模块接收到顶点数据,将数据存放在寄存器组;编码单元对顶点数据编码,得到的编码存放回寄存器组,编码完后预裁剪单元判定三角形是否需要裁剪,产生相关信号并将信号传给控制单元;控制单元根据预裁剪单元传回的信号,判定是否需要进行SH裁剪,如果根据信号判定三角形和可视窗口相交则需要SH裁剪,将顶点数据传入SH裁剪单元,经过三级裁剪:X和?X,Y和?Y,Z和?Z;产生新的数据并传回顶点寄存器组,最后将新的顶点数据重组若干个三角形输出,如果信号表明三角形在可视窗口内,则控制单元直接将顶点数据传给下一个模块;如果信号表明三角形在可视窗口外,则控制单元删除顶点数据,并接收下一组顶点数;共用运算单元由两个4维向量内积运算单元(Floating?point4D?Vector?Dot?Product,DP4)组成;一共有4对四维向量输入,来自预裁剪单元2对,来自SH裁剪单元2对,并根据控制信号来选择哪2对进行运算,如果控制信号显示目前处于预裁剪阶段,则选择来自预裁剪单元的向量,反之,则选择裁剪单元的向量。...

【技术特征摘要】

【专利技术属性】
技术研发人员:魏继增王航胜常轶松孙济洲郭炜
申请(专利权)人:天津大学
类型:实用新型
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1