【技术实现步骤摘要】
【国外来华专利技术】图形处理器寄存器重命名机制
本文所描述的实施例总体上涉及计算机。更具体地,描述了用于在图形处理器中实施物理寄存器的实施例。
技术介绍
图形处理涉及执行用于图像渲染的快速数学计算。可以在作为专用电子电路的图形处理单元(GPU)处执行这种图形工作负荷以快速操纵和更改存储器,从而加速在帧缓冲器中创建旨在输出到显示器的图像。当前GPU设计上可用的寄存器堆的大小(或者物理寄存器的量)对GPU性能和功耗两者都具有较大影响。为了满足对当代图形工作负荷日益增长的吞吐量需求,GPU依赖于对多个硬件上下文的高度并行执行。在这种并行执行中,每个上下文具有专用的寄存器堆以便实现快速上下文切换。因此,如果分配给硬件上下文的寄存器数量过少,则大量工作负荷将溢出到主存储器,从而导致不期望的性能损失。尽管如此,由于相关联硬件成本和功耗约束,提供过多的芯片上寄存器是不可行的。附图说明在所附附图的各图中,以示例方式而不以限制方式对实施例进行说明,其中相同的附图标记指代类似的要素。图1是根据实施例的处理系统的框图。图2是处理器的实施例的框图,该处理器具有一个或多个处理器核、集成存储器控制器以及集成图形处理器。图3是图形处理器的框图,该图形处理器可以是分立的图形处理单元,或可以是与多个处理核集成的图形处理器。图4是根据一些实施例的图形处理器的图形处理引擎的框图。图5是图形处理器的另一实施例的框图。图6图示出线程执行逻辑,该线程执行逻辑包括在图形处理引擎的一些实施例中采用的处理元件的阵列。图7是图示出根据一些实施例的图形处理器指令格式的框图。图8是图形处理器的另一实施例的框图。图9A是图示出根据实 ...
【技术保护点】
1.一种处理装置,包括:图形处理单元(GPU),所述GPU包括:多个执行单元,用于处理图形上下文数据;以及寄存器堆,具有用于存储所述图形上下文数据的多个寄存器;以及寄存器重命名逻辑,用于通过将所述寄存器堆中的所述多个寄存器逻辑地分区为固定寄存器的集合和共享寄存器的集合来促进对所述多个寄存器的动态重命名。
【技术特征摘要】
【国外来华专利技术】2016.09.30 US 15/281,2761.一种处理装置,包括:图形处理单元(GPU),所述GPU包括:多个执行单元,用于处理图形上下文数据;以及寄存器堆,具有用于存储所述图形上下文数据的多个寄存器;以及寄存器重命名逻辑,用于通过将所述寄存器堆中的所述多个寄存器逻辑地分区为固定寄存器的集合和共享寄存器的集合来促进对所述多个寄存器的动态重命名。2.如权利要求1所述的装置,其中,在执行单元处执行上下文期间,所述共享寄存器的集合被动态地重命名为共享物理寄存器。3.如权利要求2所述的装置,其中,所述GPU进一步包括:重命名表,用于存储所述共享寄存器的集合内的每个寄存器至共享物理寄存器的重命名;以及解码逻辑,用于经由所述重命名表在执行所述上下文期间对来自所述固定寄存器的集合的操作数和来自所述共享寄存器的集合的操作数执行寄存器重命名。4.如权利要求3所述的装置,其中,所述寄存器重命名包括:判定所述上下文的操作数的寄存器ID是否小于所述共享寄存器的集合的起始范围;以及在判定了所述操作数小于所述共享寄存器的集合的所述起始范围之后,访问所述固定寄存器的集合以对所述操作数执行操作。5.如权利要求4所述的装置,其中,所述寄存器重命名进一步包括:在判定了所述操作数大于所述共享寄存器的集合的所述起始范围之后,判定所述操作数是否是源操作数;在判定了所述操作数是源操作数之后,访问所述重命名表以找到与所述寄存器ID相对应的物理寄存器;以及从所述共享寄存器的集合取出所述操作数。6.如权利要求5所述的装置,其中,所述寄存器重命名进一步包括:在判定了所述操作数不是源操作数之后,判定是否能够获取新共享寄存器;以及在判定了能够获取所述新共享寄存器之后,将所述共享寄存器至物理寄存器ID的映射存储在所述重命名表中。7.如权利要求6所述的装置,其中,所述寄存器重命名进一步包括:在判定了不能够获取所述新共享寄存器之后,停止所述上下文。8.如权利要求1所述的装置,其中,在GPU内核的编译期间,所述寄存器重命名逻辑基于所述多个寄存器来指派变量。9.如权利要求8所述的装置,其中,所述寄存器重命名逻辑执行寄存器分配算法,以便向所述固定寄存器的集合指派具有长生命期的变量并且向所述共享寄存器的集合指派具有短生命期的变量。10.如权利要求9所述的装置,其中,在判定了寄存器指派超过所述寄存器堆上的所述多个寄存器之后,所述寄存器重命名逻辑促进溢出代码的生成。11.如权利要求8所述的装置,其中,所述寄存器重命名逻辑提供关于将在何时释放所述共享寄存器的集合中的寄存器的指令。12.如权利要求11所述的装置,其中,基于在所述寄存器分配算法期间所计算的信息来标记变量的释放位置。13.如权利要求12所述的装置,其中,局部变量的位置被标记为在最后一次使用之后在新的完全定义之前被释放。14.如权利要求13所述的装置,其中,全局变量的位置被标记为在控制流图中对于包括对前一定义的最后使用的基本块的最近后支...
【专利技术属性】
技术研发人员:陈凯宇,路奎元,S·马余兰,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。