在低功率结构中维护数据的系统和方法技术方案

技术编号:19322204 阅读:23 留言:0更新日期:2018-11-03 11:47
图形处理单元可以包括寄存器文件存储器、处理元件(PE)和加载存储单元(LSU)。寄存器文件存储器包括多个寄存器。PE耦接到寄存器文件存储器并处理图形应用的线程向量的至少一个线程。线程向量中的每个线程是以无拖延方式来处理的。PE在寄存器文件存储器中多个寄存器的第一预定集合中存储通过处理至少一个线程生成的且要向PE外部的第一可拖延逻辑单元路由的数据。LSU耦接到寄存器文件存储器,且LSU访问多个寄存器的第一预定集合中的数据并向第一可拖延逻辑单元路由。

System and method for maintaining data in low power structure

The graphics processing unit may include a register file memory, a processing element (PE) and a loading storage unit (LSU). Register file memory includes multiple registers. PE is coupled to register file memory and processing at least one thread of the thread vector of graphics application. Each thread in the thread vector is processed without delay. PE stores data generated by processing at least one thread and routed to the first delayed logical unit outside PE in the first predetermined set of multiple registers in register file memory. LSU is coupled to register file memory, and LSU accesses data in the first predetermined set of multiple registers and routes to the first delayed logic unit.

【技术实现步骤摘要】
在低功率结构中维护数据的系统和方法相关申请的交叉引用本专利申请要求于2017年4月18日提交的美国临时专利申请No.62/486,957以及2017年6月26日提交的美国非临时专利申请No.15/633,746在35U.S.C.§119(e)下的优先权,其公开内容以全文引用的方式并入本文中。
本文公开的主题涉及图形处理单元(GPU)。更具体地,本文公开的主题涉及在低功率结构中维护数据的系统和方法。
技术介绍
GPU执行可以与应用相关联的图形程序。GPU可以包括通用可编程引擎,该通用可编程引擎可以用于执行例如着色器程序(着色器)。在统一GPU架构中,可被称为着色器内核的相同可编程引擎针对特定图形配置来运行多个程序中的每个程序。考虑到图形程序的本质,GPU是具有并行运行的大线程集的高度并行的机器。高度并行的系统经常在系统的不同部分之间移动大量的数据-一种倾向于消耗相对大量功率的操作。因此,如果GPU被设计为手持设备的一部分,则低功率设计就变得极其重要。
技术实现思路
示例实施例提供了GPU,其可以包括寄存器文件存储器、处理元件(PE)和加载存储单元(LSU)。寄存器文件存储器可以包括多个寄存器。PE可以耦接到寄存器文件存储器,以及PE可以处理图形应用的线程向量的至少一个线程,其中,线程向量中的每个线程要以无拖延方式来处理,以及PE可以在寄存器文件存储器中的多个寄存器的第一预定集合中存储通过处理所述至少一个线程来生成的且要向PE外部的第一可拖延逻辑单元路由的数据。LSU可以耦接到寄存器文件存储器,且LSU可以访问多个寄存器的第一预定集合中的数据并可以向第一可拖延逻辑单元路由该数据。GPU还可以包括耦接到LSU的工作订单送料存储器,其中,工作订单送料存储器能够存储与PE对图形应用的线程向量的至少一个线程的处理相关联的至少一个工作订单消息,以及其中,至少一个工作订单消息可以包括多个寄存器的第一预定集合的存储要向第一可拖延逻辑单元路由的数据的第一位置。至少一个工作订单消息还可以包括寄存器文件存储器中的多个寄存器的第二预定集合的指示在哪里存储第一可拖延逻辑单元的结果的第二位置。示例实施例提供了GPU,其可以包括PE、指令流水线解析器和LSU。该PE可以处理图形应用的线程向量的至少一个线程,其中,线程向量中的每个线程要以无拖延方式来处理。如果图形应用的线程向量的至少一个线程的指令包括向PE外部的第一可拖延逻辑单元路由数据的操作,则指令流水线解析器可以生成工作订单消息。工作订单消息可以包括存储由PE处理的且要向第一可拖延逻辑单元路由的数据的第一位置。LSU可以包括能够存储工作订单消息的工作订单送料存储器。LSU可以接收工作订单送料存储器中的工作订单消息并可以向第一可拖延逻辑单元路由第一位置处的数据。PE可以包括寄存器文件存储器,该寄存器文件存储器包括多个寄存器,其中,存储数据的第一位置包括寄存器文件存储器中的多个寄存器的第一集合。工作订单消息还可以包括寄存器文件存储器中的多个寄存器的第二预定集合的指示在哪里存储第一可拖延逻辑单元的结果的第二位置。一个示例实施例提供了处理图形应用的方法,该方法可以包括:通过处理图形应用的线程向量的至少一个线程在PE中生成数据,其中,线程向量的每个线程要在无拖延进程中处理,以及该数据可以向无拖延进程外部的可拖延进程路由;在寄存器文件存储器中多个寄存器的第一预定集合中存储数据,其中,寄存器文件存储器可以耦接到PE;由耦接到寄存器文件存储器的LSU访问在多个寄存器的第一预定集合中存储的数据;以及由所述LSU向可拖延进程路由所访问的数据。该方法还可以包括:如果图形应用的线程向量的至少一个线程的指令包括向可拖延进程路由数据的操作,则由指令流水线解析器生成工作订单消息,其中,工作订单消息可以包括多个寄存器的第一预定集合的存储要向可拖延进程路由的数据的第一位置。工作订单消息还可以包括寄存器文件存储器中的具有多个寄存器的第二预定集合的指示存储可拖延进程的结果的第二位置。一个示例实施例提供了处理图形应用的方法,该方法可以包括:如果图形应用的指令包括向可拖延进程路由数据的操作,则在指令流水线解析器处生成工作订单消息,其中,图形应用可以包括至少一个线程向量,其中,每个线程要在无拖延进程中处理,以及工作订单消息可以包括存储通过执行指令所生成的数据的第一位置;在LSU的工作订单送料存储器中存储工作订单消息;通过在图形应用的线程向量的至少一个线程上的无拖延进程中执行指令在PE中生成数据,其中,所生成的数据可以向可拖延进程路由;在寄存器文件存储器的多个寄存器的第一预定集合中存储数据,其中,多个寄存器的第一预定集合对应于第一位置,以及寄存器文件存储器耦接到PE;由LSU访问在多个寄存器的第一预定集合中存储的数据;以及由所述LSU向所述可拖延进程路由所访问的数据。附图说明在下节中,将参考附图中示出的示例实施例来描述本文公开的主题的各方面,在附图中:图1示出了根据本文公开主题的GPU系统的示例实施例;图2示出了线程束(warp)的示例实施例,该线程束包括被组织为空间维度上的八个线程和时间维度上的四个线程的对线程的单指令多线程分组;图3示出了根据本文公开主题的发射缓冲器的示例实施例;图4示出了示例字段,当确定示例发射缓冲器400要被用作TCBUF相关指令处理的一部分时指令流水线顶部解析器可以探查示例TCBUF指令;以及图5示出了根据本文公开主题在PE和LSU之间的示例存储器交互的序列图。具体实施方式在以下详细描述中,阐述了许多具体细节以便提供对本公开的透彻理解。然而,本领域技术人员将理解的是:所公开的方面可以在没有这些具体细节的情况下实施。在其他情况下,未详细描述公知的方法、流程、组件和电路,以免不必要地模糊本文公开的主题。贯穿本说明书对“一个实施例”或“实施例”的提及意味着结合实施例描述的特定特征、结构或特性可被包括在本文公开的至少一个实施例中。因此,在说明书的各个位置中出现短语“在一个实施例中”或“在实施例中”或“根据一个实施例”(或具有类似含义的其他短语)不一定均是指相同的实施例。此外,可以在一个或多个实施例中通过任何合适的方式来组合特定特征、结构或特性。就此而言,如本文所使用的,词语“示例性的”意指“用作示例、实例或说明”。本文中描述为“示例性的”任何实施例不必解释为相比其他实施例优选或者有利。此外,取决于本文讨论的上下文,单数术语可以包括相应的复数形式且复数术语可以包括相应的单数形式。还注意到:本文所示和所讨论的各个附图(包括组件图)仅用于说明目的,且未按比例绘制。类似地,仅为了说明目的来示出各种波形和时序图。例如,为了清楚,一些元素的尺寸可以相对于其他元素被夸张。此外,如果认为恰当,则可以在附图之间重复附图标记,以指示对应或相似的元素。本文中所使用的术语仅仅是为了描述具体示例实施例的目的,而不是意在限制所要求保护的主题。如本文中使用的,单数形式“一”,“一个”和“所述”意在还包括复数形式,除非上下文明确地给出相反的指示。还应该理解,术语“包括”和/或“包含”在本说明书中使用时,表明存在所述的特征、整体、步骤、操作、元素和/或组件,但是并没有排除存在或另外添加一个或多个其它特征、整体、步骤、操作、元素、组本文档来自技高网...

【技术保护点】
1.一种图形处理单元“GPU”,包括:包括多个寄存器的寄存器文件存储器;耦接到所述寄存器文件存储器的处理元件“PE”,所述PE用于处理图形应用的线程向量的至少一个线程,所述线程向量中的每个线程要以无拖延方式来处理,以及所述PE用于在所述寄存器文件存储器中的所述多个寄存器的第一预定集合中存储已通过处理所述至少一个线程而生成的且要向所述PE外部的第一可拖延逻辑单元路由的数据;以及耦接到所述寄存器文件存储器的加载存储单元“LSU”,所述LSU用于访问所述多个寄存器的所述第一预定集合中的数据并向所述第一可拖延逻辑单元路由所述数据。

【技术特征摘要】
2017.04.18 US 62/486,957;2017.06.26 US 15/633,7461.一种图形处理单元“GPU”,包括:包括多个寄存器的寄存器文件存储器;耦接到所述寄存器文件存储器的处理元件“PE”,所述PE用于处理图形应用的线程向量的至少一个线程,所述线程向量中的每个线程要以无拖延方式来处理,以及所述PE用于在所述寄存器文件存储器中的所述多个寄存器的第一预定集合中存储已通过处理所述至少一个线程而生成的且要向所述PE外部的第一可拖延逻辑单元路由的数据;以及耦接到所述寄存器文件存储器的加载存储单元“LSU”,所述LSU用于访问所述多个寄存器的所述第一预定集合中的数据并向所述第一可拖延逻辑单元路由所述数据。2.根据权利要求1所述的GPU,还包括:耦接到所述LSU的工作订单送料存储器,所述工作订单送料存储器能够存储与所述PE对所述图形应用的线程向量的所述至少一个线程的处理相关联的至少一个工作订单消息,所述至少一个工作订单消息包括所述多个寄存器的所述第一预定集合的存储要向所述第一可拖延逻辑单元路由的数据的第一位置。3.根据权利要求2所述的GPU,其中,所述至少一个工作订单消息还包括:所述寄存器文件存储器中所述多个寄存器的第二预定集合的第二位置,所述第二位置指示在哪里存储所述第一可拖延逻辑单元的结果。4.根据权利要求2所述的GPU,还包括:指令流水线解析器,用于在所述图形应用的所述线程向量的所述至少一个线程的指令包括向所述第一可拖延逻辑单元路由数据的操作的情况下生成所述至少一个工作订单消息。5.根据权利要求1所述的GPU,其中,所述寄存器文件存储器包括向量寄存器文件存储器和标量寄存器文件存储器。6.根据权利要求1所述的GPU,其中,所述PE还用于处理所述图形应用的多个线程向量中每个线程向量的至少一个线程,每个线程向量中的每个线程要以无拖延方式来处理。7.根据权利要求1所述的GPU,还包括:多个寄存器文件存储器、多个PE以及多个LSU,其中,每个PE耦接到相应的寄存器文件存储器,所述多个PE中的每个PE用于处理所述图形应用的线程向量的至少一个线程,所述线程向量中的每个线程要以无拖延方式来处理,以及每个PE用于在与所述PE相对应的寄存器文件存储器中的多个寄存器的第二预定集合中存储数据,要存储的数据是通过所述PE处理所述线程向量的至少一个线程来生成的并且要向所述PE外部的第二可拖延逻辑单元路由;以及其中,每个LSU耦接到至少一个寄存器文件存储器,每个LSU用于访问与所述LSU耦接的每个寄存器文件存储器的多个寄存器的第二预定集合中的数据,以及向所述第二可拖延逻辑单元路由所述数据。8.根据权利要求7所述的GPU,其中,所述第一可拖延逻辑单元或所述第二可拖延逻辑单元包括:纹理单元、光栅化单元、图像缓冲单元、超越运算单元或数学协处理器。9.一种图形处理单元“GPU”,包括:处理元件“PE”,用于处理图形应用的线程向量的至少一个线程,所述线程向量中的每个线程要以无拖延方式来处理;指令流水线解析器,用于在所述图形应用的线程向量的所述至少一个线程的指令包括向所述PE外部的第一可拖延逻辑单元路由数据的操作的情况下生成工作订单消息,所述工作订单消息包括存储由所述PE处理的要向所述第一可拖延逻辑单元路由的数据的第一位置;以及加载存储单元“LSU”,包括能够存储工作订单消息的工作订单送料存储器,所述LSU用于接收所述工作订单送料存储器中的工作订单消息并向所述第一可拖延逻辑单元路由所述第一位置处的所述数据。10.根据权利要求9所述的GPU,其中,所述PE还用于处理所述图形应用的多个线程向量中的每个线程向量的至少一个线程,每个线程向量中的每个线程要以无拖延方式来处理。11.根据权利要求9所述的GPU,其中,所述PE包括寄存器文件存储器,所述寄存器文件存储器包括多个寄存器,其中,存储所述数据的所述第一位置包括所述寄存器文件存储器中的所述多个寄存器的第一预定集合。12.根据权利要求11所述的GPU,其中,所述工作订单消息还包括所述寄存器文件存储器中的所述多个寄存器的第二预定集合的第二位置,所述...

【专利技术属性】
技术研发人员:大卫·C·坦南鲍姆斯里尼瓦桑·S·艾耶米切尔·K·阿尔苏普
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国,KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1