The graphics processing unit may include a register file memory, a processing element (PE) and a loading storage unit (LSU). Register file memory includes multiple registers. PE is coupled to register file memory and processing at least one thread of the thread vector of graphics application. Each thread in the thread vector is processed without delay. PE stores data generated by processing at least one thread and routed to the first delayed logical unit outside PE in the first predetermined set of multiple registers in register file memory. LSU is coupled to register file memory, and LSU accesses data in the first predetermined set of multiple registers and routes to the first delayed logic unit.
【技术实现步骤摘要】
在低功率结构中维护数据的系统和方法相关申请的交叉引用本专利申请要求于2017年4月18日提交的美国临时专利申请No.62/486,957以及2017年6月26日提交的美国非临时专利申请No.15/633,746在35U.S.C.§119(e)下的优先权,其公开内容以全文引用的方式并入本文中。
本文公开的主题涉及图形处理单元(GPU)。更具体地,本文公开的主题涉及在低功率结构中维护数据的系统和方法。
技术介绍
GPU执行可以与应用相关联的图形程序。GPU可以包括通用可编程引擎,该通用可编程引擎可以用于执行例如着色器程序(着色器)。在统一GPU架构中,可被称为着色器内核的相同可编程引擎针对特定图形配置来运行多个程序中的每个程序。考虑到图形程序的本质,GPU是具有并行运行的大线程集的高度并行的机器。高度并行的系统经常在系统的不同部分之间移动大量的数据-一种倾向于消耗相对大量功率的操作。因此,如果GPU被设计为手持设备的一部分,则低功率设计就变得极其重要。
技术实现思路
示例实施例提供了GPU,其可以包括寄存器文件存储器、处理元件(PE)和加载存储单元(LSU)。寄存器文件存储器可以包括多个寄存器。PE可以耦接到寄存器文件存储器,以及PE可以处理图形应用的线程向量的至少一个线程,其中,线程向量中的每个线程要以无拖延方式来处理,以及PE可以在寄存器文件存储器中的多个寄存器的第一预定集合中存储通过处理所述至少一个线程来生成的且要向PE外部的第一可拖延逻辑单元路由的数据。LSU可以耦接到寄存器文件存储器,且LSU可以访问多个寄存器的第一预定集合中的数据并可以向第一可拖延逻辑 ...
【技术保护点】
1.一种图形处理单元“GPU”,包括:包括多个寄存器的寄存器文件存储器;耦接到所述寄存器文件存储器的处理元件“PE”,所述PE用于处理图形应用的线程向量的至少一个线程,所述线程向量中的每个线程要以无拖延方式来处理,以及所述PE用于在所述寄存器文件存储器中的所述多个寄存器的第一预定集合中存储已通过处理所述至少一个线程而生成的且要向所述PE外部的第一可拖延逻辑单元路由的数据;以及耦接到所述寄存器文件存储器的加载存储单元“LSU”,所述LSU用于访问所述多个寄存器的所述第一预定集合中的数据并向所述第一可拖延逻辑单元路由所述数据。
【技术特征摘要】
2017.04.18 US 62/486,957;2017.06.26 US 15/633,7461.一种图形处理单元“GPU”,包括:包括多个寄存器的寄存器文件存储器;耦接到所述寄存器文件存储器的处理元件“PE”,所述PE用于处理图形应用的线程向量的至少一个线程,所述线程向量中的每个线程要以无拖延方式来处理,以及所述PE用于在所述寄存器文件存储器中的所述多个寄存器的第一预定集合中存储已通过处理所述至少一个线程而生成的且要向所述PE外部的第一可拖延逻辑单元路由的数据;以及耦接到所述寄存器文件存储器的加载存储单元“LSU”,所述LSU用于访问所述多个寄存器的所述第一预定集合中的数据并向所述第一可拖延逻辑单元路由所述数据。2.根据权利要求1所述的GPU,还包括:耦接到所述LSU的工作订单送料存储器,所述工作订单送料存储器能够存储与所述PE对所述图形应用的线程向量的所述至少一个线程的处理相关联的至少一个工作订单消息,所述至少一个工作订单消息包括所述多个寄存器的所述第一预定集合的存储要向所述第一可拖延逻辑单元路由的数据的第一位置。3.根据权利要求2所述的GPU,其中,所述至少一个工作订单消息还包括:所述寄存器文件存储器中所述多个寄存器的第二预定集合的第二位置,所述第二位置指示在哪里存储所述第一可拖延逻辑单元的结果。4.根据权利要求2所述的GPU,还包括:指令流水线解析器,用于在所述图形应用的所述线程向量的所述至少一个线程的指令包括向所述第一可拖延逻辑单元路由数据的操作的情况下生成所述至少一个工作订单消息。5.根据权利要求1所述的GPU,其中,所述寄存器文件存储器包括向量寄存器文件存储器和标量寄存器文件存储器。6.根据权利要求1所述的GPU,其中,所述PE还用于处理所述图形应用的多个线程向量中每个线程向量的至少一个线程,每个线程向量中的每个线程要以无拖延方式来处理。7.根据权利要求1所述的GPU,还包括:多个寄存器文件存储器、多个PE以及多个LSU,其中,每个PE耦接到相应的寄存器文件存储器,所述多个PE中的每个PE用于处理所述图形应用的线程向量的至少一个线程,所述线程向量中的每个线程要以无拖延方式来处理,以及每个PE用于在与所述PE相对应的寄存器文件存储器中的多个寄存器的第二预定集合中存储数据,要存储的数据是通过所述PE处理所述线程向量的至少一个线程来生成的并且要向所述PE外部的第二可拖延逻辑单元路由;以及其中,每个LSU耦接到至少一个寄存器文件存储器,每个LSU用于访问与所述LSU耦接的每个寄存器文件存储器的多个寄存器的第二预定集合中的数据,以及向所述第二可拖延逻辑单元路由所述数据。8.根据权利要求7所述的GPU,其中,所述第一可拖延逻辑单元或所述第二可拖延逻辑单元包括:纹理单元、光栅化单元、图像缓冲单元、超越运算单元或数学协处理器。9.一种图形处理单元“GPU”,包括:处理元件“PE”,用于处理图形应用的线程向量的至少一个线程,所述线程向量中的每个线程要以无拖延方式来处理;指令流水线解析器,用于在所述图形应用的线程向量的所述至少一个线程的指令包括向所述PE外部的第一可拖延逻辑单元路由数据的操作的情况下生成工作订单消息,所述工作订单消息包括存储由所述PE处理的要向所述第一可拖延逻辑单元路由的数据的第一位置;以及加载存储单元“LSU”,包括能够存储工作订单消息的工作订单送料存储器,所述LSU用于接收所述工作订单送料存储器中的工作订单消息并向所述第一可拖延逻辑单元路由所述第一位置处的所述数据。10.根据权利要求9所述的GPU,其中,所述PE还用于处理所述图形应用的多个线程向量中的每个线程向量的至少一个线程,每个线程向量中的每个线程要以无拖延方式来处理。11.根据权利要求9所述的GPU,其中,所述PE包括寄存器文件存储器,所述寄存器文件存储器包括多个寄存器,其中,存储所述数据的所述第一位置包括所述寄存器文件存储器中的所述多个寄存器的第一预定集合。12.根据权利要求11所述的GPU,其中,所述工作订单消息还包括所述寄存器文件存储器中的所述多个寄存器的第二预定集合的第二位置,所述...
【专利技术属性】
技术研发人员:大卫·C·坦南鲍姆,斯里尼瓦桑·S·艾耶,米切尔·K·阿尔苏普,
申请(专利权)人:三星电子株式会社,
类型:发明
国别省市:韩国,KR
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。