分布式图形处理器分级中的系统一致性技术方案

技术编号：12137504 阅读：105 留言：0更新日期：2015-10-01 15:37

方法和系统可以规定由计算切片的物理分布的集合执行多个工作项目。此外，可以由高速缓存结构维持与所述多个工作项目相关联的一个或多个存储器行在图形处理器、系统存储器和一个或多个主机处理器上的一致性。在一个示例中，多个交叉节点跟踪所述一个或多个存储器行，其中，在多个第一级(L1)高速缓存和物理分布的高速缓存结构上维持所述一个或多个存储器行的所述一致性。每一个L1高速缓存可以专用于计算切片的执行块，并且每一个交叉节点可以专用于计算切片。

全部详细技术资料下载

【技术实现步骤摘要】
【专利说明】
技术介绍
诸如游戏和媒体播放器的某些应用可以使用嵌入式设计、图形处理单元等等，以便处理计算密集型工作负荷。在这样的情况中，中央处理单元(CPU)可以例如以一个或多个命令的形式将工作负荷派遣到GPU，其中GPU可以对于所述一个或多个命令做出响应而在内部执行包含多个工作项目的工作组。为了维持GPU上的工作项目和工作组之间的序列一致性，可以使用诸如屏障命令(“屏障”)、存储器篱障和未排序原子操作(“原子”)的解决方案。然而，这样的解决方案会是粗粒度的并且不能够控制具体的存储器存取顺序。而且，传统解决方案可能不能够确保在GPU和CPU上的存储器一惯性(例如，一致性)，除非使用硬件刷新和软件栈调用，其中刷新和栈调用会对性能具有负面影响。【附图说明】通过阅读下面的说明书和所附权利要求书，并且通过参照下面的附图，实施例的各种优点对于本领域技术人员将变得显而易见，在附图中:图1A是根据实施例的计算架构的示例的方框图；图1B是根据实施例的计算切片的示例的方框图；图2是根据实施例的操作图形处理器的方法的示例的流程图；图3A到3E是根据实施例的一致性协议表的示例的说明；图4是根据实施例的具有导航控制器的系统的示例的方框图；并且图5是根据实施例的具有小形状因子的系统的示例的方框图。【具体实施方式】图1A和IB示出了可以通常作为计算平台的一部分的计算架构10，该计算平台例如以智能电话、平板电脑、移动互联网设备(MID)、智能电视(TV)、媒体播放器、笔记本电脑、桌面型计算机、服务器、可佩戴设备等等为例。如在图1A中最佳示出的，系统高速缓存12 (例如，静态随机存取存储器...

【技术保护点】
一种用于实现图形高速缓存分级的系统，包括：用于呈现视觉内容的显示器；耦合到一个或多个主机处理器和系统存储器的系统高速缓存；耦合到所述系统高速缓存的图形接口；以及耦合到所述图形接口的图形处理器，所述图形处理器包括：用于执行与所述视觉内容相关联的多个工作项目的计算切片的物理分布的集合，以及用于维持与所述多个工作项目相关联的一个或多个存储器行在所述图形处理器、所述系统存储器和所述一个或多个主机处理器上的一致性的高速缓存结构，其中，所述高速缓存结构包括：多个第一级(L1)高速缓存，每一个L1高速缓存专用于计算切片的执行块，物理分布的共享高速缓存结构，其中，在所述多个L1高速缓存和所述共享高速缓存结构上维持所述一个或多个存储器行的所述一致性，以及用于跟踪所述一个或多个存储器行的多个交叉节点，每一个交叉节点专用于计算切片，所述多个交叉节点进一步用于将源自所述系统高速缓存的一个或多个探听请求经由所述图形接口分布到所述共享高速缓存结构和所述多个L1高速缓存，从所述共享高速缓存结构和所述多个L1高速缓存收集一个或多个探听结果，并且将所述一个或多个探听结果传送到所述系统高速缓存。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：A·科克，A·纳瓦勒，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人