用于使用GPU控制器来预加载缓存的机制制造技术

技术编号:10393362 阅读:238 留言:0更新日期:2014-09-05 19:20
本发明专利技术提供了一种方法和系统,其中图形处理单元具有用于在所述图形处理单元上预加载缓存的专用控制器。所述方法包括接收命令消息,所述命令消息包括与存储器的部分相关的数据。所述方法也包括:解释所述命令消息,识别所述缓存的策略信息,识别存储器的所述部分的位置和大小,并且创建包括与所述部分的内容相关的数据的提取消息,其中所述提取消息使所述缓存预加载存储器的所述部分中的数据。

【技术实现步骤摘要】
【国外来华专利技术】用于使用GPU控制器来预加载缓存的机制专利技术背景专利
本专利技术总体涉及计算系统中执行的计算操作。更具体来说,本专利技术涉及计算系统中执行的图形处理任务。
技术介绍
图形处理单元(GPU)是专门设计用于执行图形处理任务的复杂集成电路。例如,GTO可以执行终端用户应用(诸如视频游戏应用)所要求的图形处理任务。GPU的计算能力已以超过对应中央处理单元(CPU)平台的计算能力的速度增长。结合移动计算市场(例如,笔记本电脑、移动智能手机、平板电脑等等)和其必需支持服务器/企业系统的开发,已经利用这种增长来提供指定的期望用户体验质量。然而,GPU传统上在受约束的编程环境中操作,主要可供用于图形加速。这些约束起因于GPU不具有与CPU —样丰富的编程生态系统这一事实。因此,它们的用途一直大多局限于二维(2D)和三维(3D)图形以及已习惯于处理图形和视频应用编程接口(API)的少量前沿多媒体应用。随着多供应商支持的OpenCL?和DirectCompute?、标准API和支持工具出现,GPU的应用已经不再局限于诸如传统图形等传统应用。虽然OpenCL和DirectCompute是有前景的起点,但创造一种允许对于大多数编程任务CPU和GPU的组合使用起来与CPU一样流畅的环境和生态系统仍存在许多障碍。一般来说,终端用户应用与GPU之间存在若干层的软件。终端用户应用与应用编程接口(API)通信。API允许终端用户应用以标准格式而非依赖于GPU的格式输出图形数据和命令。API与驱动器通信。驱动器将从API接收到的标准代码翻译成GPU理解的本机格式指令。通常,驱动器由GPU的制造商编写。GPU随后执行来自驱动器的指令。标准GPU在被称为渲染的过程中从其部件的更高级描述创建构成图像的像素。GPU通常利用连续渲染的概念通过使用管线来处理像素、纹理以及几何形状数据。这些管线通常称为固定功能专用管线(如光栅器、设置引擎、色彩混合器、纹理映射以及可在着色器管或着色器管线中完成的编程阶段)集合。“着色器”是计算机图形中的术语,是指图形资源主要用来执行渲染效果的软件指令集合。另外,GPU还可采用并行处理设计中的多个可编程管线以便获得更高的吞吐量。多个着色器管线还可以称作着色器管阵列。另外,GPU还支持称为纹理映射的概念。纹理映射是用于通过使用纹理附近像素或纹素的色彩来确定纹理映射像素的纹理色彩的过程。所述过程还被称为纹理平滑或者纹理插值(texture interpolation)。然而,高图像质量纹理映射要求高度的计算复杂性。此夕卜,配备单个(统一)着色器的GPU还同时支持许多类型的着色器处理。因此提高了对更高性能的广义存储器存取能力的需求。着色器引擎依赖于针对纹理、着色器代码以及其它类型数据对本地缓存存储器的高速访问。用数据预加载缓存减少了 GPU操作的执行时间,因为不再需要访问视频或主系统存储器来获得数据(这可能是费时的)。这使得在GPU每次开始执行、访问存储器的相同或类似部分时GPU性能提高。目前,GPU不具有提供用数据预加载缓存的功能性的专用可编程控制器。考虑到新软件应用的复杂性持续增加,对GPU提供高效且高质量的渲染、纹理过滤以及误差校正的需求也正在提高。实施方案概述因此,需要减轻前述缺陷的系统和/或方法。具体地说,需要一种用于管理用要执行的存储器的相关部分对选定APD缓存的显式和隐式预加载的专用控制器。虽然GPU、加速处理单元(APU)以及通用图形处理单元(GPGPU)是本领域中的常用术语,但是术语“加速处理设备(APD) ”被认为是一种更广泛的表述。例如,Aro是指以加速的方式执行与加速图形处理任务、数据并行任务或嵌套数据并行任务相关联的那些功能和计算的任何协同操作的硬件和/或软件集合。在某些环境中,本专利技术的实施方案包括一种用于预加载缓存的方法和系统。所述系统包括电耦接至缓存的APD,所述系统包括:主机处理器,所述主机处理器被配置成输出包括与存储器的部分相关的数据的命令消息;以及控制器,所述控制器被配置成解释所述命令消息,以便⑴识别与所述缓存相关的策略信息,(?)识别所述部分的位置和大小,并且(iii)创建包括与所述部分的内容相关的数据的提取消息,其中所述控制器被配置成将所述提取消息输出到所述缓存。本专利技术的另外实施方案包括一种包括电耦接至缓存的APD的系统,所述系统包括:控制器,所述控制器被配置成:(i)接收命令消息,所述命令消息包括显式请求缓存预加载存储器的部分的数据;(ii)识别与所述缓存相关的策略信息;(iii)识别所述部分的位置和大小;以及(iv)创建包括与所述部分的内容相关的数据的提取消息,其中所述控制器被配置成将所述提取消息输出到所述缓存。本专利技术的另外特征和优点以及本专利技术的各种实施方案的结构和操作在下文中参照附图详细描述。应当注意,本专利技术不限于本文所描述的这些特定实施方案。本文呈现此类实施方案仅用于说明目的。基于本文所包含的教导内容,另外的实施方案对于相关领域的技术人员而言将是显而易见的。附图简述附图并入本文并且构成本说明书的一部分,图解了本专利技术并且与说明书一起进一步用来解释本专利技术的原理并使相关领域的技术人员能够实践和使用本专利技术。本专利技术的各实施方案参照附图在下文中进行描述,其中在全文中,类似参考标号用于指代类似元素。图1A是根据本专利技术的实施方案的一种处理系统的说明性框图。图1B是图1A所示APD的说明性框图图示。图2是根据一个实施方案的用存储器的一部分预加载缓存的APD的说明性流程图。图3是根据一个实施方案的用存储器的一部分预加载缓存的APD的另一说明性流程图。 本专利技术将参照附图进行描述。一般来说,元件首次出现在其中的附图通常是由对应参考编号中的最左侧的数字指示。详述在以下详细描述中,提及一个“实施方案”、“实施方案”、“示例实施方案”等等表明所描述的实施方案可包括某一特定特征、结构或特性,但是每个实施方案可能不一定包括该特定特征、结构或特性。此外,此类措词不一定是指同一实施方案。此外,当结合一个实施方案来描述某一特定特征、结构或特性时,应当认为,无论是否明确描述,使得此类特征、结构或者特性结合其它实施方案起作用是在本领域的技术人员知识范围内的。术语“本专利技术的实施方案”并不要求本专利技术的所有实施方案都包括所论述的特征、优点或操作模式。在不背离本专利技术的范围的情况下可设想出替代实施方案,并且本专利技术的众所周知的元素可能并未详细描述或者可能被省略,以免混淆本专利技术的相关细节。另外,本文所使用的术语仅用于描述特定实施方案的目的,而并不意在限制本专利技术。例如,如在本文所使用的,单数形式“一个”和“所述”意在还包括复数形式,除非上下文另外清楚表明。还应当理解,当在本文中使用时,术语“包括(comprises) ”、“包括(comprising) ”、“包括(includes) ”和/或“包括(including) ”指明存在所述特征、整数、步骤、操作、元件和/或部件,但并不排除存在或者增添一个或多个其它特征、整数、步骤、操作、元件、部件和/或它们的组合。图1A是包括两 个处理器、即CPU102和APD104的统一计算系统100的示例性图示。CPU102可以包括一个或多个单核或多核CPU。在本专利技术的一个实施方案中,系统10本文档来自技高网...
用于使用GPU控制器来预加载缓存的机制

【技术保护点】
一种包括电耦接至缓存的加速处理设备的系统,所述系统包括:控制器,所述控制器被配置成解释命令消息,以便(i)识别与所述缓存相关的策略信息,(ii)确定部分的位置和大小,并且(iii)创建包括与所述部分的内容相关的数据的提取消息,其中所述控制器被配置成将所述提取消息输出到所述缓存。

【技术特征摘要】
【国外来华专利技术】2011.12.13 US 13/324,4321.一种包括电耦接至缓存的加速处理设备的系统,所述系统包括: 控制器,所述控制器被配置成解释命令消息,以便α)识别与所述缓存相关的策略信息,(ii)确定部分的位置和大小,并且(iii)创建包括与所述部分的内容相关的数据的提取消息, 其中所述控制器被配置成将所述提取消息输出到所述缓存。2.如权利要求1所述的系统,其还包括: 主机处理器,所述主机处理器被配置成输出包括与存储器的部分相关的数据的所述命令消息。3.如权利要求1所述的系统,其中所述提取消息使所述缓存基于所述策略信息从存储器的所述部分加载数据。4.如权利要求1所述的系统,其中所述控制器还被配置成识别用于存储器的所述部分的引用局部性信息,其中所述引用局部性信息确定存储器的所述部分将何时被加载到所述缓存中。5.如权利要求4所述的系统,其中所述命令消息包括所述引用局部性信息。6.如权利要求4所述的系统,其中所述引用局部性信息是基于存储器的所述部分的时间局部性。7.如权利要求4所述的系统,其中所述引用局部性信息是基于存储器的所述部分的空间局部性。8.一种用于预加载缓存的计算机实现方法,所述方法包括: 接收命令消息,所述命令消息包括与存储器的部分相关的数据; 解释所述命令消息; 识别所述缓存的策略信息; 识别存储器的所述部分的位置和大小;以及 创建包括与所述部分的内容相关的数据的提取消息。9.如权利要求8所述的方法,其还包括将所述提取消息发送到缓存,其中所述提取消息使所述缓存从存储器的所述部分加载数据。10.如权利要求8所述的方法,其还包括: 识别用于存储器的所述部分的引用局部性信息,其中所述引用局部性信息确定存储器的所述部分将何时被加载。11.如权利要求10所述的方法,其中所述命令消息包括所述引用局部性信息。12.如权利要求9所述的方法,其中所述引用局部性信息是基于存储器的所述部分的时间局部性。13.如权利要求10所述的方法,其中所述引用局部性信息是基于存储器的所述部分的空间局部性。14.一种包括电耦接至缓存的加速处理设备的系统,所述系统包括: 控制器,所述控制器被配置成:(i)接收命令消息,所述命令消息包括显式请求将存储器的部分预加载到所述缓存...

【专利技术属性】
技术研发人员:盖纳迪·里盖于里·利希马诺
申请(专利权)人:ATI科技无限责任公司
类型:发明
国别省市:加拿大;CA

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1