当前位置: 首页 > 专利查询>英特尔公司专利>正文

标识GPU阶段以便在运行时期间确定GPU扩展性制造技术

技术编号:12162847 阅读:83 留言:0更新日期:2015-10-06 12:11
描述了一种由处理器执行的方法。该方法包括通过执行以下内容绘制帧:a)标识GPU阶段;b)使用所标识的GPU阶段获得所标识的GPU阶段的频率扩展性信息;c)基于所述频率扩展性信息确定改变所述GPU在所述阶段内绘制所述帧的频率是否合适。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】标识GPU阶段以便在运行时期间确定GPU扩展性专利
本专利技术的领域总体上涉及计算科学,并且更确切地涉及标识GPU阶段以便在运行时期间确定GPU扩展性。背景图1示出计算系统内的多核处理器100的架构。如图1所示,该处理器包括:1)多个处理核101_1至101_N ;2)互连网络102 ;3)末级高速缓存系统103 ;4)存储器控制器104和I/O中枢105。这些处理核各自包含用于执行程序代码指令(诸如向量指令,诸如上述指令中的任何指令)的一个或多个指令执行流水线。互连网络102用于将这些核101_1至101_N#自互连到彼此以及其他组件103、104、105。在将指令和/或数据逐出到系统存储器108之前,末级高速缓存系统103用作处理器100内的末层高速缓存。存储器控制器104从/向系统存储器108读/写数据和指令。I/O中枢105管理处理器和“I/o”设备(例如,非易失性存储设备(诸如硬盘驱动器设备和/或非易失性存储器设备)和/或网络接口)之间的通信。端口 106源自互连网络102以便链接多个处理器,从而使得可实现具有多于N个核的系统。图形处理单元(GPU) 107执行图形计算。功率管理单元109经常与功率管理软件合作管理处理器的功率耗散。为了方便,未在图1中描述有意义的其他功能块(锁相环(PLL)电路等等)。附图通过举例而非通过限制在附图的图示中展示本专利技术,在附图中,相同的参考表示类似的元素,并且在附图中:图1示出示例性处理器;图2示出示例性GPU架构;图3示出GPU在显示器上渲染图像的方式;图4示出用于控制GPU的功耗的过程;图5示出用于确定GPU的当前阶段的过程;图6示出用于为特定阶段内的GPU确定频率扩展性的过程;图7示出用于确定是否应该改变特定阶段内的GPU的频率的过程;图8示出决策树的实施例;图9示出示例性频率扩展性曲线;图10示出具有改进的处理器。详细描述图2示出GPU 207的实施例。图2示出的特定GPU仅仅是示例性的,因为存在其他GPU架构。如图2所示,图形处理器包括从图形处理软件接收命令并且当合适时将这些命令发布给3D流水线202和媒体流水线203的命令流化器201。3D流水线202是处理旨在渲染三维特征的命令的多级流水线。这样,3D流水线202通常在顶点缓冲器206上操作。媒体流水线203是处理旨在渲染媒体(例如,运动图片序列)的命令的多级流水线。这样,媒体流水线通常在存储器对象207上操作。流水线202、203例如针对着色(shading)功能都依赖于核阵列204。核阵列204基本上对应于作为用于这些流水线之一的服务执行程序代码片段的多个处理核。这些核各自可依赖于正在执行其代码片段的加速器205中的任一个。核阵列通常接受“源”表面作为输入数据并且写回“目的”表面作为结果。增加的问题的尝试智能地管理具有复合逻辑块的处理器(诸如图2的GPU)的功耗的复杂性。图3示出GPU为计算系统渲染视觉显示信息的方式的描绘。如图3所示,典型的GI3U被设计成用于“绘制”一系列帧301并且在特定的帧率将这些帧呈现给显示器。每个单独的帧301_1、301_2、...301_X与在显示器上呈现的不同“图片”相对应。单独的帧301_1、301_2、...301_X的以帧率的呈现连续为显示器的观看者呈现运动图像(当期望运动时)和稳定性/静止(当需要稳定性/静止时)。例如,如果所期望的描绘是在蓝色背景下从左向右移动的汽车的动画片,与其在未改变的蓝色背景下的前一帧相比,每个下一帧将描绘移动到右侧的汽车。用于绘制任何单个帧的技术和机制可从GPU架构到GPU架构不同。然而,不管任何特定的技术或机制,每一帧的绘制可被视为被分解为“阶段”。图3页描绘了这种总体概念。在此,时间T与GPU绘制单个帧所花费的时间量相对应。如图3所示,单个帧的绘制可被视为由GPU和周围的计算机系统执行通过一系列可辨别的机器阶段303_1、303_2、...303_Y完成。一般情况下,GPU和计算系统的不同部分将在帧的总体处理的不同时间段用于生成单个帧。特定部分的集合用于小于绘制帧所需的总时间段的某个扩展时间段与阶段相对应。需注意,特定阶段可能再次出现或者将其自身表示为不仅跨同一帧而且还跨同一显示序列的不同帧并且跨完全不同的帧序列。例如,“阶段”A可以在两个完全不同的图形处理应用(例如,两个完全不同的视频游戏)的帧内是可识别的。在此意义上,阶段表示GPU的类属、粒度状态。作为示例,参照图2的GPU架构,在绘制单个帧时,在第一阶段303_1期间,GPU可能花费扩展时间段来强调GPU流水线202、203中的第一个流水线内的特定功能单元,而在另一个阶段303_2中,GPU可能强调使用流水线202、203中的另一个流水线内的不同功能单元。此外,在又一个阶段中,当其等待从存储器子系统取出更多数据和/或命令时,GPU作为整体可能是静默的。构成特定阶段的特定GPU/系统行为倾向于跨GPU/系统架构不同并且本领域技术人员将能够为其特定GPU/系统架构标识合适的帧绘制阶段。图4示出用于在绘制帧的过程中控制GPU的功耗的过程。如图4所示,标识401GPU和/或周围计算机系统所处的阶段。当标识当前阶段时,定义402该阶段的扩展性函数。扩展性函数本质上是该阶段的特性特征,该特性特征描述如果GPU的特定状态变量(例如,时钟速度)改变则GPU的性能将改变什么程度。为了简单,本文档的剩余部分引用频率扩展性。然而,本领域技术人员将认识到还可根据在此讨论的原理调制其他性能单位(诸如所使能的逻辑/执行/功能单元的数量和/或特定类型)以便更好地控制性能和功耗。如以下更详细描述的,GPU对GPU时钟速度的改变的特定性能响应可依据GPU在哪个阶段(并且可能依据GPU在该阶段中时的操作频率)而显著地不同。这样,过程402为功率管理功能提供用于确定如果GPU的当前时钟频率改变则GPU将具有什么性能响应的信息。在获得当前阶段的频率扩展性函数的情况下,确定403是否应当改变GPU的时钟频率。在此,作为功率节省特征,如果当前阶段的频率扩展性函数表明如果GPU的时钟降低则GPU的性能不倾向于实质性地下降,功率管理功能可决定降低GPU时钟以便执行该阶段。同样,如果当前阶段的频率扩展性函数表明GPU的性能倾向于实质性地下降,功率管理功能可选择不降低当前阶段的GPU时钟。如果功率管理功能确定应当为该阶段降低GPU时钟,GPU时钟频率被降低到新的值404并且该过程在检测下一阶段时重复。如果功率管理功能确定不应当为该阶段降低GPU时钟,GPU时钟频率保持不变并且该过程在检测下一阶段时重复。图5涉及用于确定GPU的当前阶段的实施例。根据图5的实施例,当前第1页1 2 3 4 本文档来自技高网...

【技术保护点】
一种由处理器执行的方法,包括:通过执行以下内容绘制帧:a)标识GPU阶段;b)使用所标识的GPU阶段获得所标识的GPU阶段的频率扩展性信息;c)基于所述频率扩展性信息,确定改变所述GPU在所述阶段内绘制所述帧的频率是否合适。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:I·蒙加克S·马君德E·雅寇壁
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1