用于降低图形帧处理中的功耗的CPU/GPU DCVS协同优化制造技术

技术编号:14312991 阅读:46 留言:0更新日期:2016-12-30 13:44
公开了用于使图形帧处理中的功耗最小化的系统、方法和计算机程序。一种这样的方法包括:发起将由中央处理单元(CPU)和图形处理单元(GPU)协作地执行的图形帧处理;接收CPU活动数据和GPU活动数据;确定针对所述GPU和所述CPU的可用的动态时钟和电压/频率缩放(DCVS)水平的集合;以及基于所述CPU和GPU活动数据,从所述可用的DCVS水平的集合中选择GPU DCVS水平和CPU DCVS水平的最优组合,所述GPU DCVS水平和CPU DCVS水平的最优组合使在所述图形帧处理期间,所述CPU和所述GPU的组合功耗最小化。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
便携式计算设备(例如,蜂窝电话、智能电话、平板型计算机、便携式数字助理(PDA)以及便携式游戏控制台)持续提供不断扩展的大批特征和服务,并且向用户提供对信息、资源和通信的前所未有的水平的接入。为了跟上这些服务增强,这种设备变得更强大、更复杂。便携式计算设备现在通常包括片上系统(SoC)和/或嵌在单个基板(例如,中央处理单元(CPU)、图形处理单元(GPU)等)上的多个微处理器内核,这允许用户执行复杂的和功率密集型的软件应用。然而,增加的性能和功能要求对管理电池寿命和功耗提出了显著的设计和操作挑战。用于管理多处理器设备的功耗的现有方法可能涉及动态时钟和电压缩放(DCVS)技术。DCVS涉及选择性地调整施加到处理器、硬件设备等的频率和/或电压,以产生期望的性能和/或功率效率特性。常规的DCVS解决办法表现出多个性能问题,并且实现针对多内核处理系统的每个内核来对频率/电压进行正确地缩放的有效的DCVS方法是重要的和有挑战性的设计标准。例如,用于多处理器系统(例如,包括CPU和GPU的系统)的DCVS技术要求每个处理器包括单独的DCVS模块/过程和/或独立于其它处理器来调整处理器频率/电压。此外,当执行图形帧处理时,单独的CPU和/或GPU DCVS算法被设计为在帧处理截止期限所给出的约束内优化性能,而不考虑功率效率优化。因此,在本领域仍然存在对用于针对多处理器系统中的功率效率来优化DCVS的改进的系统和方法的需求。
技术实现思路
公开了用于使图形帧处理中的功耗最小化的系统、方法和计算机程序。一种这样的方法包括:发起将由中央处理单元(CPU)和图形处理单元(GPU)协作地执行的图形帧处理;接收CPU活动数据和GPU活动数据;确定所述GPU和所述CPU的可用的动态时钟和电压/频率缩放(DCVS)水平的集合;以及基于所述CPU和GPU活动数据,从所述可用的DCVS水平的集合中选择GPU DCVS水平和CPU DCVS水平的最优组合,所述GPU DCVS水平和CPU DCVS水平的最优组合使在所述图形帧处理期间,所述CPU和所述GPU的组合功耗最小化。另一个实施例包括一种用于使图形帧处理中的功耗最小化的系统。一种这样的系统包括片上系统(SoC),所述片上系统包括:中央处理单元(CPU);图形处理单元(GPU);以及与所述GPU和所述CPU相通信的动态时钟电压和缩放(DCVS)控制器。CPU/GPU DCVS协同优化模块被配置为:基于CPU和GPU活动数据,确定用于所述DCVS控制器的GPU DCVS水平和CPU DCVS水平的最优组合。选择所述GPU和CPU DCVS水平的所述最优组合,以使在图形帧处理期间,所述CPU和所述GPU的组合功耗最小化。附图说明在附图中,除非另外指示,否则遍及各个视图,相似的附图标记指代相似的部分。对于具有诸如“102A”或“102B”的字母字符标记的附图标记,字母字符标记可以区分出现在同一附图中的两个相似的部分或元素。当旨在使附图标记涵盖在所有附图中具有相同附图标记的所有部分时,可以省略附图标记的字母字符标记。图1是用于在图形帧处理中协同优化中央处理单元(CPU)和图形处理单元(GPU)动态时钟和电压/频率缩放(DCVS)的系统的实施例的框图。图2是在图1的系统中实现的、用于根据检测到的图形工作负荷类型来选择DCVS协同优化算法的方法的实施例的流程图。图3是示出了图1的系统中的CPU/GPU DCVS协同优化模块的示例性数据输入和输出的框图。图4是示出了在图1的系统中实现的、用于协同优化CPU和GPU DCVS以使图形帧处理期间的功耗最小化的方法的实施例的流程图。图5a-5c是示出了用于CPU/GPU串行化图形工作负荷的CPU/GPU DCVS协同优化方法的实施例的一系列定时图。图6是示出了用于在第一CPU/GPU温度下针对图形帧处理期间的最小组合功耗来协同优化GPU和CPU DCVS水平的示例性CPU/GPU频率空间的数据表格。图7示出了针对第二CPU/GPU温度的图6的数据表格。图8示出了针对第三CPU/GPU温度的图6的数据表格。图9示出了用于实现梯度下降搜索方法的CPU/GPU DCVS协同优化算法的实施例。图10是在图1的系统中实现的、用于针对CPU/GPU并行化图形工作负荷来协同优化CPU/GPU DCVS水平的方法的实施例的流程图。图11a和11b是示出了用于CPU/GPU并行化图形工作负荷的CPU/GPU DCVS协同优化方法的实施例的一系列定时图。图12是包括图1的系统的便携式计算机设备的实施例的框图。具体实施方式本文使用的词语“示例性”意味着“作为示例、实例或说明”。本文中描述为“示例性”的任何方面不必被解释为优选于其它方面或者比其它方面有优势。在本描述中,术语“应用”还可以包括具有可执行内容(诸如:对象代码、脚本、字节代码、标记语言文件以及补丁)的文件。另外,本文中所引用的“应用”还可以包括本质上不可执行的文件(诸如可能需要被打开的文档或需要被访问的其它数据文件)。术语“内容”还可以包括可执行内容(诸如:对象代码、脚本、字节代码、标记语言文件以及补丁)的文件。另外,本文中所引用的“内容”还可以包括本质上不可执行的文件(诸如可能需要被打开的文档或需要被访问的其它数据文件)。如在本描述中使用的,术语“组件”、“数据库”、“模块”、“系统”等旨在指代计算机相关的实体,要么是硬件、固件、硬件和软件的组合、软件,要么是执行中的软件。例如,组件可以是,但不限于是:在处理器上运行的过程、处理器、对象、可执行文件、执行的线程、程序和/或计算机。通过说明的方式,在计算设备运行上的应用和计算设备二者可以是组件。一个或多个组件可以存在于过程和/或执行的线程中,并且组件可以位于一个计算机中和/或分布在两个或更多计算机之间。此外,这些组件可以从具有在其上存储的各种数据结构的各种计算机可读介质中执行。组件可以诸如根据具有一个或多个数据分组(例如,来自与本地系统、分布式系统中的另一个组件进行交互,和/或跨诸如互联网的网络通过信号的方式与其它系统进行交互的一个组件的数据)的信号通过本地和/或远程过程进行通信。在本描述中,术语“通信设备”、“无线设备”、“无线电话”、“无线通信设备”以及“无线手持设备”可被互换地使用。随着第三代(“3G”)无线技术和第四代(“4G”)的到来,更大的带宽可用性已经实现了具有更多种无线能力的更便携的计算设备。因此,便携式计算设备可以包括蜂窝电话、寻呼机、PDA、智能电话、导航设备、或具有无线连接或链路的手持计算机。图1示出了用于在图形帧处理期间协同优化中央处理单元(CPU)106和图形处理单元(GPU)104的动态时钟和电压/频率缩放(DCVS)水平(被称为“CPU/GPU DCVS协同优化”)的系统100。图形帧处理可以涉及其中CPU 106和GPU 104协作地执行帧处理的任何工作负荷。例如,图形帧处理可以涉及CPU/GPU串行化工作负荷和/或CPU/GPU并行化工作负荷。如本领域已知的,CPU/GPU串行化工作负荷涉及由CPU 106和GPU 104针对每个图形帧所进行的连续处本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201580022602.html" title="用于降低图形帧处理中的功耗的CPU/GPU DCVS协同优化原文来自X技术">用于降低图形帧处理中的功耗的CPU/GPU DCVS协同优化</a>

【技术保护点】
一种用于使图形帧处理中的功耗最小化的方法,所述方法包括:发起将由中央处理单元(CPU)和图形处理单元(GPU)协作地执行的图形帧处理;接收CPU活动数据和GPU活动数据;确定所述GPU和所述CPU的可用的动态时钟和电压/频率缩放(DCVS)水平的集合;以及基于所述CPU和GPU活动数据,从所述可用的DCVS水平的集合中选择GPU DCVS水平和CPU DCVS水平的最优组合,所述GPU DCVS水平和CPU DCVS水平的最优组合使在所述图形帧处理期间,所述CPU和所述GPU的组合功耗最小化。

【技术特征摘要】
【国外来华专利技术】2014.04.30 US 14/266,6851.一种用于使图形帧处理中的功耗最小化的方法,所述方法包括:发起将由中央处理单元(CPU)和图形处理单元(GPU)协作地执行的图形帧处理;接收CPU活动数据和GPU活动数据;确定所述GPU和所述CPU的可用的动态时钟和电压/频率缩放(DCVS)水平的集合;以及基于所述CPU和GPU活动数据,从所述可用的DCVS水平的集合中选择GPU DCVS水平和CPU DCVS水平的最优组合,所述GPU DCVS水平和CPU DCVS水平的最优组合使在所述图形帧处理期间,所述CPU和所述GPU的组合功耗最小化。2.根据权利要求1所述的方法,其中,所述CPU活动数据和所述GPU活动数据是从与所述CPU和所述GPU相关联的相应的活动分析器接收的。3.根据权利要求1所述的方法,其中,所述CPU和GPU活动数据包括用于指定以下各项中的一项或多项的数据:处理器工作负荷、活动时间、空闲时间、以及等待时间。4.根据权利要求1所述的方法,还包括:从至少一个CPU温度传感器和至少一个GPU温度传感器中的一个或多个接收温度数据;以及接收与所述GPU和所述CPU中的一个或多个相关联的静态供应电流泄漏(IDDQ)数据;其中,所述GPU和CPU DCVS水平的所述最优组合是基于所述CPU和GPU活动数据以及所述温度数据和所述IDDQ数据中的一个或多个来选择的。5.根据权利要求1所述的方法,其中,所述图形帧处理包括CPU/GPU串行化工作负荷。6.根据权利要求5所述的方法,其中,所述GPU DCVS水平和所述CPU DCVS水平的所述最优组合包括:CPU/GPU频率空间中的操作点,所述操作点使在所述CPU/GPU串行化工作负荷期间,所述CPU和所述GPU的所述组合功耗最小化,同时满足帧截止期限。7.根据权利要求1所述的方法,其中,所述图形帧处理包括CPU/GPU并行化工作负荷。8.根据权利要求7所述的方法,还包括:优化公共硬件资源的处理以增加相关联的空闲时间;以及使用从显示器驱动器接收的垂直同步信号来将所述公共硬件资源处理与所述并行CPU和GPU工作负荷同步。9.一种用于使图形帧处理中的功耗最小化的系统,所述系统包括:用于发起将由中央处理单元(CPU)和图形处理单元(GPU)协作地执行的图形帧处理的单元;用于接收CPU活动数据和GPU活动数据的单元;用于确定所述GPU和所述CPU的可用的动态时钟和电压/频率缩放(DCVS)水平的集合的单元;以及用于基于所述CPU和GPU活动数据,从所述可用的DCVS水平的集合中选择GPU DCVS水平和CPU DCVS水平的最优组合的单元,所述GPUDCVS水平和CPU DCVS水平的最优组合使在所述图形帧处理期间,所述CPU和所述GPU的组合功耗最小化。10.根据权利要求9所述的系统,其中,所述CPU活动数据和所述GPU活动数据是从与所述CPU和所述GPU相关联的相应的活动分析器接收的。11.根据权利要求9所述的系统,其中,所述CPU和GPU活动数据包括用于指定以下各项中的一项或多项的数据:处理器工作负荷、活动时间、空闲时间、以及等待时间。12.根据权利要求9所述的系统,还包括:用于从至少一个CPU温度传感器和至少一个GPU温度传感器中的一个或多个接收温度数据的单元;以及用于接收与所述GPU和所述CPU中的一个或多个相关联的静态供应电流泄漏(IDDQ)数据的单元;其中,所述GPU和CPU DCVS水平的所述最优组合是基于所述CPU和GPU活动数据以及所述温度数据和所述IDDQ数据中的一个或多个来选择的。13.根据权利要求9所述的系统,其中,所述图形帧处理包括CPU/GPU串行化工作负荷。14.根据权利要求13所述的系统,其中,所述GPU DCVS水平和所述CPU DCVS水平的所述最优组合包括:CPU/GPU频率空间中的操作点,所述操作点使在所述CPU/GPU串行化工作负荷期间,所述CPU和所述GPU的所述组合功耗最小化,同时满足帧截止期限。15.根据权利要求9所述的系统,其中,所述图形帧处理包括CPU/GPU并行化工作负荷。16.根据权利要求15所述的系统,还包括:用于优化公共硬件资源的处理以增加相关联的空闲时间的单元;以及用于使用从显示器驱动器接收的垂直同步信号来将所述公共硬件资源处理与所述并行CPU和GPU工作负荷同步的单元。17.一种体现在计算机可读介质...

【专利技术属性】
技术研发人员:H·J·朴Y·H·康M·蒙达尔
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1