当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于使用处理器中的核的热裕量的系统、方法和设备技术方案

技术编号:19396534 阅读:56 留言:0更新日期:2018-11-10 04:59
对核功率的动态调整可减少热设计功率(TDP)与可允许的热负荷之间的热裕量。例如,通过明确地直接关注核温度,每核闭环温度控制器(pCLTC)可移除由功率1级策略(PL1,一种在持续负荷下针对处理器限定频率和/或功率的策略)引发的保守性,从而当热系统中存在裕量时,允许提高处理器性能。

【技术实现步骤摘要】
【国外来华专利技术】用于使用处理器中的核的热裕量的系统、方法和设备
本公开涉及处理器中的功率控制,并且更具体地涉及动态调整核功率以减小热设计功率(TDP)与可允许的热负荷之间的热裕量。附图简述图1是例示出根据本文公开的实施例的处理器热设计的示意图。图2是例示出根据本文公开的实施例的被限制为TDP的处理器的图。图3是例示出根据本文公开的实施例的在被限制为TDP时处理器热裕量的图。图4是例示出根据本文公开的实施例的控制器实现的组件的图。图5是例示出根据本文公开的实施例的用于动态温度控制的方法的框图。图6是例示出根据本文公开的实施例的多核处理器的图。图7是例示出根据本文公开的实施例的计算机系统的图。图8是例示出根据本文公开的实施例的设计的模拟、仿真和制造的表示的图。具体实施方式以下提供根据本公开的实施例的系统和方法的详细描述。尽管描述了数个实施例,但应该理解的是,本公开不限于任何一个实施例,而是替代地包括许多替代、修改和等同物。此外,尽管在以下描述中阐述了许多具体细节以便提供对本文公开的实施例的透彻理解,但是可以在没有这些细节中的一些或全部的情况下实践一些实施例。此外,出于清楚的目的,相关技术中已知的某些技术材料未被详细描述以避免不必要地模糊本公开。公开了实现对核功率的动态调整以减小热设计功率(TDP)与可允许的热负荷之间的热裕量的技术、装置和方法。例如,通过明确地直接关注核温度,每核闭环温度控制器(pCLTC)可移除由功率1级策略(PL1,一种在持续负荷下针对处理器限定频率和/或功率的策略)引发的保守性,从而当热系统中存在裕量时,允许提高处理器性能。在一个实施例中,pCLTC策略的目标是计算功率预算,使得处理器温度处于期望设定点温度(Tsp),该Tsp略低于处理器被节流的温度(T_trip(T_断路))。以这种方式,限定了最大可允许的处理器性能。通过从PL1迁移至动态温度控制,中央处理单元(CPU)用户可在通常存在的各种条件(例如,低于TDP的温度、不同的核热耗散等)下从增强的性能受益。此外,pCLTC可允许愿意设计(或已安装)具有改进的冷却能力的热系统或数据中心的客户从此类投资得到直接的性能收益。某些服务器客户(包括云服务提供商)可能对最大性能预期敏感。因此,涡轮(turbo)功能(或超过稳态TDP稳定频率来运行处理器)是非常有价值的特征。然而,涡轮的性能可能受到现有热保护特征的不必要地限制,这些热保护特征基于功率而不是温度测量来限制在涡轮上花费的时间量。在一些实施例中,CPU受最大电压、电流和温度可靠性约束的限制。电压约束可通过熔丝设置来管理。电流约束可通过在功率控制器固件、硬件和/或软件(例如,pcode)中实现的Iccmax策略来管理。在一些实施例中,服务器处理器可以通过热设置(例如,PROCHOT)和PL1策略特征的组合来维持对最大温度约束的顺应性。对这些特征的限定(PROCHOT和PL1)描述如下。对于PROCHOT示例,如果处理器超过最大可允许的结温度,则表示已发生灾难性热事件,并且pcode中实现的PROCHOT特征可将处理器的电压和频率激进地节流至功率设置(Pm)。这可能是非常不期望的事件,因为其可能会造成严重的性能损失。PROCHOT被断言的温度在本文中被称为T_trip。对于PL1示例,平台热解决方案被设计成处理器功率的TDP规范。在指定的最大局部环境温度下,参考热解决方案将提供足够的冷却,使得如果CPU功率在长时间段内维持在TDP,则CPU温度将处于T_TDP,该T_TDP低于T_trip(其是将参与PROCHOT的结温度)。PL1通过动态电压和频率缩放(DVFS)将平均功率维持在TDP来隐含地实现对温度约束的顺应性。这会使性能持续低下,因为不必要地选择了较低的电压/频率(例如,当环境温度低于TDP设计时等)。每核闭环热控制器(pCLTC)可取代PL1环并提供显式温度控制。显式温度控制可利用热系统中的裕量(例如,在TDP与实际温度之间)来提供比单独用PL1大的跨工作负荷的可允许性能。通过利用线性系统理论和动态建模,闭环控制器可被调谐至附加性能结果,并进一步使保守性最小化。然而,某些相关技术——RATL(运行平均温度限制)——不被用于限定最大可允许的瞬时功率预算。相反,RATL被用于限定替代的瞬时可允许的温度结最大温度(Tjmax)。RATL被用于改变处理器节流所在的Tjmax。RATL允许结温度(Tj)在短持续时间内超过Tjmax,只要指数加权移动平均(EWMA)计算的Tj_average(Tj_平均)低于Tj_max。图1示出了处理器热设计,包括热关系。衬底118被耦合至硅管芯116和集成热扩散器114。散热器112被耦合至集成热扩散器114。在硅管芯116与集成热扩散器114之间的边界处测量结温度(Tj)110。在集成热扩散器114处测量壳温度(Tcase(T壳))108。在散热器112处或附近测量环境温度(TLA)102。壳至环境热阻(PSI_CA)104量化参考散热器的热阻。结至壳热阻(PSI_JC)106量化从硅管芯116至散热器112的热阻。为了例示热裕量如何在系统中呈现其本身,示出相关的稳态热关系:T_TDP=(P_TDP*PSI_JC)+T_case_max(式1)T_TDP是稳态TDP条件下的稳态结温度(℃)(如通过跨管芯的最大温度来测量的)。P_TDP是指定的封装处理器热设计功率(以瓦特计)。PSI_JC106是结至壳热阻(℃/瓦特)。T_case_max(T_壳_最大)是处理器封装的集成热扩散器的顶部中心处的最大温度(即,在稳态TDP下)。T_case_max=(P_TDP*PSI_CA)+T_LA_max(式2)PSI_CA104是量化参考散热器的热阻的壳至环境热阻(℃/瓦特)。T_LA_max(T_LA_最大)是指定的最大局部环境温度(以℃计)。在一些实施例中,所需的PSI_CA104被指定给原始设备制造商(OEM)以设计散热器。通过此规范,可将持续TDP功率设计成不导致热断路。在上述假设下,保持以下关系:T_TDP<T_Trip(式3)由于允许处理器以消耗比TDP多的功率的涡轮频率运行,因此PL1可被用于确保相对长间隔(例如,5秒)内的平均处理器功率等于TDP。使用此设计,在热解决方案失败的情形中,处理器可能会超过T_trip。虽然PL1可以确保式3在指定条件下保持,但其也会强加显著的保守性(例如,热裕量)。在以下条件中的任一条件(或其组合)下,T_TDP和T_Trip之间的裕量可能是显著的:(1)局部环境温度低于T_LA_max;(2)PSI_CA小于指定值(比参考设计好的热解决方案);(3)由于比式2中假设的较不激进的工作负荷特定功率映射,PSI_JC小于指定值;以及(4)给定核的温度小于封装温度。图2和3示出运行工作负荷的处理器的图形示例,其中PL1将性能限制为TDP水平(图2),而最大管芯温度保持低于温度限制(图3)。此热裕量表示针对CPU的性能机会。在图2中,第一核功率202和第二核功率204在TDP附近运行,如由PL1限制。这提供了如图3所示的热裕量306。核304的温度低于温度限制302(例如,T_trip)。例如,在核的温本文档来自技高网...

【技术保护点】
1.一种用于估计集成芯片中的动态功率的装置,所述装置包括:测量接口,所述测量接口被配置成接收针对多个核的温度测量;功率接口,所述功率接口被配置成提供针对来自一组核的每个核的p状态;以及一个或多个处理器,所述一个或多个处理器被配置成:针对来自所述一组核的每个核:测量所述核的温度;确定可允许的热负荷;确定温度相关的泄漏;至少部分地基于活动比率、所述温度相关的泄漏以及可用的总功率来计算可用功率;至少部分地基于所述可用功率来确定p状态电压;并且选择针对所述核的所述p状态。

【技术特征摘要】
【国外来华专利技术】2016.03.31 US 15/086,4561.一种用于估计集成芯片中的动态功率的装置,所述装置包括:测量接口,所述测量接口被配置成接收针对多个核的温度测量;功率接口,所述功率接口被配置成提供针对来自一组核的每个核的p状态;以及一个或多个处理器,所述一个或多个处理器被配置成:针对来自所述一组核的每个核:测量所述核的温度;确定可允许的热负荷;确定温度相关的泄漏;至少部分地基于活动比率、所述温度相关的泄漏以及可用的总功率来计算可用功率;至少部分地基于所述可用功率来确定p状态电压;并且选择针对所述核的所述p状态。2.如权利要求1所述的装置,其特征在于,所述活动比率基于相对于所述p状态电压的核工作负荷。3.如权利要求1所述的装置,其特征在于,所述温度相关的泄漏至少部分地基于电压和所述温度。4.如权利要求1所述的装置,其特征在于,至少部分地基于电压和经测量温度来估计所述温度相关的泄漏。5.如权利要求1所述的装置,其特征在于,确定所述可允许的热负荷进一步包括:计算自上一更新以来的时间;计算针对每个核的温度误差;计算有限样本时间窗口上的误差的积分;以及计算控制器输出。6.如权利要求5所述的装置,其特征在于,进一步包括将积分和限制为预定最大值以防止积分器饱和。7.如权利要求6所述的装置,其特征在于,进一步包括在自上一更新以来的所述时间超过容限时设置标志位。8.如权利要求5所述的装置,其特征在于,计算所述控制器输出进一步包括使用等式Pcontrol=Kp*error+Ki*integralsum。9.如权利要求1-8中任一项所述的装置,其特征在于,计算所述可用功率(Pdyn1)进一步包括使用等式Pdyn1=Ptotal1-Pleak1。10.如权利要求1-8中任一项所述的装置,其特征在于,基于等式来计算所述活动比率(AR)。11.如权利要求1-8中任一项所述的装置,其特征在于,确定所述可允许的热负荷进一步包括基于将功率和所述温度联合的模型来从所述可允许的热负荷确定可允许的功率。12.如权利要求1-8中任一项所述的装置,其特征在于,确定所述可允许的热负荷进一步包括确定核之间的热耦合。13.如权利要求1-8中任一项所述的装置,其特征在于,所述一个或多个处理器针对多输入、多输出控制器设计被配置成用于管理每个核的温度。14.一种用于在热预算内动态地调整功率的处理器系统,包括:中央处理单元,所述中央处理单元包括一组核;一组温度传感器,所述一组温度传感器被耦合至所述一组核;功率接口,所述功率接口被配置成向来自所述一组核的每个核...

【专利技术属性】
技术研发人员:D·G·卡塔赫纳C·D·高夫V·加吉N·古普塔
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1