动态可靠性质量监测制造技术

技术编号:20881364 阅读:63 留言:0更新日期:2019-04-17 13:02
描述了一种用于管理半导体芯片内的操作模式以在满足可靠性目标的同时实现最佳功率和性能的系统和方法。一种半导体芯片包括功能单元以及对应的可靠性监测器。所述功能单元向所述可靠性监测器提供实际使用值。所述可靠性监测器基于可靠性目标和所述半导体芯片的寿命而确定预期使用值。所述可靠性监测器将所述实际使用值与所述预期使用值进行比较。使用该比较的结果来增大或减小当前操作参数。

【技术实现步骤摘要】
【国外来华专利技术】动态可靠性质量监测
技术介绍
相关技术的描述现代集成电路(IC)的功耗已经成为每代半导体芯片的越来越重要的设计问题。集成电路功率耗散约束不仅是便携式计算机和移动通信装置的问题,而且也是可包括多个处理器核心和在核心内的多个流水线的高性能微处理器的问题。用于IC的功率管理单元(PMU)可以在检测到或以其它方式告知该部分在给定时段内未被使用时减少通到IC的一部分的功率。类似地,基于一个或多个处理单元的使用反馈而调整功率性能状态(P状态)或动态电压和频率缩放(DVFS)技术。典型地,当估计IC的寿命时,功率管理算法假设IC的随时间的最坏情况热条件和预期使用。给定这些假设,选择比本来可能已经选择的更低的性能状态(平均)。然而,在典型使用期间,可能实际上无法满足最坏情况热条件。因此,因最坏情况假设而对系统施加的功率约束可能比必要的更严格。不幸地,由于IC的使用是提前预测的,并且内置在系统中,因此系统可能在其预期寿命期间提供比本来可能已经实现的更低的性能。鉴于上述情况,期望用于管理半导体芯片内的操作模式以在满足可靠性目标的同时实现最佳功率和性能的有效方法和系统。附图说明图1是计算系统的一个实施方案的概括图。图2是用于增加计算系统的性能和可靠性的方法的一个实施方案的概括图。图3是用于调整操作参数以增加计算系统的可靠性的方法的一个实施方案的概括图。图4是片上系统(SOC)的一个实施方案的概括图。图5是用于增加半导体芯片的性能和可靠性的方法的一个实施方案的概括图。虽然本专利技术易受各种修改形式和替代形式影响,但是具体实施方案已经在附图中通过示例的方式示出并且已经在本文中详细地描述。然而,应理解,附图和其详细描述并不旨在将本专利技术限制于所公开的特定形式,相反,本专利技术将涵盖落在如所附权利要求限定的精神和范围内的所有修改、等效物和替代物。具体实施方式在以下描述中,阐述了许多特定细节,以提供对本专利技术的更透彻的理解。然而,本领域的普通技术人员应认识到,可以在没有这些具体细节的情况下实践本专利技术。在一些情况下,所熟知的电路、结构和技术未被详细地示出,以避免模糊本专利技术。另外,将了解,为了简洁且清楚地说明,附图中所示的要素不一定按比例绘制。例如,一些要素的尺寸相对于其它要素被夸大。设想用于管理半导体芯片内的操作参数以在满足可靠性目标的同时实现最佳功率和性能的系统和方法。在各种实施方案中,半导体芯片包括一个或多个功能单元,每个功能单元以相应的操作参数操作。一个或多个功能单元连接到对应的可靠性监测器。这些一个或多个功能单元将实际使用值报告给可靠性监测器。例如,每当经过给定时间间隔,一个或多个功能单元就会报告实际使用值。功能单元的实际使用值至少基于一个或多个操作参数和功能单元的寿命。在一些实施方案中,操作参数包括给定功能单元的功率性能状态(P状态)、多个功能单元的动态电压和频率缩放(DVFS)参数、活动水平、在给定时间间隔期间这些参数的值、在给定时间间隔内这些参数的平均值等等。实际使用值还可以包括操作温度。可靠性监测器从功能单元接收实际使用值,并且至少部分地基于功能单元的寿命而确定对应的功能单元的预期使用值。例如,如果半导体芯片的可靠性目标是至少五年的寿命期限,那么基于五年寿命期限的可靠性目标而设定在选定持续时间内的预期使用值。选定每持续时间可以是小时、每天、每周或其它。可以按照需要来设定预期使用值的分布。例如,在一个实施方案中,使用均匀分布,其中在芯片的寿命期间的每个时间间隔使用近似相等的预期使用值。在其它实施方案中,针对寿命期限的早期阶段设定较高预期使用值,而针对寿命期限的后期阶段设定较低预期使用值,或反之亦然。用于基于可靠性目标而设定预期使用值的其它分布是可能的并是设想的。可靠性监测器将接收到的实际使用值与预期使用值进行比较。在各种实施方案中,可靠性监测器至少基于从功能单元接收到的实际使用值和功能单元的寿命而将可靠性度量保持为随时间的累积值。当可靠性监测器确定接收到的实际使用值超过预期使用值时,可靠性监测器生成信息(例如,命令或其它)以通过减少功耗和/或其它操作参数来增加功能单元的可靠性。当可靠性监测器确定接收到的实际使用值超过预期使用值时,功能单元的剩余预期寿命可能不会达到目标寿命。通过减小操作参数,可以延长剩余寿命,使得达到目标寿命。相反,可靠性监测器响应于确定接收到的实际使用值小于预期使用值而生成命令以允许功能单元的性能提升。以此方式,可靠性监测器通过在真实使用状况下使用反馈来替换或修改预期使用方法。当实际使用小于最初预期使用时,由可靠性监测器提供的调整增加芯片的性能,同时仍然达到功能单元的目标寿命。现在转向图1,示出了计算系统100的一个实施方案的概括框图。如图所示,计算系统100包括功能单元150、可靠性监测器110和功率管理器140。功能单元150还可以表示具有其自己的电压/时钟域的任何电路。功能单元150将实际使用值152传达给可靠性监测器110和功率管理器140中的每一者。功率管理器140内的控制逻辑(诸如参数选择器142)使用接收到的实际使用值来选择功能单元150的一个或多个操作参数。另外,参数选择器142接收和使用来自可靠性监测器110的信息以更新功能单元150的操作参数。该信息包括用于调整操作参数的一个或多个命令、指示、标志或计算值。例如,在没有来自可靠性监测器110的信息的情况下,参数选择器142基于功耗的最坏情况最大极限而选择不同参数。在一些实施方案中,由参数选择器142使用的一个或多个算法使用热设计功率(TDP)值。TDP值表示冷却系统能够在不超过芯片内的晶体管的最大结温的情况下耗散的功率的量。可靠性监测器110还从功能单元150接收实际使用值。可靠性监测器还存储预期使用值114。实际使用值112和预期使用值114中的一者或多者取决于功能单元150的寿命120。可靠性监测器110内的比较器130将实际使用值112与预期使用值114进行比较。由比较器130执行的比较确定功能单元150的使用是否以可靠性目标为目标。例如,如果计算系统100的可靠性目标是至少五年的寿命期限,那么基于五年寿命期限的可靠性目标而设定在持续时间内的多个预期使用值。可靠性监测器110内的控制逻辑接收来自比较器130的比较结果,并且确定接收到的实际使用值112超过预期使用值114。作为响应,可靠性监测器110内的控制逻辑提供信息154以指示功率管理器140增加功能单元150的可靠性。在这种情况下,信息154可以指示应减小操作参数中的一者或多者。在一个实施方案中,指示操作参数的减小的最大值。由参数选择器142使用的减小的最大值致使参数选择器142选择减少功能单元150的功耗的参数。发送到功能单元150的减小的最大值和所得选定操作参数减少功能单元150上的磨损,并且因此增加功能单元150的可靠性。与上述相反,当来自比较器130的比较结果指示接收到的实际使用值112小于预期使用值114时,可靠性监测器110提供指示性能提升可用的信息以供功率管理器140使用。从可靠性监测器110发送到功率管理器140的信息指示保持或增大操作参数中的一者或多者的最大值。由参数选择器142使用的更新的最大值致使参数选择器142选择增加功能单元150的性能的参数。在一本文档来自技高网...

【技术保护点】
1.一种半导体芯片,所述半导体芯片包括:功能单元;监测器,所述监测器被配置为:监测所述功能单元的实际使用;将所述功能单元的所述实际使用与所述功能单元的预期使用进行比较,其中所述预期使用至少部分地基于所述功能单元的寿命;以及提供对应于所述比较的信息;功率管理器,所述功率管理器被配置为:响应于所述信息而更新所述功能单元的操作参数以改变所述功能单元的功耗;以及将所述更新的操作参数发送到所述功能单元。

【技术特征摘要】
【国外来华专利技术】2016.09.07 US 15/258,8161.一种半导体芯片,所述半导体芯片包括:功能单元;监测器,所述监测器被配置为:监测所述功能单元的实际使用;将所述功能单元的所述实际使用与所述功能单元的预期使用进行比较,其中所述预期使用至少部分地基于所述功能单元的寿命;以及提供对应于所述比较的信息;功率管理器,所述功率管理器被配置为:响应于所述信息而更新所述功能单元的操作参数以改变所述功能单元的功耗;以及将所述更新的操作参数发送到所述功能单元。2.如权利要求1所述的半导体芯片,其中响应于确定所述实际使用小于所述预期使用,所述更新的操作参数包括所述操作参数的最大值,所述最大值大于所述操作参数的当前最大值。3.如权利要求2所述的半导体芯片,其中所述操作参数包括与最大性能相关联的操作电压和功率性能状态中的一者或多者。4.如权利要求1所述的半导体芯片,其中响应于确定所述实际使用大于所述预期使用,所述更新的操作参数包括所述操作参数的最大值,所述最大值小于所述操作参数的当前最大值。5.如权利要求1所述的半导体芯片,其中响应于第一命令,所述功率管理器被配置为更新所述操作参数的最大值。6.如权利要求1所述的半导体芯片,其中响应于确定所述实际使用不同于所述预期使用,所述监测器还被配置为改变所述功能单元的所述预期使用。7.如权利要求1所述的半导体芯片,其中监测所述实际使用包括接收多个值,所述值包括操作电压和温度测量值中的一者或多者。8.如权利要求7所述的半导体芯片,其中所述监测器还被配置为:至少基于所述功能单元的所述实际使用和所述功能单元的寿命而将可靠性度量保持为随时间的累积值;以及将所述可靠性度量与可靠性目标进行比较。9.如权利要求8所述的半导体芯片,其中所述监测器还被配置为响应于检测到已经经过给定时间间隔而将所述可靠性度量存储到非易失性存储器。10.如权利要求1所述的半导体芯片,其中所述半导体芯片还包括:多个电压/时钟域,每个电压/时钟域都以操作参数操作;以及多个监测器,每个监测器被配置为:从所述多个电压/时钟域中的相应一者接收实际使用值;以及将所述实际使用值与所述电压/时钟域的预期使用值进行比较。11.一种方法,所述方法包括:操作功能单元;将所述功能单元的实际使用与所述功能单元的预期使用进行比较,其中所述预期使用至少部分地基于所述功能单元的寿命;以及响应于确定所述实际使用不同于所述预期使用而更新所述功能单元的操作参数以改变所述功能单元的功耗。12.如权利要求11所述的方法,其中响应于确定所述实际使用小于所述预期使用,所述更新包括将所述操作参数的最大值改变为大于所述操作参数的当前最大值。13.如权利...

【专利技术属性】
技术研发人员:斯蒂芬·V·科索诺基托马斯·伯德亚当·克拉克拉里·D·翰威特约翰·文森特·法里赛利约翰·P·佩特里
申请(专利权)人:超威半导体公司ATI科技无限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1