利用用户上下文信息检测故障状况并随后恢复的方法和设备技术

技术编号:9990925 阅读:175 留言:0更新日期:2014-05-02 04:11
一种系统的协处理单元检测与协处理单元相关联的故障状况,并在检测到时利用所存储的用户上下文信息恢复处理单元。在正常工作期间,由协处理单元在存储器中存储用于执行操作命令的用户上下文信息并在故障检测之后进行维护。当由于放电静电事件导致处理单元的至少一部分无法工作时检测为故障状况。可以通过由协处理单元接收到表示故障状况的信息,或通过检查与处理单元相关联的至少一个存储器位置来确定其中存储的信息是否表示故障状况来检测故障状况。协处理单元利用所存储的用户上下文信息将故障前检测状态信息恢复到与处理单元相关联的存储位置,使处理单元返回到已知的可工作状态。

【技术实现步骤摘要】
利用用户上下文信息检测故障状况并随后恢复的方法和设备本申请是申请日为2006年12月27日、申请号为200680053400.2的同名专利申请的分案申请。
本专利技术总体上涉及检测故障状况,更具体而言涉及利用协处理单元检测处理单元中的故障状况,以及响应于其进一步利用该协处理单元使用存储的故障前用户上下文信息来恢复处理单元。
技术介绍
计算系统通常由集成电路(IC)和各种其他电子组件等构成,所述电子组件例如是但不限于状态机、专用集成电路(ASIC)、逻辑门和离散逻辑器件。像大部分电子器件那样,这些组件对静电放电以及其他由于静电和/或电磁事件而传导电荷(即放电)的事件(统称为放电事件)很敏感。如果足够强烈,这种放电事件会使组件进入不正确、不良或错误状态,由此使元件至少暂时无法工作。换言之发生了故障。尽管一些系统设计师已经提供了针对放电事件保护或隔离系统组件的器件,厂家不使用充分的屏蔽或采用低效的保护机制来确保防范这种事件也并非少见。在一些情况下,制造设计决策可能由装置的功能、装置的尺寸或物理特性或简单的经济情况来支配。在任何情况下,计算系统会受到且将继续受到各种放电事件的影响,这种放电事件将导致故障(即无法工作的状况)。移动装置对放电事件尤其敏感,并且由于它们的使用性质,可能会发生故障。例如,移动装置根据定义是小巧且便携的。用户能够手持装置移动很大距离且跨越各种环境。因此,用户的移动可能会对用户身体或衣服上的电荷产生加强作用。在接触或接近移动装置时,用户可能会充当导线,将电荷转移到移动装置并可以使其无法工作。然而还发现,非移动计算机系统,例如台式计算机、机顶盒或其他计算系统也可能对放电事件敏感,且在类似的操作者将电荷传导到这种系统的情况下可能会发生故障。如本领域的普通技术人员所公知的,诸如移动电话或其他手持装置的计算系统可以包括两个处理单元,中央处理单元(CPU)和图形处理单元(GPU)。CPU经由北桥、南桥、任何适当的一根或多根总线或任何其组合耦合到GPU,以传递绘图命令和其他操作命令或指令,随后加以执行。GPU可以与多个寄存器、帧缓冲器和图形处理器相关联。类似地,CPU可以与多个个体组件相关联,且耦合到用于存储可执行指令和工作数据等的系统存储器。在一个实施例中,可以在系统存储器中存储各种驱动程序和其他软件模块以在CPU中执行。大部分移动装置的CPU通常是被屏蔽的以防其及其相关电子组件受到放电事件影响。然而,由于和制造和设计相关的设计决策多种多样,移动装置的GPU得不到充分保护是常见情况。因此,已经发现在发生放电事件时,GPU及其相关电子组件中的至少一个或多个处于不良或不工作状态。例如,发现GPU寄存器尤其易发生故障,且需要重启来继续工作。尽管现有技术中有解决方案来检测与GPU相关的故障状况(即指示发生故障的任何状况)并将GPU恢复到可工作状态,但没有使处理单元恢复到已知的无缝或接近无缝操作的可工作状态的已知方案。例如,已知利用CPU执行的驱动程序监测GPU的某些寄存器来检测放电事件和随后的故障状况。已知的现有技术通常通过重新启动故障影响的GPU和GPU驱动程序来工作。然而,重新启动GPU会丢失在GPU驱动程序正常工作期间获得的用户上下文信息。于是,CPU的操作系统以及发出由CPU和GPU之一执行的命令的其他客户端/应用需要在执行之前产生新的用户上下文信息。通常,这需要用户启动此前在检测到故障状况之前运行的软件模块/驱动程序的另一实例。本领域的普通技术人员和计算装置的一般用户都理解这会导致数据丢失,且用户对它们的计算装置不满意。因此,需要一种在计算系统中使用的故障检测和恢复方法和设备,其中,协处理单元上运行的驱动程序、客户端和其他应用不受与处理单元相关的故障状况影响。另一种需求是恢复计算系统,使其受影响部分返回到已知的可用状态。因此,操作系统或使用该处理单元的客户端/应用都不会受到放电事件的影响。相反,它们仍然继续工作,只给用户对计算系统的体验带来最小的影响。如上所述,这种方法和设备在检测出故障状况之后提供了一种接近无缝的恢复方法。
技术实现思路
根据本专利技术的第一方面,提供了一种方法,包括:在检测到与处理单元相关联的故障状况时,利用所存储的用户上下文信息恢复所述处理单元。根据本专利技术的第二方面,提供了一种包括通过至少一个如下操作检测与处理单元相关联的故障状况的方法:由协处理单元检测与所述协处理单元相关联的输入已接收到标识故障状况的信息;由所述协处理单元基于监测与正常运行中的处理单元相关联的至少一个存储器位置(memorylocation)来检测初始故障状况,并由所述协处理单元基于确定与所述处理单元相关联的至少另一个存储器位置包含指示故障状况的信息来验证所述初始故障状况为故障状况;由所述协处理单元确定与所述处理单元相关联的至少一个处理单元标识存储器位置包含不正确的处理单元标识信息;以及由所述协处理单元确定与所述处理单元相关联的至少一个像素时钟存储器位置包含不正确的像素时钟信息;以及在检测到故障状况之后,至少通过利用初始化例程将处理单元的至少一个存储器位置重新初始化到工作状态来利用所存储的用户上下文信息恢复所述处理单元。根据本专利技术的第三方面,提供了一种设备,包括:用于在检测到与所述处理单元相关联的故障状况时利用所存储的用户上下文信息恢复所述处理单元的逻辑。根据本专利技术的第四方面,提供了一种设备,包括:处理单元;以及可运行地耦合到所述处理单元和包含所存储的指令的存储器的协处理单元,使得当所述协处理单元执行所述指令时,使所述协处理单元:在检测到与处理单元相关联的故障状况时,利用所存储的用户上下文信息恢复所述处理单元。根据本专利技术的第五方面,提供了一种包括所存储的指令的存储器,在执行所述指令时使协处理单元:在检测到与处理单元相关联的故障状况时,利用所存储的用户上下文信息恢复所述处理单元。附图说明在结合附图考虑以下描述时,本专利技术将更容易得到理解,在附图中,类似的附图标记表示类似元件:图1为方框图,示出了根据本公开的一个实施例的检测与处理单元相关联的故障状况并恢复处理单元的系统的一个范例;图2为流程图,示出了根据本公开一个实施例的用于检测故障状况和恢复处理单元的方法的一个范例;图3为流程图,示出了根据图2的方法检测与处理单元相关的故障状况的一个范例;图4为流程图的第一部分,示出了在图2的方法中使用的检测与处理单元相关的故障状况的方法的另一个范例;图5为图4的方法的后部分;图6为流程图,示出了根据图2的方法的利用所存储的用户上下文信息恢复处理单元的一个范例;以及图7为方框图,示出了根据本公开的第二实施例的检测与处理单元相关联的故障状况并随后恢复处理单元的系统的第二范例。具体实施方式总地讲来,本公开提供了一种包括处于计算环境中处理单元和协处理单元的系统,其中处理单元用于检测与协处理单元相关联的故障状况,且在检测之后利用所存储的用户上下文信息恢复处理单元。在正常工作期间,由协处理单元存储用户上下文信息,其中用户上下文信息例如包括关于处理单元及其相关组件和器件是处于“开启”或“关断”状况的状态信息,用于支持处理单元及其相关组件和器件的使用率和功能性的其他配置信息。此外,用户上下文信息可以包括表示在执行特定操作命令时要使用的资本文档来自技高网
...
利用用户上下文信息检测故障状况并随后恢复的方法和设备

【技术保护点】

【技术特征摘要】
2005.12.28 US 11/319,9261.一种故障检测方法,包括:由协处理单元从处理单元获得与所述处理单元相关联的用户上下文信息;由所述协处理单元在所述处理单元的正常运行期间将所获得的用户上下文信息存储到外部存储器中;由所述协处理单元在所述处理单元的正常运行期间将操作命令发给所述处理单元,其中所述操作命令中的一个或更多个包括所述用户上下文信息的至少一部分;以及在由所述协处理单元检测到与所述处理单元相关联的故障状况时,由所述协处理单元使用所存储的用户上下文信息恢复所述处理单元。2.根据权利要求1所述的方法,其中检测所述故障状况包括下列各项中的至少一项:由所述协处理单元检测与所述协处理单元相关联的输入已接收到标识所述故障状况的信息;以及由所述协处理单元检测与所述处理单元相关联的至少一个存储器位置包含指示故障状况的信息。3.根据权利要求2所述的方法,其中检测至少一个存储器位置包含指示故障状况的信息包括下列各项中的至少一项:由所述协处理单元基于监测与正常运行中的所述处理单元相关联的至少另一个存储器位置来检测初始故障状况,并由所述协处理单元基于确定与所述处理单元相关联的所述至少一个存储器位置包含指示所述故障状况的信息来验证所述初始故障状况为所述故障状况;由所述协处理单元确定与所述处理单元相关联的至少一个处理单元标识存储器位置包含不正确的处理单元标识信息;以及由所述协处理单元确定与所述处理单元相关联的至少一个像素时钟存储器位置包含不正确的像素时钟信息。4.根据权利要求1所述的方法,其中恢复所述处理单元包括:使用初始化例程将与所述处理单元相关联的至少一个存储器位置重新初始化到工作状态。5.根据权利要求4所述的方法,其中恢复所述处理单元包括防止向所述处理单元发出至少一个操作命令。6.根据权利要求4所述的方法,其中使用初始化例程将与所述处理单元相关联的至少一个存储器位置重新初始化到工作状态包括:向与所述处理单元相关联的所述至少一个存储器位置写入缺省信息;以及向与所述处理单元相关联的所述至少一个存储器位置写入初始化信息。7.根据权利要求1所述的方法,其中恢复所述处理单元包括:使用所存储的用户上下文信息来确定下列各项中至少一项的故障前检测状态信息:所述处理单元、与所述处理单元相关联的一个或多个显示装置、以及与所述处理单元相关联的一个或多个电路;以及基于所存储的用户上下文信息来改变下列各项中的至少一项的故障后检测状态信息,以匹配所确定的故障前检测功率状态:所述处理单元、所述一个或多个显示装置、以及所述一个或多个电路。8.根据权利要求7所述的方法,其中改变所述故障后检测状态信息包括:当发出需要使用与所述处理单元相关联的至少一个存储器位置、与所述处理单元相关联的至少另一个存储器位置、以及与所述处理单元相关联的至少又一个存储器位置这三者中的一个或多个的操作命...

【专利技术属性】
技术研发人员:A·S·德阿尔梅达M·艾哈迈迪I·W·Y·扬H·严
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1