利用电源子系统诊断并从错误中恢复的方法和系统技术方案

技术编号:2862583 阅读:187 留言:0更新日期:2012-04-11 18:40
披露了一种用于诊断并从I/O子系统错误中恢复的方法、系统、以及计算机程序产品。数据处理系统包括计算机,该计算机包括电源子系统和至少一个I/O子系统。对在I/O子系统中出现错误做出确定。利用电源子系统,访问包括在I/O子系统中的集成电路中的寄存器,以在I/O子系统处于错误状态时诊断错误。

【技术实现步骤摘要】

本专利技术一般涉及一种改进的数据处理系统,并尤其涉及一种利用数据处理系统的电源子系统来诊断并从错误中恢复的方法、系统和产品。更确切地说,本专利技术涉及利用数据处理系统的电源子系统来诊断并从I/O子系统错误中恢复。
技术介绍
在计算机系统中,可出现很多不同种类的错误。由于存储在该计算机系统中帮助诊断的信息(如某些寄存器的内容)由该错误而导致不能被访问,所以这些错误中的一些难以诊断并修复。尤其是输入/输出(I/O)适配器错误,若没有专门的调试软件,则可能难以诊断,并且,可能难以在制造者的位置远程地再现该错误。难以诊断I/O错误是由于平面布线造成的。可以有超过十个PCI装置,并且几乎不可能将问题隔离到一个适配器。在很多情况中,一旦一个PCI装置引起错误,将从其它PCI设备引起一些副作用错误。目前,难以排除在客户位置处的重大故障。当前的一个途径是运行操作系统转储(dump),以及希望返回到制造者处来找到并排除该问题。为了正确的诊断I/O错误,I/O芯片的扩展寄存器信息是必要的。我们必须能够收集该扩展寄存器信息,以在故障时诊断每个装置的状态。因此,存在对用于利用数据处理系统的电源子系统诊断并从I/O子系统错误恢复的方法、系统、以及产品的需要。
技术实现思路
披露了一种利用计算机系统的电源子系统来诊断并从I/O子系统错误中恢复的方法、系统、以及计算机程序产品。数据处理系统包括计算机系统和硬件管理计算机系统。计算机系统的电源子系统包括电源子系统的电源内的JTAG引擎。通过JTAG/I2C总线,将JTAG引擎耦接到I/O子系统中的多个不同的集成电路。在JTAG引擎内从计算机系统外部的硬件管理计算机系统接收命令。该命令指定将要利用指定的一个集成电路来执行的操作。JTAG引擎运行这样的命令,该命令利用指定的集成电路来执行指定的操作。随后,将该操作的结果从该电源返回到硬件管理计算机系统,用于分析。可利用该操作的结果来诊断并纠正错误。一旦出现I/O错误,可使用本专利技术来得到扩展寄存器信息,以在故障时诊断每个装置的状态。在下面的书面详细描述中,本专利技术上面的以及另外的目的、特点和优点将变得清晰。附图说明在所附的权利要求中阐明了本专利技术的新颖的特点、确信的特征。然而,当结合附图阅读时,通过参考下面对演示性实施例的详细描述,将最好地理解本专利技术自身以及其使用的优选模式、进一步目的和优点,附图中。图1为根据本专利技术,可实现本专利技术的数据处理系统的方框图;图2为根据本专利技术,图1的I/O子系统和电源子系统的更详细的方框图;图3a描述了根据本专利技术的显示硬件管理控制台的高级流程图,该硬件管理控制台向电源子系统传送命令,以利用该电源子系统诊断并从错误中恢复;图3b显示了根据本专利技术的描述包括在电源子系统内的电源控制器的高级流程图,该电源控制器处理命令,以诊断并从错误中恢复;图3c为根据本专利技术,描述了显示包括在电源子系统内的电源的高级流程图,其运行命令以从I/O子系统的集成电路读取或写入到该I/O子系统的集成电路;以及图4为根据本专利技术,显示了命令的分组定义的方框图,其中数据处理系统的电源子系统利用该命令以诊断并从I/O子系统的错误中恢复。具体实施例方式通过参照附图,可以更好地理解本专利技术的优选实施例和它的优点,相同的标记用于附图的相同及对应的部分。披露了利用计算机的电源子系统来诊断并从I/O子系统错误中恢复的方法、系统、以及计算机程序产品。将计算机耦接到与该计算机分离的硬件管理计算机系统。计算机的电源子系统包括电源控制器,其耦接到一个或更多电源,其中每个I/O抽屉(drawer)中放置一个电源。每个电源包括处理器和JTAG引擎。将JTAG引擎耦接到集成电路,该集成电路为I/O子系统的一部分。例如,将JTAG引擎耦接到使用JTAG/I2C总线的I/O抽屉中的每个PCI-PCI桥和每个EADS芯片。当I/O抽屉中出现错误时,JTAG引擎可访问任何使用JTAG/I2C总线的EADS或PCI-PCI桥芯片内的寄存器。当出现错误时,硬件管理计算机传送命令到电源控制器,该电源控制器将该命令转发到由该命令指定的I/O抽屉中的电源。随后,I/O抽屉中的JTAG引擎通过确定环号(ring number)来确定该命令指定了哪个具体的芯片。该抽屉中的每个芯片与唯一的JTAG环号相关联。电源的JTAG引擎使用该环号来确定将要访问哪个芯片。随后,JTAG引擎读取那个芯片的寄存器的内容,或者写入数据到该寄存器。从该电源将运行该命令的结果返回到电源控制器,随后,该电源控制器将该结果转发回该硬件管理计算机。随后,该硬件管理计算机评估该结果,以诊断并使该I/O抽屉从错误中恢复。图1描述了根据本专利技术,可实现本专利技术的数据处理系统的方框图。数据处理系统100可为对称多处理器(SMP)系统,其包括连接到系统总线106的多个处理器102、103、104、以及105。例如,数据处理系统100可为纽约Armonk的国际商用机器公司的产品IBM RS/6000。数据处理系统100包括中央电子集合体101,其包括逻辑分区硬件。CEC 101包括连接到系统总线106的多个处理器102、103、104、以及105。可替换地,可使用单处理器系统。存储控制器/缓冲存储器108也连接到系统总线106,该存储控制器/缓冲存储器108提供到多个本地存储器160-163的接口。RIO集线器110被连接到系统总线106,并提供到RIO总线112的接口。如所描述的,可将存储控制器/缓冲存储器108和RIO集线器110集成。数据处理系统100是逻辑分区的数据处理系统。因此,数据处理系统100可具有同步运行的多个不同种类的操作系统(或单个操作系统的多个实例)。这些多操作系统中的每个可具有在其中运行的任意数目的软件程序。数据处理系统100被逻辑分区,使得可与PCI I/O适配器耦接的不同的PCI插槽,如插槽120、121、以及127-130、图形适配器148、以及硬盘适配器149,可分别分配到不同的逻辑分区。此情况中,图形适配器148为显示装置(未示出)提供连接,而硬盘适配器149提供连接以控制硬盘150。因此,例如,假设将数据处理系统100划分为三个逻辑分区P1、P2和P3。将插槽120、121、以及127-130、图形适配器148、以及硬盘适配器149中的每个、主机处理器102-105中的每个、以及本地存储器160-163中的每个分配到所述三个分区中的一个。描述了两个I/O抽屉202和204。本领域的技术人员可知晓,数据处理系统100可包括任意数目的I/O抽屉。I/O抽屉202包括RIO至PCI桥114,以及如下所述耦接到RIO至PCI桥114的装置。如下所述,I/O抽屉204包括RIO至PCI桥140,以及耦接到RIO至PCI桥140的装置。RIO至PCI桥114被连接到RIO总线112,并提供到PCI总线117和PCI总线118的接口。RIO至PCI桥114包括一个或更多PCI主桥(PHB),如PHB115和PHB 116。将每个PHB通过PCI总线耦接到PCI至PCI桥。例如,将PHB 115通过PCI总线117耦接到PCI至PCI桥119。将PHB 116通过PCI总线118耦接到PCI至PCI桥126。将每个PCI至本文档来自技高网...

【技术保护点】
一种数据处理系统中的方法,用于诊断错误,所述数据处理系统包括计算机,该计算机包括电源子系统和至少一个I/O子系统,所述方法包括以下步骤:确定在所述至少一个I/O子系统中出现错误;以及利用所述电源子系统,访问包括在所述I/O子 系统中的集成电路中的寄存器,以在所述I/O子系统处于错误状态时诊断所述错误。

【技术特征摘要】
US 2003-12-10 10/733,9491.一种数据处理系统中的方法,用于诊断错误,所述数据处理系统包括计算机,该计算机包括电源子系统和至少一个I/O子系统,所述方法包括以下步骤确定在所述至少一个I/O子系统中出现错误;以及利用所述电源子系统,访问包括在所述I/O子系统中的集成电路中的寄存器,以在所述I/O子系统处于错误状态时诊断所述错误。2.根据权利要求1的方法,其特征在于,所述数据处理系统包括耦接到所述计算机的硬件管理计算机系统,该方法还包括将所述硬件管理计算机系统耦接到包括在所述计算机中的中央电子集合体;以及由所述硬件管理计算机系统访问所述电源子系统。3.根据权利要求1的方法,还包括在所述电源子系统中,包括电源控制器和至少一个电源;以及所述电源位于所述至少一个I/O子系统中。4.根据权利要求3的方法,还包括在所述至少一个电源中,包括处理器和JTAG处理引擎。5.根据权利要求4的方法,还包括所述至少一个I/O子系统内包括I/O适配器,该I/O适配器耦接到第一集成电路和耦接到所述第一集成电路的第二集成电路;以及将所述第一和第二集成电路耦接到所述处理引擎。6.根据权利要求5的方法,还包括利用JTAG/I2C总线,将所述第一和第二集成电路耦接到所述JTAG处理引擎。7.根据权利要求1的方法,其特征在于,所述数据处理系统包括耦接到所述计算机的硬件管理计算机系统,该方法还包括将所述硬件管理计算机系统耦接到包括在所述计算机中的中央电子集合体;以及将命令从所述硬件管理计算机系统传送到所述电源子系统,以访问所述至少一个I/O子系统。8.根据权利要求7的方法,还包括在包括于所述I/O子系统内的电源中接收所述命令;在所述电源内执行所述命令;以及当所述I/O子系统处于错误状态时,响应于执行所述命令,由所述电源访问包括在所述I/O子系统中的集成电路。9.根据权利要求7的方法,还包括所述电源子系统中,包括至少一个电源,所述电源位于所述至少一个I/O子系统中;所述至少一个电源中包括JTAG引擎;所述至少一个I/O子系统内包括I/O适配器,该I/O适配器耦接到第一集成电路和耦接到所述第一集成电路的第二集成电路;利用JTAG/I2C总线,将所述第一和第二集成电路耦接到所述JTAG引擎;将所述命令从所述硬件管理计算机系统发送到所述电源,以访问所述至少一个I/O子系统;在所述JTAG引擎内接收所述命令;以及响应于所述JTAG引擎处理所述命令,由所述JTAG引擎访问所述第一或第二集成电路。10.根据权利要求9的方法,还包括读取包括在所述第一或第二集成电路内的寄存器的内容。11.根据权利要求9的方法,还包括写入数据以存储到包括于所述第一或第二集成电路中的寄存器。12.根据权利要求9的方法,还包括将唯一的JTAG环号与所述第一和第二集成电路相关联;以及利用与所述第一和第二集成电路相关联的JTAG环号,确定将要访问所述第一或第二集成电路。13.一种数据处理系统,用于诊断错误,所述数据处理系统包括计算机,该计算机包括电源子系统和至少一个I/O子系统,所述系统包括所述计算机包括CPU运行代码,其用于确定在所述至少一个I/O子系统中...

【专利技术属性】
技术研发人员:彼得JL范吉亚路易斯G罗德里格斯史蒂文冯格维博尔彼得A温德林
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1