一种利用黑匣子获取崩溃信息的方法、黑匣子及服务器技术

技术编号:7632505 阅读:215 留言:0更新日期:2012-08-03 20:22
本发明专利技术实施例提供一种利用黑匣子获取崩溃信息的方法、黑匣子及服务器,涉及通信领域,能够在捕获CPU、IOH芯片内部的控制状态寄存器信息的同时也能够捕获其他寄存器的信息。其方法为:通过JTAG联合测试行为组织协议电缆在黑匣子与主控芯片之间建立JTAG链路;通过所述JTAG链路从所述主控芯片中获取第一状态信息,所述第一状态信息包括通用寄存器信息、控制寄存器信息、调试控制寄存器信息。本发明专利技术实施例用于服务器中黑匣子在系统崩溃时读取重要芯片信息。

【技术实现步骤摘要】

本专利技术涉及通信领域,尤其涉及ー种利用黑匣子获取崩溃信息的方法、黑匣子及服务器
技术介绍
目前,服务器一般都具有黑匣子功能,当系统崩溃时,黑匣子能够收集CPU (Central Processing Unit,中央处理器)、I0H(In/0ut Hub,北桥)等重要芯片的信息,即使系统复位,这些信息仍然能够保留,这些信息是助维护人员确定系统故障的原因的重要依据。现有技术中,黑匣子包括捕获模块、存储模块和解析模块,捕获模块在系统崩溃或者死机时能够收集CPU和IOH等主控芯片内的信息然后通过存储模块将这些信息保保存,维护人员通过解析模块就能够读取这些信息。但是,因为现有的黑匣子采用是SMBus (System Management Bus,系统管理总线),捕获模块能够收集的重要芯片的信息非常有限,尤其是对于CPU、IOH芯片内的寄存器信息,只能捕获芯片内部的CSR(Control StatusRegister,控制状态寄存器)寄存器的信息,其他的寄存器信息无法获取,无法为维护人员检测故障提供有力依据。
技术实现思路
本专利技术的实施例提供ー种利用黑匣子获取崩溃信息的方法、黑匣子及服务器,能够在捕获CPU、IOH芯片内部的控制状态寄存器信息的同时也能够捕获其他寄存器的信息。为达到上述目的,本专利技术的实施例采用如下技术方案一方面,提供ー种利用黑匣子获取崩溃信息的方法,包括通过JTAG联合测试行为组织协议电缆在黑匣子与主控芯片之间建立JTAG链路;通过所述JTAG链路从所述主控芯片中获取第一状态信息,所述第一状态信息包括通用寄存器信息、控制寄存器信息、调试控制寄存器信息。另ー方面,提供一种黑匣子,包括JTAG接ロ,用于通过JTAG电缆在黑匣子与主控芯片之间建立JTAG链路;解析模块,用于通过所述JTAG链路从所述主控芯片中获取第一状态信息,所述第一状态信息包括通用寄存器信息、控制寄存器信息、调试控制寄存器信息。另ー方面,还提供一种服务器,包括所述的黑匣子;主控芯片,包括中央处理器、北桥芯片;JTAG电缆,用于在所述黑匣子的与所述主控芯片之间建立JTAG链路。本专利技术的实施例提供ー种利用黑匣子获取崩溃信息的方法、黑匣子及服务器,通过在黑匣子和主控芯片之间建立JTAG链路,使黑匣子能够在捕获主控芯片内部的控制状态寄存器信息的同时也能够捕获其他寄存器的信息。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图I为本专利技术实施例提供的利用黑匣子获取崩溃信息的方法的流程示意图ー;图2为本专利技术实施例提供的利用黑匣子获取崩溃信息的方法的流程示意图ニ ;图3为本专利技术实施例提供的利用黑匣子获取崩溃信息的方法的流程示意图三;图4为本专利技术实施例提供的黑匣子的结构示意图ー;图5为本专利技术实施例提供的黑匣子的结构示意图ニ ;图6为本专利技术实施例提供的服务器的结构示意图。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一本专利技术实施例提供的利用黑匣子获取崩溃信息的方法,如图I所示,包括SlOl、通过JTAG电缆在黑匣子与主控芯片之间建立JTAG链路;S102、通过JTAG链路从主控芯片中获取第一状态信息,第一状态信息包括通用寄存器信息、控制寄存器信息、调试控制寄存器信息。本专利技术的实施例提供的利用黑匣子获取崩溃信息的方法,通过在黑匣子和主控芯片之间建立JTAG链路,使黑匣子能够在捕获主控芯片内部的控制状态寄存器信息的同时也能够捕获其他寄存器的信息。实施例ニ本专利技术实施例提供的利用黑匣子获取崩溃信息的方法,如图2所示,包括S201、通过JTAG电缆与主控芯片建立JTAG链路。具体的,通过JTAG电缆将黑匣子与服务器的CPU和IOH等重要的主控芯片连接起来。S202、通过JTAG链路直接从主控芯片中获取第一状态信息,并存储设备中读取第ニ状态信息。具体的,由于JTAG是ー种国际标准测试协议(IEEE 1149. I兼容),主要用于芯片内部测试。因此,黑匣子可以利用其内部的解析模块直接通过JTAG链路读取服务器的CPU和IOH等重要芯片内部的第一状态信息,该第一状态信息包括通用寄存器(GeneralPurpose Register,GPR)信息、控制寄存器(Control Register,CR)信息、调试控制寄存器 (Debug Control Register, DCR)信息。上述通用寄存器信息、控制寄存器信息、调试控制寄存器信息包括通用寄存器、控制寄存器、调试控制寄存器的ID号、错误码。此外,黑匣子还可以利用其内部的解析模块从存储设备中读取第二状态信息,该第二状态信息是在服务器系统崩溃时由黑匣子内部的捕获模块从CPU和IOH等重要芯片中抓取并且由存储模块保存在存储设备中的状态信息,包括内核信息、进程信息、内存状态信息。当系统崩溃时系统会进行复位,目前的复位方式主要去有两种,基带触发内复位,例如应用层复位、内核层复位、硬件层复位,以及带外触发复位,例如看门狗复位、BMC (Baseboard Management Controller,基板控制器)复位,由不同方式触发复位,捕获模块从CPU和IOH等重要芯片中抓取的状态信息也不同。当由带内触发复位时,第二状态信息中的内核信息包括系统内核异常时的输出信息及异常前的打印内容、内核异常调用栈、内核异常栈内容、内核异常发生时控制状态寄存器信息、内核异常时相应用户态程序调用栈;进程信息包括当前进程的进程名及进程号、当前任务的进程家族关系树;内存状态信息包括系统内存信息、占内存最大的进程的内存占用情况、下发复位的命令以及时间;当由带外触发复位时,内核信息包括内核调用栈和用户态调用栈、基板控制器复位时的内核版本、黑匣子版本及复位原因;进程信息包括中央处理器上运行进程的进程名、进程的ID号;内存状态信息包括系统内存信息,最占内存的进程的内存占用情況。这样,当维护人员在分析服务器系统崩溃的原因时,不但能从存储设备中读取崩溃时保存的有限信息,还可以从JTAG链路随时地直接地读取更多的芯片内部的信息,尤其是对于CPU和IOH内部的寄存器的信息,除了依然能够读取控制状态寄存器的信息外,还可以读取CPU和IOH内部的其余寄存器,例如通用寄存器、控制寄存器、调试控制寄存器等,这样就可以使分析人员获得的信息不再受限于保存模块中的有限信息,使得分析人员可以根据更多的信息更加准确地定位系统崩溃原因。或者,本专利技术实施实施里还提供另ー种获取服务器崩溃信息的方法,如图3所示,包括S301、通过JTAG电缆与主控芯片建立JTAG链路。具体的,通过JTAG电缆将黑匣子与服务器的CPU和IOH等重要的主控芯片连接起来。S302、通过JTAG链路从主控芯片中获取第一状态信息和第二状态信息。具体的,在服务器系统崩本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:郭海涛许利霞赵俊峰
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术