一种通过多CPU节点控制器芯片进行调试的方法和系统技术方案

技术编号:11133023 阅读:120 留言:0更新日期:2015-03-12 03:19
本发明专利技术提供了一种通过多CPU节点控制器芯片进行调试的方法和系统,其中,所述方法包括:收集多CPU节点控制器芯片中各个模块发生的错误;将收集的错误映射成系统事件;根据所述系统事件产生相应的中断信号向CPU节点发送。上述技术方案减少多CPU节点控制器芯片调试时间。

【技术实现步骤摘要】

本专利技术涉及控制器芯片调试领域,尤其涉及一种通过多CPU节点控制器芯片进行调试的方法和系统
技术介绍
高端服务器是一种在网络环境下为客户机提供共享资源(包括查询、存储和计算)的设备,其具有高可靠性、高性能、高吞吐能力和大内存容量等特点,并且具备强大的网络功能和友好的人机界面,是以网络为中心的现代计算环境的关键设备。随着需求的增加,对高端服务器的要求越来越高,高端服务器中CPU的数量也随之增加,用于协调多CPU的节点控制器芯片在高端服务器中的作用越发凸显。由于涉及多个CPU,所述节点控制器芯片对多CPU节点的调试时间相对现有技术对单CPU节点的调试时间有了显著增加,而过多的调试时间无疑会增加高端服务器的研制成本,不利于高端服务器的普及应用。
技术实现思路
本专利技术提供了一种通过多CPU节点控制器芯片进行调试的方法和系统,以解决如何减少多CPU节点控制器芯片调试时间的技术问题。为解决上述技术问题,本专利技术提供了一种通过多中央处理器(CPU)节点控制器芯片进行调试的方法,所述方法包括:收集多CPU节点控制器芯片中各个模块发生的错误;将收集的错误映射成系统事件;根据所述系统事件产生相应的中断信号向CPU节点发送。可选地,所述方法还包括:收集多CPU节点控制器芯片中各个模块发生的错误后,将多CPU节点控制器芯片中各个模块发生的错误映射为相应的错误等级,错误等级包括:可纠正错误(Correctable Errors)、可恢复错误(Recoverable Errors)和不可纠正错误(Fatal Errors);将所述相应的错误等级映射为与该错误等级对应的显示标识并显示。可选地,所述将收集的错误映射成系统事件,包括:在收集的错误中选择需屏蔽的错误;将收集的未被屏蔽的错误映射为系统事件。可选地,所述将收集的未被屏蔽的错误映射为系统事件,包括:设置错误状态寄存器存储收集的错误,其中每个错误对应错误状态寄存器的一位,当要屏蔽错误时,将错误状态寄存器中与被屏蔽错误对应的位置1;未被屏蔽的错误输出至设置的系统事件状态寄存器,系统事件状态寄存器的每一位对应一个未被屏蔽的错误;当事件状态寄存器的位接收到错误时,将该位置位,触发一个或多个系统事件。为解决上述技术问题,本专利技术还提供了一种通过多中央处理器(CPU)节点控制器芯片进行调试的系统,所述系统置于所述多CPU节点控制器芯片内,所述系统包括设置在多CPU节点控制器芯片中各个模块的本地错误获取模块、全局错误处理模块以及中断产生模块,其中本地错误获取模块,用于获取其所在模块发生的错误,并将获取的错误发送至全局错误处理模块;所述全局错误处理模块,用于收集各个本地错误获取模块获取的错误,并将收集的错误映射成系统事件,将所述系统事件发送至所述中断产生模块;所述中断产生模块,用于根据系统事件产生相应的中断信号向CPU节点发送。可选地,所述本地错误获取模块,还用于在收集多CPU节点控制器芯片中各个模块发生的错误后,将多CPU节点控制器芯片中各个模块发生的错误映射为相应的错误等级;将所述相应的错误等级映射为与该错误等级对应的显示标识并显示;所述错误等级包括:可纠正错误(Correctable Errors)、可恢复错误(Recoverable Errors)和不可纠正错误(Fatal Errors)。可选地,所述全局错误处理模块,用于将收集的错误映射成系统事件,包括:在收集的错误中选择需屏蔽的错误,将收集的未被屏蔽的错误映射为系统事件。可选地,所述全局错误处理模块,用于将收集的未被屏蔽的错误映射为系统事件,包括:设置错误状态寄存器存储收集的错误,其中每个错误对应错误状态寄存器的一位,当要屏蔽错误时,将错误状态寄存器中与被屏蔽错误对应的位置1;未被屏蔽的错误输出至设置的系统事件状态寄存器,系统事件状态寄存器的每一位对应一个未被屏蔽的错误;当事件状态寄存器的位接收到错误时,将该位置位,触发一个或多个系统事件。上述技术方案的节点控制器芯片能够快速获取定位错误,减少了多CPU节点控制器芯片的调试时间。附图说明图1为本实施例的通过多CPU节点控制器芯片进行调试的方法流程图;图2为本实施例的通过多CPU节点控制器芯片进行调试的系统组成图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合附图对本专利技术的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。图1为本实施例的通过多CPU节点控制器芯片进行调试的方法流程图。S101收集多CPU节点控制器芯片中各个模块发生的错误;其中,多CPU节点控制器芯片中各个模块包括:存储控制器(Memory Controller,MC)模块、链路层接口(Socket Interface,SI)模块和本地代理(Local Proxy,LP)模块;可选地,在收集多CPU节点控制器芯片中各个模块发生的错误后,将所述各个模块发生的错误映射为相应的错误等级,错误等级包括:可纠正错误(Correctable Errors)、可恢复错误(Recoverable Errors)和不可纠正错误(Fatal Errors);可以根据各个模块的功能为该模块出现的错误定义映射的错误等级;其中,可纠正错误(Correctable Errors),是指硬件可纠正的错误,发生该错误后,出现错误的系统可恢复,且恢复后无信息丢失;如链路CRC错误,可以通过数据链路层的重试来纠正;不可纠正错误(Fatal Errors),是指产生一个硬件不可靠性的错误,需要系统复位来使该硬件恢复到可靠状态;如Cache的不可纠正的tag error、永久的PCI-E链路失败或者QPI失败;相对于可纠正错误,不可纠正错误由于对系统复位,致使错误出现之前的数据和操作会在复位后全部丢失,需要复位后的系统重新进行相应的操作;可恢复错误(Recoverable Errors),除可纠正错误和不可纠正错误之外的错误,该错误发生后导致相应的数据检错事务不可靠,但系统硬件功能仍可继续运行;如ECC错误,其只影响数据检错事务的数据部分;将所述相应的错误等级映射为与该错误等级对应的显示标识并显示,如所述显示标识为带颜色的提示灯,不同的错误等级对应为不同颜色的提示灯,当模块出现错误时,通过提示灯本文档来自技高网...
一种通过多CPU节点控制器芯片进行调试的方法和系统

【技术保护点】
一种通过多中央处理器(CPU)节点控制器芯片进行调试的方法,其特征在于,所述方法包括:收集多CPU节点控制器芯片中各个模块发生的错误;将收集的错误映射成系统事件;根据所述系统事件产生相应的中断信号向CPU节点发送。

【技术特征摘要】
1.一种通过多中央处理器(CPU)节点控制器芯片进行调试的方法,
其特征在于,所述方法包括:
收集多CPU节点控制器芯片中各个模块发生的错误;
将收集的错误映射成系统事件;
根据所述系统事件产生相应的中断信号向CPU节点发送。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
收集多CPU节点控制器芯片中各个模块发生的错误后,将多CPU节点
控制器芯片中各个模块发生的错误映射为相应的错误等级,错误等级包括:
可纠正错误(Correctable Errors)、可恢复错误(Recoverable Errors)
和不可纠正错误(Fatal Errors);
将所述相应的错误等级映射为与该错误等级对应的显示标识并显示。
3.如权利要求1所述的方法,其特征在于,所述将收集的错误映射成
系统事件,包括:
在收集的错误中选择需屏蔽的错误;
将收集的未被屏蔽的错误映射为系统事件。
4.如权利要求3所述的方法,其特征在于,所述将收集的未被屏蔽的
错误映射为系统事件,包括:
设置错误状态寄存器存储收集的错误,其中每个错误对应错误状态寄存
器的一位,当要屏蔽错误时,将错误状态寄存器中与被屏蔽错误对应的位置
1;
未被屏蔽的错误输出至设置的系统事件状态寄存器,系统事件状态寄存
器的每一位对应一个未被屏蔽的错误;当事件状态寄存器的位接收到错误
时,将该位置位,触发一个或多个系统事件。
5.一种通过多中央处理器(CPU)节点控制器芯片进行调试的系统,其
特征在于,所述系统置于所述多CPU节点控制器芯片内,所述系统包括设置

\t在多CPU节点控制器芯片中各个模块的本地错误获...

【专利技术属性】
技术研发人员:王振江
申请(专利权)人:浪潮北京电子信息产业有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1