【技术实现步骤摘要】
在系统中的错误处置设备中记录错误
本文描述的实施例总体上涉及在系统中的错误处置设备中记录错误。
技术介绍
系统(例如,片上系统(SOC))提供对来自连接设备的错误的记录和处置。在连接到SOC的设备处并且在SOC内不同通信层处的分组传输中可能发生错误,例如,事务层错误、数据链路层错误、物理层错误。错误可以被分类为由硬件处置的可纠正错误以及由设备特定软件和系统软件处置的不可纠正错误,例如,致命错误和非致命错误。系统设计中的可靠性、可用性和可维护性(RAS)要求包括错误收集,即记录和报告错误。需要错误报告来执行平台诊断,以便如果灾难性错误变为强制性的,则识别服务器系统在现场(原位地和远程地)停机的原因,进行崩溃数据收集以及FRU(现场可更换单元)隔离。由于意外的全局功率周期和非预期的热重置事件可能阻碍在可能使系统冻结或受到网络攻击的灾难性错误之后读取错误数据的能力,因此在重置之前和之后新的错误收集方案是必不可少的,以便系统管理程序快速调试并且通过将故障原因隔离并本地化到平台、SOC或芯片组内的各种功能块(IP)内来减少宕机时间。用于Intel服务器的服务器错误报告方案由全局集成错误处置器(GIEH)构成,该GIEH与分布在片上系统(例如,SOC封装的北复合体和南复合体)中的平台控制器中心(PCH)中的多个卫星集成错误处置器(SIEH)耦合。对于例如与基于IntelAtomTM的单片管芯一起使用的u-server错误架构,SOC具有连接到产生错误的各种错误源的单个GIEH。在客户端系统的情况下,SOC依赖于中断定时器子系统(ITSS)IP来进行错误记录方案和报告, ...
【技术保护点】
1.一种错误处置设备,用于记录包括连接到所述错误处置设备的多个设备的计算系统中的错误,其中,所述错误处置设备被配置为:提供错误寄存器组,其中,每个错误寄存器组与多个值中的值相关联,并且其中,将错误传送到所述错误处置设备的所述设备中的每个设备与所述值中的一个值相关联;从连接到所述错误处置设备的所述设备接收错误消息;以及针对接收到的错误消息中的每个接收到的错误消息进行以下操作:确定所述多个值中的与发送所述接收到的错误消息的设备相关联的值;确定与所确定的值相关联的所述错误寄存器组;以及将所述接收到的错误消息记录在所确定的错误寄存器组中。
【技术特征摘要】
2017.12.18 US 15/846,1701.一种错误处置设备,用于记录包括连接到所述错误处置设备的多个设备的计算系统中的错误,其中,所述错误处置设备被配置为:提供错误寄存器组,其中,每个错误寄存器组与多个值中的值相关联,并且其中,将错误传送到所述错误处置设备的所述设备中的每个设备与所述值中的一个值相关联;从连接到所述错误处置设备的所述设备接收错误消息;以及针对接收到的错误消息中的每个接收到的错误消息进行以下操作:确定所述多个值中的与发送所述接收到的错误消息的设备相关联的值;确定与所确定的值相关联的所述错误寄存器组;以及将所述接收到的错误消息记录在所确定的错误寄存器组中。2.根据权利要求1所述的错误处置设备,其中,所述设备的端口标识符映射到所述值,其中,确定发送所述接收到的错误消息的设备的所述值是:确定映射到发送所述接收到的错误消息的设备的所述端口标识符的所述值。3.根据权利要求1所述的错误处置设备,与全局错误处置设备通信,还包括:系统事件控制寄存器,其针对多个严重度级别中的每个严重度级别指示具有所述严重度级别的所述接收到的错误消息是被掩蔽还是不被掩蔽;其中,所述错误处置设备还用于:在所述错误寄存器组中指示在所述接收到的错误消息中指示的错误的严重度;以及响应于所述系统事件控制寄存器指示针对所述接收到的错误消息,在所述错误寄存器组中指示的所述严重度级别不被掩蔽,而将所述接收到的错误消息转发到所述全局错误处置设备。4.根据权利要求1所述的错误处置设备,其中,连接到所述错误处置设备的所述设备中的至少一个设备实现多个设备功能,其中,所述错误寄存器组中存在针对实现多个设备功能的所述设备中的每个设备的所述设备功能中的每个设备功能的一个寄存器组,其中,针对实现多个设备功能的所述至少一个设备的所述寄存器组指示所述设备和所述设备的功能。5.根据权利要求1所述的错误处置设备,其中,每个错误寄存器组包括针对错误严重度级别的错误严重度状态寄存器和针对所述错误严重度状态寄存器中的每个错误严重度状态寄存器的掩码寄存器,其中,将所述接收到的错误消息记录在所确定的寄存器组中包括:确定针对在所述接收到的错误消息中指示的严重度级别的所述掩码寄存器是指示所述严重度级别被掩蔽还是不被掩蔽,其中,响应于针对所述严重度级别的所述掩码寄存器指示不被掩蔽,所述接收到的错误消息被记录,并且其中,记录所述接收到的错误消息还包括:在针对所述接收到的错误消息中的所述严重度级别的所述错误严重度状态寄存器中指示所述接收到的错误消息中的所述严重度级别,其中,响应于针对所述接收到的错误消息的所述严重度级别的所述掩码寄存器指示被掩蔽,所述接收到的错误消息不被记录在所述错误寄存器组中。6.根据权利要求5所述的错误处置设备,其中,针对其存在错误严重度状态寄存器的所述错误严重度级别包括可纠正的错误、致命不可纠正的错误以及非致命不可纠正的错误。7.根据权利要求1所述的错误处置设备,与全局错误处置设备通信,其中,所述错误寄存器组包括全局错误寄存器和本地错误寄存器,其中,所述错误处置设备还用于:确定所述接收到的错误消息是否指示本地错误消息,其中,响应于所述接收到的错误消息指示所述本地错误消息,所确定的错误寄存器组在所述本地错误寄存器中,并且其中,响应于所述接收到的错误消息不指示本地错误消息,所确定的错误寄存器组在所述全局错误寄存器中;以及将记录在所述全局错误寄存器中的错误消息转发到所述全局错误处置设备。8.根据权利要求7所述的错误处置设备,其中,所述本地错误寄存器提供预先分配给来自所述错误处置设备和耦合到所述错误处置设备的至少一个本地结构的内部错误的寄存器组,其中,所述错误处置设备还用于:将记录在所述本地错误寄存器中的寄存器组中的所述接收到的错误消息记录在所述全局错误寄存器中的寄存器组中;以及将记录在所述本地错误寄存器和所述全局错误寄存器中的寄存器组中的所述接收到的错误消息转发到所述全局错误处置设备。9.根据权利要求8所述的错误处置设备,其中,针对所述内部错误和来自所述至少一个本地结构的错误的接收到的错误消息被记录在所述全局错误寄存器中的一个寄存器组中。10.根据权利要求7所述的错误处置设备,其中,所述全局错误寄存器记录来自耦合到所述错误处置设备的传统设备和外围组件互连交换(PCIe)设备的错误,其中,所述本地错误寄存器记录来自所述错误处置设备的内部错误和来自耦合到所述错误处置设备的至少一个本地结构的错误,并且其中,所述全局错误寄存器中的与所述值中的一个值相关联的一个错误寄存器组记录所述内部错误和来自所述至少一个本地结构的错误。11.根据权利要求1所述的错误处置设备,其中,所述计算机系统包括所述计算机系统中的多个附加错误处置设备和全局错误处置设备,所述多个附加错误处置设备记录所述计算机系统中的与由所述错误处置设备处置的不同的设备的错误,所述全局错误处置设备用于记录来自所述错误处置设备和所述附加错误处置设备的接收到的错误消息,其中,所述附加错误处置设备和所述错误处置设备被编程有唯一标识符以区分所述错误处置设备,其中,所述错误处置设备还用于:将记录在所述错误寄存器组中的接收到的错误消息转发到包括所述错误处置设备的所述唯一标识符的所述全局错误处置设备。12.根据权利要求1所述的错误处置设备,其中,所述错误处置设备还用于:当所述错误处置设备不提供到全局错误处置设备的直接接口时,通过到附加错误处置设备的主接口将记录在所述错误寄存器组中的接收到的错误消息转发到所述全局错误处置设备,其中,接收到所述接收到的错误消息的所述附加错误处置设备将所述接收到的错误消息转发到所述全局错误处置设备;以及当所述错误处置设备提供到所述全局错误处置设备的直接接口时,将记录在所述错误寄存器组中的接收到的错误消息转发到所述全局错误处置设备。13.根据权利要求12所述的错误处置设备,其中,所述错误处置设备还用于:在指向所述全局错误处置设备的主接口上接收错误消息;将指向所述全局错误处置设备的所述接收到的错误消息记录在所述错误寄存器中;以及通过直接接口将所述错误消息转发到所述全局错误处置设备。14.一种系统,包括:处理器;多个设备,其与所述处理器通信;错误处置设备,其用于记录所述系统中的错误,其中,所述错误处置设备被配置为:提供错误寄存器组,其中,每个错误寄存器组与多个值中的值相关联,并且其中,将错误传送到所述错...
【专利技术属性】
技术研发人员:S·拉达克里希南,M·特里维迪,J·托利伊尔,E·A·麦克沙恩,R·W·刘,M·S·纳图,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。