一种服务器、主板及一种服务器的外接设备故障定位方法技术

技术编号:37986315 阅读:5 留言:0更新日期:2023-06-30 10:01
本申请公开了一种服务器、主板及一种服务器的外接设备故障定位方法,应用于故障处理技术领域,包括:将信息获取指令发送至各块扩展卡,以使得任一扩展卡的信息获取装置在接收该指令之后,确定出该扩展卡上的每一个插槽各自连接的CPU端口信息,并按照扩展卡插槽与物理位置之间的对应关系,确定出各端口信息各自对应的物理位置并反馈至主板;接收各块扩展卡的反馈数据并记录;当监测到任一外接设备故障时,基于该外接设备的CPU端口信息以及记录下的反馈数据,得到该外接设备的物理位置;输出携带有发生故障的外接设备的物理位置的提示信息。应用本申请的方案,可以方便有效地进行服务器外接设备的故障定位,也就有利于提高故障处理效率。障处理效率。障处理效率。

【技术实现步骤摘要】
一种服务器、主板及一种服务器的外接设备故障定位方法


[0001]本专利技术涉及故障处理
,特别是涉及一种服务器、主板及一种服务器的外接设备故障定位方法。

技术介绍

[0002]随着服务器技术的日新月异,对于服务器外接设备提出了故障精准定位的要求。
[0003]目前的一些服务器系统配置十分复杂,存在着不同的设备搭配情况,设备的连接方式也具有很多种。例如在最新的Eagle Stream平台中,CPU就支持很多的PCIe(Peripheral Component Interconnect express,高速串行计算机扩展总线标准)资源,为了支持灵活的设备搭配,一般都是通过线缆实现转接,因此,对于服务器后窗固定的一个物理位置而言,在不同场合中,便可能出现不同的接法。
[0004]例如图1a为目前的Eagle Stream平台中一种2路服务器的结构示意图,其中的每个CPU(Central Processing Unit,中央处理器)最大可以支持5个PCIe X16的Root Port,即每个CPU最大支持5个PCIe X16的端口,因此在2路服务器上最大可以支持10个PCIe X16的PCIe设备。可参阅图1b,为一种具体场合中2U服务器的8卡配置示意图,图1b中支持8个PCIe X16的配置,以CPU0的PCIe端口1为例,该端口通过线缆固定到了图1b的左下角位置,也即第1列的底部位置,在图1b中标记为CPU0_PE1。目前的方案中,工作人员可以通过日志发现CPU0_PE1所连接的外接设备故障,但是CPU0_PE1这一端口,当前具体是设置在图1b的8个位置中的哪个位置,工作人员并不知道,因为在不同的场合中存在不同的接线方式,即左下角位置处未必始终是CPU0_PE1这一端口。此时,工作人员只能通过打开服务器机箱,观察线缆走线,才能得知当前场合中的CPU0_PE1是位于第1列的底部位置,又或者是查阅服务器安装时的安装记录,来确定CPU0_PE1对应的是哪个物理位置,但是实际应用中该安装记录未必有进行妥善保存,还可能存在记录错误、线缆安装之后进行过调整修改等情况,导致在目前情况下,如果出现了服务器的外接设备故障,工作人员很难方便、快速地定位出该外接设备在服务器后窗中具体所处的物理位置,也就不利于保障工作人员的故障处理效率。
[0005]综上所述,如何方便、有效地进行服务器外接设备的故障定位,是目前本领域技术人员急需解决的技术问题。

技术实现思路

[0006]本专利技术的目的是提供一种服务器、主板及一种服务器的外接设备故障定位方法,以方便、有效地进行服务器外接设备的故障定位。
[0007]为解决上述技术问题,本专利技术提供如下技术方案:
[0008]一种服务器的外接设备故障定位方法,所述服务器中包括主板以及与所述主板连接的多块扩展卡,所述服务器的外接设备故障定位方法应用于所述主板中,包括:
[0009]将信息获取指令发送至各块所述扩展卡,以使得任意一块扩展卡的信息获取装置在接收到所述信息获取指令之后,确定出该扩展卡上的每一个插槽各自连接的CPU端口的
端口信息,并按照设定的扩展卡插槽与物理位置之间的对应关系,确定出各个所述端口信息各自对应的物理位置并反馈至所述主板;
[0010]接收各块所述扩展卡的反馈数据并记录;
[0011]当监测到任意一块扩展卡所连接的外接设备故障时,基于发生故障的所述外接设备的CPU端口信息以及记录下的各块所述扩展卡的反馈数据,得到发生故障的所述外接设备的物理位置;
[0012]输出携带有发生故障的所述外接设备的物理位置的提示信息。
[0013]优选的,所述主板中设置有N个切换开关、BMC以及处理装置,且均挂载在第一总线下;在默认状态下,所述BMC占用所述第一总线并通过N个所述切换开关分别与N块所述扩展卡通信连接;N为不小于2的正整数;
[0014]相应的,所述将信息获取指令发送至各块所述扩展卡,包括:
[0015]所述处理装置向BMC发送第一申请指令以获取所述第一总线的占用权;
[0016]在获取了占用权之后,所述处理装置通过N个切换开关将信息获取指令依次发送至N块所述扩展卡;
[0017]相应的,所述接收各块所述扩展卡的反馈数据并记录,包括:
[0018]所述处理装置接收N块所述扩展卡的反馈数据并记录,并在记录完毕之后归还所述第一总线的占用权。
[0019]优选的,所述处理装置为PCH,所述第一总线为I2C总线,N个所述切换开关均为支持2个主机1个从机的I2C切换开关。
[0020]优选的,在所设定的扩展卡插槽与物理位置之间的对应关系中,针对任一扩展卡插槽,通过该扩展卡插槽的插槽编号以及与该扩展卡插槽所连接的切换开关的总线地址,设定该扩展卡插槽与物理位置之间的对应关系;或者,通过该扩展卡插槽的插槽编号以及该扩展卡插槽所在的扩展卡的位置信号,设定该扩展卡插槽与物理位置之间的对应关系。
[0021]优选的,每一块扩展卡中的所述信息获取装置均为GPIO扩展装置,在任意一块扩展卡中,该扩展卡中的所述GPIO扩展装置以及该扩展卡中的各个插槽均连接至具有多个切换通道的第一切换电路中,且该扩展卡中的所述第一切换电路与所述主板通信连接。
[0022]优选的,当监测到任意一块扩展卡所连接的外接设备故障时,包括:
[0023]当通过BIOS监测到任意一块扩展卡所连接的外接设备故障时。
[0024]优选的,所述输出携带有发生故障的所述外接设备的物理位置的提示信息,包括:
[0025]将携带有发生故障的所述外接设备的物理位置的提示信息发送至Web页面中进行显示。
[0026]优选的,任意一块扩展卡的信息获取装置在接收到所述信息获取指令之后,确定出该扩展卡上的每一个插槽各自连接的CPU端口的端口信息,包括:
[0027]任意一块扩展卡的信息获取装置在接收到所述信息获取指令之后,基于获取到的该扩展卡的扩展卡ID,识别出该扩展卡上的每一个插槽各自连接的CPU端口的端口信息;
[0028]其中,CPU端口的端口信息包括CPU的ID以及该CPU的端口编号。
[0029]一种主板,所述主板设置于服务器中,并与多块扩展卡连接,所述主板用于执行计算机程序以实现如上述所述的服务器的外接设备故障定位方法的步骤。
[0030]一种服务器,包括如上述所述的主板,以及与所述主板连接的多块扩展卡。
[0031]应用本专利技术实施例所提供的技术方案,通过所输出的携带有发生故障的外接设备的物理位置的提示信息,使得工作人员可以方便、有效地进行服务器外接设备的故障定位。具体的,服务器中包括主板以及与主板连接的多块扩展卡,主板会将信息获取指令发送至各块扩展卡,任意一块扩展卡的信息获取装置在接收到信息获取指令之后,可以确定出该扩展卡上的每一个插槽各自连接的CPU端口的端口信息,也就是说,可以确定出各个扩展卡插槽在电路上是连接了哪个CPU端口,而设定的扩展卡插槽与物本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种服务器的外接设备故障定位方法,其特征在于,所述服务器中包括主板以及与所述主板连接的多块扩展卡,所述服务器的外接设备故障定位方法应用于所述主板中,包括:将信息获取指令发送至各块所述扩展卡,以使得任意一块扩展卡的信息获取装置在接收到所述信息获取指令之后,确定出该扩展卡上的每一个插槽各自连接的CPU端口的端口信息,并按照设定的扩展卡插槽与物理位置之间的对应关系,确定出各个所述端口信息各自对应的物理位置并反馈至所述主板;接收各块所述扩展卡的反馈数据并记录;当监测到任意一块扩展卡所连接的外接设备故障时,基于发生故障的所述外接设备的CPU端口信息以及记录下的各块所述扩展卡的反馈数据,得到发生故障的所述外接设备的物理位置;输出携带有发生故障的所述外接设备的物理位置的提示信息。2.根据权利要求1所述的服务器的外接设备故障定位方法,其特征在于,所述主板中设置有N个切换开关、BMC以及处理装置,且均挂载在第一总线下;在默认状态下,所述BMC占用所述第一总线并通过N个所述切换开关分别与N块所述扩展卡通信连接;N为不小于2的正整数;相应的,所述将信息获取指令发送至各块所述扩展卡,包括:所述处理装置向BMC发送第一申请指令以获取所述第一总线的占用权;在获取了占用权之后,所述处理装置通过N个切换开关将信息获取指令依次发送至N块所述扩展卡;相应的,所述接收各块所述扩展卡的反馈数据并记录,包括:所述处理装置接收N块所述扩展卡的反馈数据并记录,并在记录完毕之后归还所述第一总线的占用权。3.根据权利要求2所述的服务器的外接设备故障定位方法,其特征在于,所述处理装置为PCH,所述第一总线为I2C总线,N个所述切换开关均为支持2个主机1个从机的I2C切换开关。4.根据权利要求2所述的服务器的外接设备故障定位方法,其特征在于,在所设定的扩展卡插槽与物理位置之间的对应关系中,针对任一扩展卡插槽,通过该扩...

【专利技术属性】
技术研发人员:崔亮
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1