Purley平台服务器的PCIE故障定位方法、装置、设备及介质制造方法及图纸

技术编号:22363846 阅读:11 留言:0更新日期:2019-10-23 04:36
本申请公开了一种Purley平台服务器的PCIE故障定位方法、装置、设备及介质,该方法包括:监测PCIE是否发生故障;若监测到所述PCIE发生故障,则获取与PCIE故障相关的寄存器数据;其中,所述寄存器数据为能够反映所述PCIE故障的位置信息的数据;利用所述寄存器数据对所述PCIE故障进行定位。本申请在PCIE出现故障时,是利用与PCIE故障相关的寄存器数据进行故障定位的。由于BIOS的故障信息上报功能出现异常时,并不影响与PCIE故障相关的寄存器数据的正常获取,所以通过上述技术方案,可以使得即便在BIOS的故障信息上报功能出现异常时,依然可以通过能够正常获取到的与BIOS故障相关的寄存器数据对PCIE故障进行准确定位。

PCIe fault location method, device, device and media of Purley platform server

【技术实现步骤摘要】
Purley平台服务器的PCIE故障定位方法、装置、设备及介质
本申请涉及计算机领域,特别涉及一种Purley平台服务器的PCIE故障定位方法、装置、设备及介质。
技术介绍
当前,随着信息技术的飞速发展,以及云计算和物联网的落地,用户对服务器的可靠性和信息处理能力有了更高的要求。与传统服务器相比,基于Purley平台的新一代服务器在计算性能和可靠性上与传统服务器相比具有很大的优势,并在对实时性、可靠性和可用性要求苛刻的领域中应用越来越广泛。同时基于Purley平台的新一代服务器在PCIE设备(PCIE,即PeripheralComponentInterconnectExpress,高速串行计算机扩展总线标准)应用上更加多样化,PCIE设备发生故障的原因更加复杂,分析更加困难。在PCIE设备发生故障时,目前BMC(即BaseboardManagementController,基板管理控制器)通过BIOS(即BasicInputOutputSystem,基本输入输出系统)上报的故障信息来定位故障发生的位置,但在BIOS的故障信息上报功能出现异常时,如遇到系统HardHang的情况致使BIOS无法上报故障信息,或者BIOS虽然可以上报故障信息但故障信息和BMC资产信息无法对应的时候,BMC将无法准确地定位出PCIE设备故障的位置。
技术实现思路
有鉴于此,本申请的目的在于提供一种Purley平台服务器的PCIE故障定位方法、装置、设备及介质,能够在BIOS的故障信息上报功能出现异常时依然能够实现对PCIE故障的准确定位。其具体方案如下:第一方面,本申请公开了一种Purley平台服务器的PCIE故障定位方法,应用于BMC,包括:监测PCIE是否发生故障;若监测到所述PCIE发生故障,则获取与PCIE故障相关的寄存器数据;其中,所述寄存器数据为能够反映所述PCIE故障的位置信息的数据;利用所述寄存器数据对所述PCIE故障进行定位。可选的,所述获取与PCIE故障相关的寄存器数据,包括:通过PECI协议读取CPU的MCi_ADDR寄存器数据。可选的,所述利用所述寄存器数据对所述PCIE故障进行定位,包括:判断所述MCi_ADDR寄存器数据是否位于Purley平台服务器的当前系统地址空间内;如果是,则根据PCIE增强配置机制对所述PCIE故障进行定位。可选的,所述判断所述MCi_ADDR寄存器数据是否位于Purley平台服务器的当前系统地址空间内之前,还包括:获取BIOS在Purley平台服务器开机启动时通过IPMI协议传输的所述Purley平台服务器的当前系统地址空间。可选的,所述根据PCIE增强配置机制对所述PCIE故障进行定位,包括:利用PCIE增强配置机制解析得到所述PCIE的Bus/Device/Function数据;利用所述Bus/Device/Function数据确定所述PCIE故障的位置信息。可选的,所述获取与PCIE故障相关的寄存器数据之前,还包括:监视BIOS的故障信息上报功能状态;判断所述故障信息上报功能状态与预设状态是否相符;如果是,则在监测到所述PCIE发生故障时,启动所述获取与PCIE故障相关的寄存器数据的步骤;如果否,则在监测到所述PCIE发生故障时,获取BIOS上报的相应的故障信息,并根据所述故障信息对PCIE故障进行定位。可选的,所述预设状态包括:BIOS无法上报故障信息,和,BIOS上报的故障信息与BMC资产信息不对应。第二方面,本申请公开了一种Purley平台服务器的PCIE故障定位装置,应用于BMC,包括:故障监测模块,用于监测PCIE是否发生故障;数据获取模块,用于当监测到所述PCIE发生故障,则获取与PCIE故障相关的寄存器数据;其中,所述寄存器数据为能够反映所述PCIE故障的位置信息的数据;故障定位模块,用于利用所述寄存器数据对所述PCIE故障进行定位。第三方面,本申请公开了一种Purley平台服务器的PCIE故障定位设备,包括:存储器,用于保存计算机程序;处理器,用于执行所述计算机程序,以实现前述的PCIE故障定位方法的步骤。第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述的PCIE故障定位方法的步骤。可见,本申请在监测到PCIE出现故障时,获取与PCIE故障相关的寄存器数据,所述寄存器数据为能够反映PCIE故障的位置信息的数据,然后利用上述寄存器数据对PCIE故障进行定位。也即,本申请在PCIE出现故障时,是利用与PCIE故障相关的寄存器数据进行故障定位的。由于BIOS的故障信息上报功能出现异常时,并不影响与PCIE故障相关的寄存器数据的正常获取,所以通过本申请的上述技术方案,可以使得即便在BIOS的故障信息上报功能出现异常时,依然可以通过能够正常获取到的与BIOS故障相关的寄存器数据对PCIE故障进行准确定位。由此可见,本申请实现了在BIOS的故障信息上报功能出现异常时依然能够对PCIE故障进行准确定位的目的。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例公开的一种Purley平台服务器的PCIE故障定位方法流程图;图2为本申请实施例公开的一种具体的Purley平台服务器的PCIE故障定位方法流程图;图3为PCIE增强配置机制示意图;图4为本申请实施例公开的一种具体的Purley平台服务器的PCIE故障定位方法流程图;图5为本申请实施例公开的一种具体的Purley平台服务器的PCIE故障定位方法流程图;图6为本申请实施例公开的一种Purley平台服务器的PCIE故障定位装置结构示意图;图7为本申请实施例公开的一种Purley平台服务器的PCIE故障定位设备结构图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在PCIE设备发生故障时,目前BMC通过BIOS上报的故障信息来定位故障发生的位置,但在BIOS的故障信息上报功能出现异常时,如遇到系统HardHang的情况致使BIOS无法上报故障信息,或者BIOS虽然可以上报故障信息但故障信息和BMC资产信息无法对应的时候,BMC将无法准确地定位出PCIE设备故障的位置。为此,本申请提供了一种PCIE故障定位方案,能够克服上述技术问题,能够在BIOS的故障信息上报功能出现异常时依然能够实现对PCIE故障的准确定位。参见图1所示,本申请实施例公开了一种Purley平台服务器的PCIE故障定位方法,应用于BMC,包括:步骤S11:监测PCIE是否发生故障。本实施例中,可以实时监测PCIE是否发生故障,以确保能够及时发现PCIE故障。当然,为了减少监测进程所消耗的计算机资源,本实施例也可以按照预设的监测周期,定本文档来自技高网...

【技术保护点】
1.一种Purley平台服务器的PCIE故障定位方法,其特征在于,应用于BMC,包括:监测PCIE是否发生故障;若监测到所述PCIE发生故障,则获取与PCIE故障相关的寄存器数据;其中,所述寄存器数据为能够反映所述PCIE故障的位置信息的数据;利用所述寄存器数据对所述PCIE故障进行定位。

【技术特征摘要】
1.一种Purley平台服务器的PCIE故障定位方法,其特征在于,应用于BMC,包括:监测PCIE是否发生故障;若监测到所述PCIE发生故障,则获取与PCIE故障相关的寄存器数据;其中,所述寄存器数据为能够反映所述PCIE故障的位置信息的数据;利用所述寄存器数据对所述PCIE故障进行定位。2.根据权利要求1所述的PCIE故障定位方法,其特征在于,所述获取与PCIE故障相关的寄存器数据,包括:通过PECI协议读取CPU的MCi_ADDR寄存器数据。3.根据权利要求2所述的PCIE故障定位方法,其特征在于,所述利用所述寄存器数据对所述PCIE故障进行定位,包括:判断所述MCi_ADDR寄存器数据是否位于Purley平台服务器的当前系统地址空间内;如果是,则根据PCIE增强配置机制对所述PCIE故障进行定位。4.根据权利要求3所述的PCIE故障定位方法,其特征在于,所述判断所述MCi_ADDR寄存器数据是否位于Purley平台服务器的当前系统地址空间内之前,还包括:获取BIOS在Purley平台服务器开机启动时通过IPMI协议传输的所述Purley平台服务器的当前系统地址空间。5.根据权利要求3所述的PCIE故障定位方法,其特征在于,所述根据PCIE增强配置机制对所述PCIE故障进行定位,包括:利用PCIE增强配置机制解析得到所述PCIE的Bus/Device/Function数据;利用所述Bus/Device/Function数据确定所述PCIE故障的...

【专利技术属性】
技术研发人员:袁传博
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1