一种PCIE设备故障处理方法及服务器技术

技术编号:41477207 阅读:35 留言:0更新日期:2024-05-30 14:28
一种PCIE设备故障处理方法,包括:获取目标PCI E设备的误码信息,所述目标PCIE设备为发生故障的PCIE设备;确定所述误码信息指示的误码类型为不可修正的错误;停止与所述目标PCIE设备相关的业务;对所述目标PCIE设备进行下电/上电复位;对目标PCIE设备的相关资源进行重加载,恢复所述目标PCIE设备上的业务。使得在线恢复PCIE设备故障的过程中,不会导致服务器下电,保证了服务器上执行的业务的连续性,增加了服务器产品的可靠性。

【技术实现步骤摘要】

本申请涉及服务器,尤其涉及一种pcie设备故障处理方法及服务器。


技术介绍

1、高速串行计算机扩展总线标准(peripheral component interconnect express,pcie)设备在服务器上具有广泛的应用场景。比如,在服务器中部署的光纤通道(host busadapter,hba)卡、磁盘阵列(redundant arrays of independent disks,raid)卡、非易失性快速存储(nonvolatile memory express,nvme)盘、图形处理器(graphics processingunit,gpu)等都通过pcie链路与中央处理器(central processing unit,cpu)或桥片链接。其中,pcie链路的高可靠性是业务连续执行的关键。


技术实现思路

1、本申请实施例提供了一种pcie设备故障处理方法及服务器。使得在线恢复pcie设备故障的过程中,不会导致服务器下电,保证了服务器上执行的业务的连续性,增加了服务器产品的可靠性。

<本文档来自技高网...

【技术保护点】

1.一种高速串行计算机扩展总线标准设备故障处理方法,其特征在于,应用于服务器,所述服务器包括高速串行计算机扩展总线标准PCIE设备,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述确定所述误码信息指示的误码类型为不可修正的错误,包括:

3.根据权利要求1或2所述的方法,其特征在于,在确定所述误码信息指示的误码类型为不可修正的错误以后,所述方法还包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述获取目标PCIE设备的误码信息,包括:

5.根据权利要求1-4任一项所述的方法,其特征在于,所述获取目标PCIE设备的误码...

【技术特征摘要】

1.一种高速串行计算机扩展总线标准设备故障处理方法,其特征在于,应用于服务器,所述服务器包括高速串行计算机扩展总线标准pcie设备,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述确定所述误码信息指示的误码类型为不可修正的错误,包括:

3.根据权利要求1或2所述的方法,其特征在于,在确定所述误码信息指示的误码类型为不可修正的错误以后,所述方法还包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述获取目标pcie设备的误码信息,...

【专利技术属性】
技术研发人员:谷飞扬张梁伟
申请(专利权)人:超聚变数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1