System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种故障处理方法、装置、设备及机器可读存储介质制造方法及图纸_技高网

一种故障处理方法、装置、设备及机器可读存储介质制造方法及图纸

技术编号:40516803 阅读:8 留言:0更新日期:2024-03-01 13:33
本公开提供一种故障处理方法、装置、设备及机器可读存储介质,该方法包括:配置目标设备支持热插拔功能,监听被配置支持热插拔功能的目标设备的故障状态;响应于目标设备故障事件,模拟触发目标设备的热插拔拔出事件,按照预设热插拔下电流程,对目标设备下电;在目标设备下电并达到预设条件后,模拟触发目标设备的热插拔插入事件,按照预设热插拔上电流程,对目标设备上电,并初始化驱动程序和重加载业务。通过本公开的技术方案,以虚拟的热插拔拔出插入事件实现对处于故障中的目标设备重新上电,实现尝试对目标设备的故障恢复,从而自动化地在付出较小性能开销的情况下实现修复大部分PCIE设备故障,对用户及业务的影响较小。

【技术实现步骤摘要】

本公开涉及通信,尤其是涉及一种故障处理方法、装置、设备及机器可读存储介质


技术介绍

1、pcie(peripheral component interconnect express)是一种全双工、差分、端对端、串行高速接口协议,用于连接计算机系统中的内/外部设备与主板上的扩展槽。pcie规范定义了热插拔(hot plug)功能,这意味着可以在计算机系统运行时插入或拔出pcie设备,而无需重新启动系统。热插拔功能使得在不影响系统稳定性和其他设备的情况下,可以方便地添加、替换或移除pcie设备,提高系统的可用性和灵活性。

2、在一种技术方案中,当pcie设备故障时触发系统重启,确定故障pcie设备并将故障pcie设备置为不可用状态。该方案在发生故障时,需要重启系统,重启过程中业务停止,对用户影响大,且重启后直接将故障部件设为不可用,未尝试修复故障。


技术实现思路

1、有鉴于此,本公开提供一种故障处理方法、装置及电子设备、机器可读存储介质,以改善上述pcie故障处理影响大的问题。

2、具体地技术方案如下:

3、本公开提供了一种故障处理方法,应用于服务器,所述方法包括:配置目标pcie设备支持热插拔功能,监听被配置支持热插拔功能的目标pcie设备的故障状态;响应于目标pcie设备故障事件,模拟触发目标pcie设备的热插拔拔出事件,按照预设热插拔下电流程,对目标pcie设备下电;在目标pcie设备下电并达到预设条件后,模拟触发目标pcie设备的热插拔插入事件,按照预设热插拔上电流程,对目标pcie设备上电,并初始化驱动程序和重加载业务。

4、作为一种技术方案,所述响应于目标pcie设备故障事件,模拟触发目标pcie设备的热插拔拔出事件,按照预设热插拔下电流程,对目标pcie设备下电,包括:响应于目标pcie设备故障事件,向bmc发送故障通知,以使bmc通过第一预设通道使能pcie的故障恢复功能,通过cpld模拟热插拔触发拔出按键,并通过第二预设通道将模拟的拔出按键触发事件上送cpu,cpu根据拔出按键触发事件通过第二预设通道向cpld下发关联于目标pcie设备的下电命令,cpld响应于下电命令按照预设下电程序执行目标pcie设备的下电操作;

5、作为一种技术方案,所述cpld响应于下电命令按照预设下电程序执行目标pcie设备的下电操作,包括:配置pe_rst_n为低电平,配置全局复位rst_n,按照目标pcie设备下电时序的要求,通过控制efuse或dc-dc电源使能,停止目标pcie设备的供电。

6、作为一种技术方案,所述在目标pcie设备下电并达到预设条件后,模拟触发目标pcie设备的热插拔插入事件,按照预设热插拔上电流程,对目标pcie设备上电,并初始化驱动程序和重加载业务,包括:在目标pcie设备下电达到预设时长后,通过cpld模拟热插拔触发插入按键,并通过第二预设通道将模拟的插入按键触发事件上送cpu,cpu根据插入出按键触发事件通过第二预设通道向cpld下发关联于目标pcie设备的上电命令,cpld响应于上电命令按照预设上电程序执行目标pcie设备的上电操作。

7、作为一种技术方案,所述cpld响应于上电命令按照预设上电程序执行目标pcie设备的上电操作,包括:按照目标pcie设备上电时序要求,cpld通过efuse或dc-dc向目标pcie设备上电,并配置rst_n解复位,间隔预设时长后配置pe_rst_n高电平。

8、作为一种技术方案,所述在目标pcie设备下电并达到预设条件后,模拟触发目标pcie设备的热插拔插入事件,按照预设热插拔上电流程,对目标pcie设备上电,并初始化驱动程序和重加载业务,包括:通过pcie链路预测目标pcie设备进行link协商,初始化目标pcie设备的驱动,并重新加载关联的业务。

9、作为一种技术方案,所述在目标pcie设备下电并达到预设条件后,模拟触发目标pcie设备的热插拔插入事件,按照预设热插拔上电流程,对目标pcie设备上电,并初始化驱动程序和重加载业务的步骤之后,还包括:检测初始化驱动程序和重加载业务的目标pcie设备的故障状态,若目标pcie设备仍处于故障状态,则执行模拟触发目标pcie设备的热插拔拔出事件,按照预设热插拔下电流程,对目标pcie设备下电,并标记目标pcie设备为不可用状态;响应于被标记为不可用状态的目标pcie设备发生物理拔出并重新插入的事件,检测目标pcie设备被标记的不可用状态是否已被重置,若是,则执行对目标pcie设备的初始化驱动程序和重加载业务的操作。

10、本公开同时提供了一种故障处理装置,应用于服务器,所述装置包括:第一模块,用于配置目标pcie设备支持热插拔功能,监听被配置支持热插拔功能的目标pcie设备的故障状态;第二模块,用于响应于目标pcie设备故障事件,模拟触发目标pcie设备的热插拔拔出事件,按照预设热插拔下电流程,对目标pcie设备下电;第三模块,用于在目标pcie设备下电并达到预设条件后,模拟触发目标pcie设备的热插拔插入事件,按照预设热插拔上电流程,对目标pcie设备上电,并初始化驱动程序和重加载业务。

11、本公开同时提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,处理器执行所述机器可执行指令以实现前述的故障处理方法。

12、本公开同时提供了一种机器可读存储介质,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现前述的故障处理方法。

13、本公开提供的上述技术方案至少带来了以下有益效果:

14、以虚拟的热插拔拔出插入事件实现对处于故障中的目标pcie设备重新上电,实现尝试对目标pcie设备的故障恢复,从而自动化地在付出较小性能开销的情况下实现修复大部分pcie设备故障,对用户及业务的影响较小。

本文档来自技高网...

【技术保护点】

1.一种故障处理方法,其特征在于,应用于服务器,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述响应于目标PCIE设备故障事件,模拟触发目标PCIE设备的热插拔拔出事件,按照预设热插拔下电流程,对目标PCIE设备下电,包括:

3.根据权利要求2所述的方法,其特征在于,所述CPLD响应于下电命令按照预设下电程序执行目标PCIE设备的下电操作,包括:

4.根据权利要求1所述的方法,其特征在于,所述在目标PCIE设备下电并达到预设条件后,模拟触发目标PCIE设备的热插拔插入事件,按照预设热插拔上电流程,对目标PCIE设备上电,并初始化驱动程序和重加载业务,包括:

5.根据权利要求4所述的方法,其特征在于,所述CPLD响应于上电命令按照预设上电程序执行目标PCIE设备的上电操作,包括:

6.根据权利要求4所述的方法,其特征在于,所述在目标PCIE设备下电并达到预设条件后,模拟触发目标PCIE设备的热插拔插入事件,按照预设热插拔上电流程,对目标PCIE设备上电,并初始化驱动程序和重加载业务,包括:

7.根据权利要求1所述的方法,其特征在于,所述在目标PCIE设备下电并达到预设条件后,模拟触发目标PCIE设备的热插拔插入事件,按照预设热插拔上电流程,对目标PCIE设备上电,并初始化驱动程序和重加载业务的步骤之后,还包括:

8.一种故障处理装置,其特征在于,应用于服务器,所述装置包括:

9.一种电子设备,其特征在于,包括:处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令,以实现权利要求1-7任一所述的方法。

10.一种机器可读存储介质,其特征在于,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现权利要求1-7任一所述的方法。

...

【技术特征摘要】

1.一种故障处理方法,其特征在于,应用于服务器,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述响应于目标pcie设备故障事件,模拟触发目标pcie设备的热插拔拔出事件,按照预设热插拔下电流程,对目标pcie设备下电,包括:

3.根据权利要求2所述的方法,其特征在于,所述cpld响应于下电命令按照预设下电程序执行目标pcie设备的下电操作,包括:

4.根据权利要求1所述的方法,其特征在于,所述在目标pcie设备下电并达到预设条件后,模拟触发目标pcie设备的热插拔插入事件,按照预设热插拔上电流程,对目标pcie设备上电,并初始化驱动程序和重加载业务,包括:

5.根据权利要求4所述的方法,其特征在于,所述cpld响应于上电命令按照预设上电程序执行目标pcie设备的上电操作,包括:

6.根据权利要求4所述的方法,其特征在于,所述在目标pcie设备下电并达到预设条件后,模拟...

【专利技术属性】
技术研发人员:黄长寿
申请(专利权)人:新华三技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1