一种链路故障修复方法、系统及相关组件技术方案

技术编号:31697163 阅读:11 留言:0更新日期:2022-01-01 10:57
本申请公开了一种链路故障修复方法、系统、装置及计算机可读存储介质,该链路故障修复方法包括:当磁盘阵列中任一磁盘存在单链路异常,确定单链路异常对应的目标控制器及目标PCIe端口;通过目标控制器执行当前修复等级的修复操作,若当前修复等级的修复操作未使单链路恢复正常,判断当前修复等级是否为最后一个修复等级;若否,按修复等级从低到高的顺序将当前修复等级的下一修复等级确定为当前修复等级,并执行通过目标控制器执行当前修复等级的修复操作的步骤;若是,生成故障报警信号。本申请能够准确定位故障源,提高修复效率,降低了对技术服务响应的时效性要求,提升了磁盘阵列的正常运行可靠性和可用度。列的正常运行可靠性和可用度。列的正常运行可靠性和可用度。

【技术实现步骤摘要】
一种链路故障修复方法、系统及相关组件


[0001]本申请涉及服务器领域,特别涉及一种链路故障修复方法、系统及相关组件。

技术介绍

[0002]参照图1所示,磁盘阵列一般以控制器1+1冗余配置及IO卡冗余配置,并采用双端口SAS(Serial Attached SCSI,串行连接SCSI)HDD(Hard Disk Drive,硬盘驱动器)/SSD(Solid State Disk,固态硬盘)或双端口NVMe SSD(Non

Volatile Memory Express Solid

State Disk,非易失性内存主机接口固态硬盘)。服务器向磁盘阵列的NVMe SSD写入数据,通过控制器0或控制器1把数据写入到同一个NVMe SSD的地址空间,当任意一条链路故障,能保证业务IO不受影响。现有技术方案中,当检测到某一条路径故障,需要立刻报警,以更换故障器件,由于很难定位该路径上哪一个环节出现故障,因此,一般是采用对该链路上存在的FRU模块,如控制器、IO卡、NVMe SSD、线缆等依次进行更换的修复方案,故障修复时间长,效率低。
[0003]因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。

技术实现思路

[0004]本申请的目的是提供一种链路故障修复方法、系统、装置及计算机可读存储介质,能够准确定位故障源,提高修复效率,降低了对技术服务响应的时效性要求,提升了磁盘阵列的正常运行可靠性和可用度。
[0005]为解决上述技术问题,本申请提供了一种链路故障修复方法,包括:
[0006]当磁盘阵列中任一磁盘存在单链路异常,确定所述单链路异常对应的目标控制器及目标PCIe端口,所述目标PCIe端口为所述目标控制器中的PCIe Switch上连接所述磁盘的PCIe端口;
[0007]通过所述目标控制器执行当前修复等级的修复操作,若当前修复等级的修复操作未使所述单链路恢复正常,判断当前修复等级是否为最后一个修复等级;
[0008]若否,按修复等级从低到高的顺序将当前修复等级的下一修复等级确定为当前修复等级,并执行所述通过所述目标控制器执行当前修复等级的修复操作的步骤;
[0009]若是,生成故障报警信号。
[0010]可选的,按修复等级从低到高的顺序,第一修复等级的修复操作为对所述目标PCIe端口执行先关闭再打开的操作,第二修复等级的修复操作为对所述磁盘的端口执行PCIe复位操作,第三修复等级的修复操作为对所述目标PCIe端口执行先下电再上电的操作。
[0011]可选的,若当前修复等级为所述第一修复等级或所述第二修复等级,所述通过所述目标控制器执行当前修复等级的修复操作之后,该链路故障修复方法还包括:
[0012]控制所述目标PCIe端口与所述磁盘的端口进行retraining协商,若所述
retraining协商成功,则判定所述第一修复等级对应的修复操作或所述第二修复等级对应的修复操作使所述单链路恢复正常,若所述retraining协商失败,则判定所述第一修复等级对应的修复操作或所述第二修复等级对应的修复操作未使所述单链路恢复正常。
[0013]可选的,若当前修复等级为所述第三修复等级,所述通过所述目标控制器执行当前修复等级的修复操作之后,该链路故障修复方法还包括:
[0014]控制所述目标PCIe端口与所述磁盘的端口进行物理层重协商,若所述物理层重协商成功,则判定所述第三修复等级对应的修复操作使所述单链路恢复正常,若所述物理层协商失败,则判定所述第三修复等级对应的修复操作未使所述单链路恢复正常。
[0015]可选的,所述通过所述目标控制器执行当前修复等级的修复操作的同时还包括:
[0016]生成与当前修复等级的修复操作对应的日志。
[0017]可选的,该链路故障修复方法还包括:
[0018]若当前业务状态为空闲状态,执行硬件修复操作。
[0019]可选的,所述硬件修复操作包括:
[0020]暂停所述磁盘的正常链路的读写操作;
[0021]通过所述目标控制器对所述磁盘的异常链路执行先下电再上电的操作,通过所述磁盘阵列中的另一控制器对所述磁盘的所述正常链路执行先下电再上电的操作。
[0022]为解决上述技术问题,本申请还提供了一种链路故障修复系统,包括:
[0023]第一确定模块,用于当磁盘阵列中任一磁盘存在单链路异常,确定所述单链路异常对应的目标控制器及目标PCIe端口,所述目标PCIe端口为所述目标控制器中的PCIe Switch上连接所述磁盘的PCIe端口;
[0024]软件修复模块,用于通过所述目标控制器执行当前修复等级的修复操作,若当前修复等级的修复操作未使所述单链路恢复正常,判断当前修复等级是否为最后一个修复等级,若否,触发第二确定模块,若是,触发报警模块;
[0025]所述第二确定模块,用于按修复等级从低到高的顺序将当前修复等级的下一修复等级确定为当前修复等级,并触发所述软件修复模块;
[0026]所述报警模块,用于生成故障报警信号。
[0027]为解决上述技术问题,本申请还提供了一种链路故障修复装置,包括:
[0028]存储器,用于存储计算机程序;
[0029]处理器,用于执行所述计算机程序时实现如上文任意一项所述的链路故障修复方法的步骤。
[0030]为解决上述技术问题,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上文任意一项所述的链路故障修复方法的步骤。
[0031]本申请提供了一种链路故障修复方法,当磁盘阵列中某一磁盘存在单链路异常,对该单链路上的控制器的PCIe Switch的PCIe端口和磁盘的端口依次进行软件修复,若软件修复成功则无需更换硬件,软件修复均无效后再告警,一方面可以准确定位故障源,提高修复效率,另一方面降低了对技术服务响应的时效性要求,从而提升了磁盘阵列的正常运行可靠性和可用度。本申请还提供了一种链路故障修复系统、装置及计算机可读存储介质,具有和上述链路故障修复方法相同的有益效果。
附图说明
[0032]为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]图1为本申请所提供的一种磁盘阵列的结构示意图;
[0034]图2为本申请所提供的一种链路故障修复方法的步骤流程图;
[0035]图3为本申请所提供的一种链路故障修复系统的结构示意图。
具体实施方式
[0036]本申请的核心是提供一种链路故障修复方法、系统、装置及计算机可读存储介质,能够准确定位故障源,提高修复效率,降低了对技术服务响应的时效性要求,提升了磁盘阵本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种链路故障修复方法,其特征在于,包括:当磁盘阵列中任一磁盘存在单链路异常,确定所述单链路异常对应的目标控制器及目标PCIe端口,所述目标PCIe端口为所述目标控制器中的PCIe Switch上连接所述磁盘的PCIe端口;通过所述目标控制器执行当前修复等级的修复操作,若当前修复等级的修复操作未使所述单链路恢复正常,判断当前修复等级是否为最后一个修复等级;若否,按修复等级从低到高的顺序将当前修复等级的下一修复等级确定为当前修复等级,并执行所述通过所述目标控制器执行当前修复等级的修复操作的步骤;若是,生成故障报警信号。2.根据权利要求1所述的链路故障修复方法,其特征在于,按修复等级从低到高的顺序,第一修复等级的修复操作为对所述目标PCIe端口执行先关闭再打开的操作,第二修复等级的修复操作为对所述磁盘的端口执行PCIe复位操作,第三修复等级的修复操作为对所述目标PCIe端口执行先下电再上电的操作。3.根据权利要求2所述的链路故障修复方法,其特征在于,若当前修复等级为所述第一修复等级或所述第二修复等级,所述通过所述目标控制器执行当前修复等级的修复操作之后,该链路故障修复方法还包括:控制所述目标PCIe端口与所述磁盘的端口进行retraining协商,若所述retraining协商成功,则判定所述第一修复等级对应的修复操作或所述第二修复等级对应的修复操作使所述单链路恢复正常,若所述retraining协商失败,则判定所述第一修复等级对应的修复操作或所述第二修复等级对应的修复操作未使所述单链路恢复正常。4.根据权利要求2所述的链路故障修复方法,其特征在于,若当前修复等级为所述第三修复等级,所述通过所述目标控制器执行当前修复等级的修复操作之后,该链路故障修复方法还包括:控制所述目标PCIe端口与所述磁盘的端口进行物理层重协商,若所述物理层重协商成功,则判定所述第三修复等级对应的修复操作使所述单链路恢复正常,若所述物理层协商失...

【专利技术属性】
技术研发人员:彭云武颜俐君史文举
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1