扩展芯片管理方法、装置、存储介质及电子设备制造方法及图纸

技术编号:37666782 阅读:7 留言:0更新日期:2023-05-26 04:25
本申请实施例提供了一种扩展芯片管理方法、装置、存储介质及电子设备,其中,该方法包括:获取每个扩展芯片的监控信号,并通过监控信号判断扩展芯片是否发生故障;在扩展芯片发生故障的情况下,将扩展芯片确定为故障芯片,并确定监控故障芯片的正常扩展芯片;将正常扩展芯片的预留下行端口从关闭状态更新为启动状态,其中,预留下行端口用于连接与故障芯片通信连接的设备;更新正常扩展芯片的端口信息,基于更新后的端口信息控制正常扩展芯片和故障芯片连接的设备与正常扩展芯片通信连接。通过本申请,解决了扩展芯片出现故障时导致一定时间的业务中断的问题,进而达到了扩展芯片出现故障时业务不会中断的效果。出现故障时业务不会中断的效果。出现故障时业务不会中断的效果。

【技术实现步骤摘要】
扩展芯片管理方法、装置、存储介质及电子设备


[0001]本申请实施例涉及计算机领域,具体而言,涉及一种扩展芯片管理方法、装置、存储介质及电子设备。

技术介绍

[0002]JBOD(Just Bundle Of Disks,磁盘簇)产品与带有计算单元的主机通过高速线缆连接,当用户需要访问JBOD中的数据时,主机通过高速线缆从JBOD中提取相关数据并上传到云端供用户使用。在较大数据量存储在JBOD的场景中,每个扩展芯片客观存在最大的扩展硬盘数量,受限于扩展芯片可扩展端口的数量,同时又要考虑产品的高可靠性,往往一台JBOD需要多个相互冗余备份的扩展芯片连接所有的硬盘,每个扩展芯片可以负责一部分硬盘数量。主机端通过多条线缆与JBOD中多个扩展芯片相连实现主机访问JBOD中的所有硬盘。
[0003]然而,当其中一个扩展芯片发生故障时,主机端无法通过这个扩展芯片访问到其下面连接的硬盘,相关技术中,若JBOD中与主机端互连的扩展芯片只有单个,没有冗余备份,当此扩展芯片发生故障时,整个JBOD中的所有硬盘处于无法访问状态,数据短时间内丢失,业务中断。需要人为对机器发命令调整,由于操作人员不能全时间段监控所有机器,存在故障设备下的硬盘长时间处于无法访问状态的问题。
[0004]若同一个JBOD中存在相互冗余的扩展芯片,通过上层软件的监控算法监控故障芯片。冗余扩展芯片连接的硬盘需要是支持双端口SAS(Serial Attached SCSI,串行连接)硬盘,其中一个SAS端口异常,可以使用另一个SAS端口继续工作。由于无法做到自动切换配置参数,需要人为远程操作更改配置,存在一定时间的业务中断情况。

技术实现思路

[0005]本申请实施例提供了一种扩展芯片管理方法、装置、存储介质及电子设备,以至少解决相关技术中扩展芯片出现故障时导致一定时间的业务中断的问题。
[0006]根据本申请的一个实施例,提供了一种扩展芯片管理方法,包括:获取每个扩展芯片的监控信号,并通过监控信号判断扩展芯片是否发生故障,其中,扩展芯片用于实现主机端访问磁盘簇,磁盘簇包含多个磁盘,每个扩展芯片与预设数量的设备通信连接,设备为磁盘或下一级扩展芯片;在扩展芯片发生故障的情况下,将扩展芯片确定为故障芯片,并确定监控故障芯片的正常扩展芯片,其中,故障芯片为无法与设备通信连接的扩展芯片,正常扩展芯片与故障芯片为同一级扩展芯片;将正常扩展芯片的预留下行端口从关闭状态更新为启动状态,其中,预留下行端口用于连接与故障芯片通信连接的设备;更新正常扩展芯片的端口信息,基于更新后的端口信息控制正常扩展芯片和故障芯片连接的设备与正常扩展芯片通信连接。
[0007]在一个示例性实施例中,可选地,在基于更新后的端口信息控制正常扩展芯片和故障芯片连接的设备与正常扩展芯片通信连接之后,该方法还包括:向主机端发送故障信
息,其中,故障信息用于通知用户故障芯片的位置信息;接收用户对故障芯片的修复指令,通过修复指令和故障信息对故障芯片进行修复。
[0008]在一个示例性实施例中,可选地,在通过修复指令和故障信息对故障芯片进行修复之后,该方法还包括:获取修复后的故障芯片的监控信号,并通过监控信号判断修复后的故障芯片是否正常工作,其中,正常工作表征修复后的故障芯片恢复与设备通信连接的功能;在修复后的故障芯片正常工作的情况下,将预留下行端口从启动状态更新为关闭状态;更新正常扩展芯片的端口信息,基于更新后的端口信息控制正常扩展芯片连接的设备与正常扩展芯片通信连接。
[0009]在一个示例性实施例中,可选地,获取每个扩展芯片的监控信号,并通过监控信号判断扩展芯片是否发生故障包括:获取每个扩展芯片的工作状态信息,并判断工作状态信息是否为预设信息,其中,预设信息是以下之一:预设心跳信号和预设寄存器的返回值;在工作状态信息是预设信息的情况下,确定扩展芯片未发生故障;在工作状态信息不是预设信息的情况下,确定扩展芯片发生故障。
[0010]在一个示例性实施例中,可选地,扩展芯片包含多种级别,与主机端通信连接的扩展芯片属于第一级扩展芯片,与第N级扩展芯片通信连接的扩展芯片属于第N+1级扩展芯片,第N+1级扩展芯片与预设数量的磁盘连接,其中,N为正整数,N大于等于1。
[0011]在一个示例性实施例中,可选地,属于同一级的扩展芯片之间设置有监控线路,同一级的扩展芯片通过监控线路获取所监控的扩展芯片的监控信号。
[0012]在一个示例性实施例中,可选地,将正常扩展芯片的预留下行端口从关闭状态更新为启动状态包括:获取正常扩展芯片的配置文件;将配置文件中的端口配置参数进行修改,得到更新后的端口配置参数,其中,端口配置参数用于配置每个端口管理磁盘的信息;通过更新后的端口配置参数将预留下行端口从关闭状态更新为启动状态。
[0013]根据本申请的另一个实施例,提供了一种扩展芯片管理装置,包括:获取单元,用于获取每个扩展芯片的监控信号,并通过监控信号判断扩展芯片是否发生故障,其中,扩展芯片用于实现主机端访问磁盘簇,磁盘簇包含多个磁盘,每个扩展芯片与预设数量的设备通信连接,设备为磁盘或下一级扩展芯片;确定单元,用于在扩展芯片发生故障的情况下,将扩展芯片确定为故障芯片,并确定监控故障芯片的正常扩展芯片,其中,故障芯片为无法与设备通信连接的扩展芯片,正常扩展芯片与故障芯片为同一级扩展芯片;第一更新单元,用于将正常扩展芯片的预留下行端口从关闭状态更新为启动状态,其中,预留下行端口用于连接与故障芯片通信连接的设备;第二更新单元,用于更新正常扩展芯片的端口信息,基于更新后的端口信息控制正常扩展芯片和故障芯片连接的设备与正常扩展芯片通信连接。
[0014]根据本申请的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
[0015]根据本申请的又一个实施例,还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
[0016]通过本申请,由于在同级的扩展芯片间设置了监控线路,使同级扩展芯片间通过监控信号相互监控,在发现故障芯片时,通过更新监控故障芯片的正常扩展芯片的端口配
置,使正常扩展芯片通过预留下行端口与故障芯片连接的设备通信连接,从而保障主机端时刻能够与故障芯片连接的设备通信连接,因此,可以解决扩展芯片出现故障时导致一定时间的业务中断的问题,达到扩展芯片出现故障时业务不会中断的效果。
附图说明
[0017]图1是本申请实施例的一种扩展芯片管理方法的移动终端的硬件结构框图;
[0018]图2是根据本申请实施例的扩展芯片管理方法的流程图;
[0019]图3是根据本申请实施例的主机端与磁盘簇之间的连接示意图;
[0020]图4是根据本申请实施例的扩展芯片管理装置的结构框图。
具体实施方式
[0021]下文中将本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种扩展芯片管理方法,其特征在于,包括:获取每个扩展芯片的监控信号,并通过所述监控信号判断所述扩展芯片是否发生故障,其中,所述扩展芯片用于实现主机端访问磁盘簇,所述磁盘簇包含多个磁盘,每个扩展芯片与预设数量的设备通信连接,所述设备为磁盘或下一级扩展芯片;在所述扩展芯片发生故障的情况下,将所述扩展芯片确定为故障芯片,并确定监控所述故障芯片的正常扩展芯片,其中,所述故障芯片为无法与设备通信连接的扩展芯片,所述正常扩展芯片与所述故障芯片为同一级扩展芯片;将所述正常扩展芯片的预留下行端口从关闭状态更新为启动状态,其中,所述预留下行端口用于连接与所述故障芯片通信连接的设备;更新所述正常扩展芯片的端口信息,基于更新后的端口信息控制所述正常扩展芯片和所述故障芯片连接的设备与所述正常扩展芯片通信连接。2.根据权利要求1所述的方法,其特征在于,在基于更新后的端口信息控制所述正常扩展芯片和所述故障芯片连接的设备与所述正常扩展芯片通信连接之后,所述方法还包括:向所述主机端发送故障信息,其中,所述故障信息用于通知用户所述故障芯片的位置信息;接收所述用户对所述故障芯片的修复指令,通过所述修复指令和所述故障信息对所述故障芯片进行修复。3.根据权利要求2所述的方法,其特征在于,在通过所述修复指令和所述故障信息对所述故障芯片进行修复之后,所述方法还包括:获取修复后的故障芯片的监控信号,并通过所述监控信号判断所述修复后的故障芯片是否正常工作,其中,正常工作表征所述修复后的故障芯片恢复与设备通信连接的功能;在所述修复后的故障芯片正常工作的情况下,将所述预留下行端口从启动状态更新为关闭状态;更新所述正常扩展芯片的端口信息,基于更新后的端口信息控制所述正常扩展芯片连接的设备与所述正常扩展芯片通信连接。4.根据权利要求1所述的方法,其特征在于,获取每个扩展芯片的监控信号,并通过所述监控信号判断所述扩展芯片是否发生故障包括:获取每个扩展芯片的工作状态信息,并判断所述工作状态信息是否为预设信息,其中,所述预设信息是以下之一:预设心跳信号和预设寄存器的返回值;在所述工作状态信息是所述预设信息的情况下,确定所述扩展芯片未发生故障;在所述工作状态信息不是所述预设信息的情况下,确定所述扩展芯片发生...

【专利技术属性】
技术研发人员:唐传贞
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1