一种SAS链路故障定位方法、装置、设备及存储介质制造方法及图纸

技术编号:28419265 阅读:22 留言:0更新日期:2021-05-11 18:26
本发明专利技术公开了一种SAS链路故障定位方法、装置、设备及存储介质。所述方法包括:将基板管理控制器设置在中央处理器与SAS链路之间,并利用中央处理器对SAS链路的状态进行监测;若中央处理器检测到SAS链路存在故障,则利用基板管理控制器分别向SAS链路中的RAID板卡和硬盘背板发送预设检测信号;利用RAID板卡和硬盘背板分别接收并响应对应的预设检测信号以生成对应的答应信号并返回至基板管理控制器;根据RAID板卡和硬盘背板返回的答应信号确认基板管理控制器与RAID板卡之间的通路、RAID板卡与硬盘背板之间的通路以及硬盘背板与硬盘之间的通路之一为目标异常通路;利用基板管理控制器将目标异常通路上报至中央处理器。本发明专利技术的方案能自动定位故障,节省人力和时间。

【技术实现步骤摘要】
一种SAS链路故障定位方法、装置、设备及存储介质
本专利技术涉及服务器
,尤其涉及一种SAS链路故障定位方法、装置、设备及存储介质。
技术介绍
在服务器/存储系统中,数据存储占着重要地位。SAS(SerialAttachedSCSI)是传统SCSI硬盘的串行版本,承载的是SCSI协议,主要针对企业级、服务器的应用。中央处理器(CPU)访问存储系统时主要是对SAS链路的访问,而SAS链路通常包括RAID板卡,线缆,背板,硬盘等部分。CPU通过访问RAID来获取硬盘数据,而RAID可以通过连接背板/线缆连接硬盘;假如SAS链路的故障时,因整个SAS链路包含了RAID板卡、背板、线缆、硬盘,如果需要检修需要具体定位出现故障位置才能准确维修。目前,对SAS链路的故障分析无法在线检测,完全依赖操作人员进行测量,此种故障分析方式需要保留故障现场环境,操作人员由使用示波器或信号分析仪通过链路上芯片和接口的信号测试进行逐一排查,检测时间较长,业务会持续中断。此外,现有SAS链路故障分析方式还过渡依赖操作人员的经验,假如维护人员无法准确定位故障时,可能造成问题的定位是错误的;当故障定位无法定位到FRU单元(FieldReplaceUnit,现场可更换单元)时,通常会采用更换整个SAS链路造成不必要的浪费。
技术实现思路
有鉴于此,有必要针对以上技术问题,提供能够自动对SAS链路故障点进行定位分析的一种SAS链路故障定位方法、装置、设备及存储介质。根据本专利技术的第一方面,提供了一种SAS链路故障定位方法,所述方法包括:将基板管理控制器设置在中央处理器与SAS链路之间,并利用中央处理器对SAS链路的状态进行监测;若中央处理器检测到SAS链路存在故障,则利用所述基板管理控制器分别向SAS链路中的RAID板卡和硬盘背板发送预设检测信号;利用所述RAID板卡和所述硬盘背板分别接收并响应对应的预设检测信号以生成对应的答应信号并返回至所述基板管理控制器;利用所述基板管理控制器根据所述RAID板卡和所述硬盘背板返回的答应信号确认所述基板管理控制器与RAID板卡之间的通路、RAID板卡与硬盘背板之间的通路以及硬盘背板与硬盘之间的通路之一为目标异常通路;利用所述基板管理控制器将所述目标异常通路上报至中央处理器。在其中一个实施例中,所述利用所述基板管理控制器分别向SAS链路中的RAID板卡和硬盘背板发送预设检测信号的步骤包括:利用所述基板管理控制器向所述RAID板卡发送第一预设检测信号;若所述基板管理控制器与RAID板卡之间的通路正常,则利用所述基板管理控制器向所述硬盘背板发送第二预设检测信号。在其中一个实施例中,所述利用所述RAID板卡和所述硬盘背板分别接收并响应对应的预设检测信号以生成对应的答应信号并返回至所述基板管理控制器的步骤包括:若所述RAID板卡接收所述第一预设检测信号,则基于预设答应规则生成第一答应信号,并将所述第一答应信号返回至所述基板管理控制器;若所述硬盘背板接收所述第二预设检测信号,则基于预设答应规则生成第二答应信号,并将所述第二答应信号返回至所述基板管理控制器。在其中一个实施例中,所述利用所述基板管理控制器根据所述RAID板卡和所述硬盘背板返回的答应信号确认所述基板管理控制器与RAID板卡之间的通路、RAID板卡与硬盘背板之间的通路以及硬盘背板与硬盘之间的通路之一为异常通路的步骤包括:利用所述基板管理控制器判断所述第一答应信号与所述第一预设检测信号是否匹配,以及发出所述第一预设检测信号与接收所述第一答应信号之间的第一时间间隔是否小于等于第一预设值;若所述第一答应信号与所述第一预设检测信号匹配,且所述第一时间间隔小于等于第一预设值,则确认所述基板管理控制器与RAID板卡之间的通路正常;若所述第一答应信号与所述第一预设检测信号不匹配,则确认所述基板管理控制器与RAID板卡之间的通路为异常通路;若述所述基板管理控制器与RAID板卡之间的通路正常,则利用所述基板管理控制器判断所述第二答应信号与所述第二预设检测信号是否匹配,以及发出所述第二预设检测信号与接收所述第二答应信号之间的第二时间间隔是否小于等于第二预设值;若所述第二答应信号与所述第二预设检测信号匹配,且所述第二时间间隔小于等于第二预设值,则确认所述RAID板卡与硬盘背板之间的通路正常;若所述第二答应信号与所述第二预设检测信号不匹配,则确认所述RAID板卡与硬盘背板之间通路异常。在其中一个实施例中,所述方法还包括:若所述第一答应信号与所述第一预设检测信号匹配,且所述第一时间间隔大于第一预设值,则确认所述基板管理控制器与RAID板卡之间的通路超时。在其中一个实施例中,所方法还包括:若所述第二答应信号与所述第二预设检测信号匹配,且所述第二时间间隔大于第二预设值,则确认所述RAID板卡与硬盘背板之间的通路超时。在其中一个实施例中,所述预设检测信号预设数据或预设占空比方波信号,所述预设答应规则为数据加密或信号翻转。根据本专利技术的第二方面,提供了一种SAS链路故障定位装置,所述装置包括:监测模块,用于将基板管理控制器设置在中央处理器与SAS链路之间,并利用中央处理器对SAS链路的状态进行监测;检测信号发送模块,用于在中央处理器检测到SAS链路存在故障时,则利用所述基板管理控制器分别向SAS链路中的RAID板卡和硬盘背板发送预设检测信号;答应信号响应模块,用于利用所述RAID板卡和所述硬盘背板分别接收并响应对应的预设检测信号以生成对应的答应信号并返回至所述基板管理控制器;异常通路确定模块,用于利用所述基板管理控制器根据所述RAID板卡和所述硬盘背板返回的答应信号确认所述基板管理控制器与RAID板卡之间的通路、RAID板卡与硬盘背板之间的通路以及硬盘背板与硬盘之间的通路之一为目标异常通路;异常上报模块,用于利用所述基板管理控制器将所述目标异常通路上报至中央处理器。根据本专利技术的第三方面,还提供了一种计算机设备,该计算机设备包括:至少一个处理器;以及存储器,存储器存储有可在处理器上运行的计算机程序,处理器执行程序时执行前述的SAS链路故障定位方法。根据本专利技术的第四方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时执行前述的SAS链路故障定位方法。上述一种SAS链路故障定位方法,通过将基板管理控制器设置在中央处理器与SAS链路之间,当中央处理器检测到SAS链路存在故障,则利用基板管理控制器分别向SAS链路中的RAID板卡和硬盘背板发送预设检测信号;利用RAID板卡和硬盘背板分别接收并响应对应的预设检测信号以生成对应的答应信号并返回至基板管理控制器,进而根据RAID板卡和硬盘背板返回的答应信号确认基板管理控制器与RAID板卡之间的通路、RAID板卡与硬盘背板之间的通路以及硬盘背板与硬盘之间的通本文档来自技高网...

【技术保护点】
1.一种SAS链路故障定位方法,其特征在于,所述方法包括:/n将基板管理控制器设置在中央处理器与SAS链路之间,并利用中央处理器对SAS链路的状态进行监测;/n若中央处理器检测到SAS链路存在故障,则利用所述基板管理控制器分别向SAS链路中的RAID板卡和硬盘背板发送预设检测信号;/n利用所述RAID板卡和所述硬盘背板分别接收并响应对应的预设检测信号以生成对应的答应信号并返回至所述基板管理控制器;/n利用所述基板管理控制器根据所述RAID板卡和所述硬盘背板返回的答应信号确认所述基板管理控制器与RAID板卡之间的通路、RAID板卡与硬盘背板之间的通路以及硬盘背板与硬盘之间的通路之一为目标异常通路;/n利用所述基板管理控制器将所述目标异常通路上报至中央处理器。/n

【技术特征摘要】
1.一种SAS链路故障定位方法,其特征在于,所述方法包括:
将基板管理控制器设置在中央处理器与SAS链路之间,并利用中央处理器对SAS链路的状态进行监测;
若中央处理器检测到SAS链路存在故障,则利用所述基板管理控制器分别向SAS链路中的RAID板卡和硬盘背板发送预设检测信号;
利用所述RAID板卡和所述硬盘背板分别接收并响应对应的预设检测信号以生成对应的答应信号并返回至所述基板管理控制器;
利用所述基板管理控制器根据所述RAID板卡和所述硬盘背板返回的答应信号确认所述基板管理控制器与RAID板卡之间的通路、RAID板卡与硬盘背板之间的通路以及硬盘背板与硬盘之间的通路之一为目标异常通路;
利用所述基板管理控制器将所述目标异常通路上报至中央处理器。


2.根据权利要求1所述的方法,其特征在于,所述利用所述基板管理控制器分别向SAS链路中的RAID板卡和硬盘背板发送预设检测信号的步骤包括:
利用所述基板管理控制器向所述RAID板卡发送第一预设检测信号;
若所述基板管理控制器与RAID板卡之间的通路正常,则利用所述基板管理控制器向所述硬盘背板发送第二预设检测信号。


3.根据权利要求2所述的方法,其特征在于,所述利用所述RAID板卡和所述硬盘背板分别接收并响应对应的预设检测信号以生成对应的答应信号并返回至所述基板管理控制器的步骤包括:
若所述RAID板卡接收所述第一预设检测信号,则基于预设答应规则生成第一答应信号,并将所述第一答应信号返回至所述基板管理控制器;
若所述硬盘背板接收所述第二预设检测信号,则基于预设答应规则生成第二答应信号,并将所述第二答应信号返回至所述基板管理控制器。


4.根据权利要求3所述的方法,其特征在于,所述利用所述基板管理控制器根据所述RAID板卡和所述硬盘背板返回的答应信号确认所述基板管理控制器与RAID板卡之间的通路、RAID板卡与硬盘背板之间的通路以及硬盘背板与硬盘之间的通路之一为异常通路的步骤包括:
利用所述基板管理控制器判断所述第一答应信号与所述第一预设检测信号是否匹配,以及发出所述第一预设检测信号与接收所述第一答应信号之间的第一时间间隔是否小于等于第一预设值;
若所述第一答应信号与所述第一预设检测信号匹配,且所述第一时间间隔小于等于第一预设值,则确认所述基板管理控制器与RAID板卡之间的通路正常;
若所述第一答应信号与所述第一预设检测信号不匹配,则确认所述基板管理控制器与RAID板卡之间的通路为异常通路;
若述所述基板管理控制...

【专利技术属性】
技术研发人员:倪志杰
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1