一种存储网络中光纤链路故障监控方法及系统技术方案

技术编号:27266413 阅读:20 留言:0更新日期:2021-02-06 11:30
本申请公开一种存储网络中光纤链路故障监控方法及系统。所述方法包括生成SAN网络拓扑,建立业务主机、光纤交换机和SAN存储设备的业务关联关系并在SAN网络拓扑中展示,并增加光纤交换机端口CRC指标监控;当存储网络光纤链路出现故障时,通过对业务主机的表征告警匹配SAN网络拓扑,定位故障链路中的光纤交换机;结合预警分析策略对光纤交换机端口CRC指标监控采集的CRC校验信息进行分析,快速定位故障点。采用本申请技术方案能够自动排查定位故障点和故障原因,以达到缩小故障定位的时效性。以达到缩小故障定位的时效性。以达到缩小故障定位的时效性。

【技术实现步骤摘要】
一种存储网络中光纤链路故障监控方法及系统


[0001]本申请涉及通信
,尤其涉及一种存储网络中光纤链路故障监控方法及系统。

技术介绍

[0002]光纤交换机是一种高速的网络传输中继设备,又叫做光纤通道交换机、SAN交换机,它较普通交换机而言,采用了光纤电缆作为传输介质。光纤传输的优点是速度快、抗干扰能力强。光纤交换机主要有两种,一是用来连接存储的FC交换机。另一种是以太网交换机,端口是光纤接口的,和普通的电接口的外观一样,但接口类型不同。
[0003]在存储网络中,交换机传输的是计算设备与存储设备或存储设备之间的数据,使用的是FC协议,由此存储交换机传输的数据有效载荷更多效率更高,但是对丢包、延时和抖动非常敏感,不支持数据包乱序,偶发的一个错包都可能导致全网的问题。
[0004]在存储设备运维中,故障频率最高是光纤链路,目前判断光纤链路丢包、延时、抖动,多采用通过登录光纤交换机,用命令方式查看后人工进行判别。
[0005]在存储网络中发生光纤链路故障时,一般会导致业务端报错,如服务器端性能低下等情况。而这种情况一般由于光纤线路老化、光纤模块或者光纤口故障等情况导致,很多情况下,这类故障并不触发光纤交换机告警,导致了故障排除非常困难。
[0006]这种判别方式需要人员具备足够的经验,并且受当前存储网络和光纤链路结构影响,仅能实现部分故障的模糊判别,且实时性较差,这就需要提出一套高效的故障分析方法,以确保在光纤链路出现故障时,可以及时进行故障发现和判断。

技术实现思路

>[0007]本申请提供了一种存储网络中光纤链路故障监控方法,包括:生成SAN网络拓扑,建立业务主机、光纤交换机和SAN存储设备的业务关联关系并在SAN网络拓扑中展示,并增加光纤交换机端口CRC指标监控;当存储网络光纤链路出现故障时,通过对业务主机的表征告警匹配SAN网络拓扑,定位故障链路中的光纤交换机;结合预警分析策略对光纤交换机端口CRC指标监控采集的CRC校验信息进行分析,快速定位故障点。
[0008]如上所述的存储网络中光纤链路故障监控方法,其中,在存储监控系统中生成SAN网络拓扑,具体包括:采用RAID技术规划SAN存储,将SAN存储空间整体分配后指定一个逻辑单元号,形成一个逻辑磁盘,使用LUN mapping、LUN masking和Zone技术管制业务主机的访问;通过对SAN存储设备的信息采集,根据SAN存储设备端口连接的光纤模块WWN的信息进行匹配关联,实现SAN网络拓扑的自动生成,在SAN网络拓扑中展示SAN网络设备、光纤交换机与业务主机结合的关联关系。
[0009]如上所述的存储网络中光纤链路故障监控方法,其中,使用光纤交换机的ZONE功能将连接在SAN网络中的业务主机和SAN存储设备逻辑上划到不同的区域内,使得不同区域中的设备相互间不能被光纤链路网络直接访问,实现网络中的设备之间的相互隔离。
[0010]如上所述的存储网络中光纤链路故障监控方法,其中,对SAN存储设备进行监控,收集到存储LUN、LUN masking或LUN mapping以及存储的HBA卡端口信息;在光纤交换机端收集光纤端口的WWN号、对端设备WWN号、ZONE信息;在主机端收集主机的HBA卡端口信息,建立从业务主机到存储LUN的完整链路拓扑。
[0011]如上所述的存储网络中光纤链路故障监控方法,其中,在存储监控系统中利用命令行采集或光纤交换机管控接口,新增光纤交换机端口CRC指标监控。
[0012]如上所述的存储网络中光纤链路故障监控方法,其中,在新增对光纤交换机端口CRC指标的监控时,还包括结合常见的故障类型及厂商提供的建议,制定指标联动场景策略,并形成CRC校验预警阈值。
[0013]如上所述的存储网络中光纤链路故障监控方法,其中,根据厂商的建议和之前问题处理所积累的经验进行初始CRC校验预警阈值的持续优化设定。
[0014]如上所述的存储网络中光纤链路故障监控方法,其中,在光纤链路发生状态变更之前,光纤线路的性能数据已经出现变化,根据出现的CRC校验错误、链接失败、信号丢失和信号不同步特征组合,初步判断光纤链路的故障类型,并主动发出预警。
[0015]如上所述的存储网络中光纤链路故障监控方法,其中,在通过业务关联和SAN网络拓扑分析后,将设备间的排查具体到设备端口到设备端口间的排查分析,并根据生成的CRC校验告警,快速定位故障点。
[0016]本申请还提供一种存储网络中光纤链路故障监控系统,所述光纤链路故障监控系统执行上述任一项所述的光纤链路故障监控方法。
[0017]本申请实现的有益效果如下:本申请通过生成SAN网络拓扑,通过业务问题快速定位故障点设备,并利用监控工具实时采集故障点设备的CRC 校验信息,通过CRC校验值联动分析功能自动排查定位故障点和故障原因,以达到缩小故障定位的时效性。
附图说明
[0018]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0019]图1是本申请实施例一提供的一种存储网络中光纤链路故障监控的方法流程图;图2是建立业务主机、光纤交换机和SAN存储设备的业务关联关系图。
具体实施方式
[0020]下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]实施例一本申请实施例一提供一种存储网络中光纤链路故障监控分析方法,如图1所示,包括:步骤110、生成SAN网络拓扑,建立业务主机、光纤交换机和SAN存储设备的业务关联关系并在SAN网络拓扑中展示,并增加光纤交换机端口CRC指标监控;本申请实施例中,光纤链路故障分析系统通过采集业务主机、光纤交换机和SAN存储设备中的数据生成SAN网络拓扑;具体地,采用RAID技术规划SAN(Storage Area Network,存储区域网络)存储,通过RAID组合后的磁盘不再能看到单独的磁盘信息,而是变成了一个巨大的存储空间;因此在RAID技术将此存储空间整体分配,被指定一个LUN(逻辑单元号)后,成为了一个“逻辑”磁盘,供接驳的计算机使用;在配置了对应的SAN存储后,业务服务器只要看到存储的控制系统,就有可能使用存储的磁盘资源,但是存储不可能只为某一个服务器来使用,所以它必须管制主机使用某部分磁盘资源,因此实现这种管制的主要技术有:LUN mapping,LUN masking和Zone;其中LUN masking,LUN mapping都是在存储端进行配置,LUN masking通过将LUN与主机端的HBA卡的WWN号绑定,与主机HBA卡建立一对一或本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种存储网络中光纤链路故障监控方法,其特征在于,包括:生成SAN网络拓扑,建立业务主机、光纤交换机和SAN存储设备的业务关联关系并在SAN网络拓扑中展示,并增加光纤交换机端口CRC指标监控;当存储网络光纤链路出现故障时,通过对业务主机的表征告警匹配SAN网络拓扑,定位故障链路中的光纤交换机;结合预警分析策略对光纤交换机端口CRC指标监控采集的CRC校验信息进行分析,快速定位故障点。2.如权利要求1所述的存储网络中光纤链路故障监控方法,其特征在于,在存储监控系统中生成SAN网络拓扑,具体包括:采用RAID技术规划SAN存储,将SAN存储空间整体分配后指定一个逻辑单元号,形成一个逻辑磁盘,使用LUN mapping、LUN masking和Zone技术管制业务主机的访问;通过对SAN存储设备的信息采集,根据SAN存储设备端口连接的光纤模块WWN的信息进行匹配关联,实现SAN网络拓扑的自动生成,在SAN网络拓扑中展示SAN网络设备、光纤交换机与业务主机结合的关联关系。3.如权利要求2所述的存储网络中光纤链路故障监控方法,其特征在于,使用光纤交换机的ZONE功能将连接在SAN网络中的业务主机和SAN存储设备逻辑上划到不同的区域内,使得不同区域中的设备相互间不能被光纤链路网络直接访问,实现网络中的设备之间的相互隔离。4.如权利要求3所述的存储网络中光纤链路故障监控方法,其特征在于,对SAN存储设备进行监控,收集到存储LUN、LUN masking或LUN ...

【专利技术属性】
技术研发人员:韩凤祥
申请(专利权)人:睿至科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1