网络异常根因定位方法、装置及系统、计算机存储介质制造方法及图纸

技术编号:27092002 阅读:22 留言:0更新日期:2021-01-25 18:24
本申请公开了一种网络异常根因定位方法、装置及系统、计算机存储介质,属于网络技术领域。当网络设备的第一出端口队列发生PFC死锁时,网络设备基于访问控制列表确定第一出端口队列中的异常数据流,异常数据流的出端口和入端口均为网络设备的上行端口,第一出端口队列为网络设备中的任一出端口队列。网络设备向网管设备发送异常信息,异常信息包括异常数据流的标识。网管设备向显示设备传输异常数据流的标识,供显示设备显示。本申请通过在显示设备上显示异常数据流的标识,便于运维人员确定该异常数据流的源端设备和目的端设备,以排查源端设备与目标端设备之间的传输链路,确定PFC死锁的根因,实现从根因上解决PFC死锁问题。实现从根因上解决PFC死锁问题。实现从根因上解决PFC死锁问题。

【技术实现步骤摘要】
网络异常根因定位方法、装置及系统、计算机存储介质


[0001]本申请涉及网络
,特别涉及一种网络异常根因定位方法、装置及系统、计算机存储介质。

技术介绍

[0002]目前网络通常采用优先级流量控制(priority flow control,PFC)机制实现无损网络。传统的流量控制机制下,当某条传输链路出现拥塞时,该传输链路上的所有数据流都会被阻止传输。而PFC机制下,一条传输链路上能够创建最多8个虚拟通道,每个虚拟通道对应一个优先级,任意一个虚拟通道都允许被单独暂停或重启,同时不影响其它虚拟通道传输数据流。
[0003]当前,发送端和接收端之间通过网络设备转发数据包实现通信。在PFC机制下,网络设备的一个出端口通常对应8个出端口队列,每个出端口队列用于缓存一个优先级的数据包。网络采用PFC机制实现无损网络的过程包括:发送端发送数据包;当传输链路上的某一网络设备的某个出端口队列发生拥塞时,该网络设备向该出端口队列中的数据包的进入方向(上游设备)发送PFC帧,该PFC帧用于通知上游设备暂时停止发送该优先级的数据包;当该上游设备也为网络设备时,该上游设备将接收到的该优先级的数据包缓存至对应的出端口队列中,若该上游设备的出端口队列发生拥塞,则该上游设备再向出端口队列中的数据包的进入方向发送PFC帧,如此一级级反压直至发送端,从而消除网络中因拥塞造成的丢包。但是,采用PFC机制的网络可能会发生PFC死锁(PFC deadlock)。网络发生PFC死锁后,会导致发送端与接收端之间无法传输数据包而造成通信中断,甚至会造成全网瘫痪。其中,PFC死锁指由于网络中的下层网络设备与上层网络设备之间相互发送PFC帧,导致多个网络设备的出端口队列长期处于停止发包状态的现象。
[0004]目前通常采用看门狗(watchdog)机制应对PFC死锁的问题。通过watchdog监控网络设备的出端口队列的发包状态。当出端口队列在设定时间内持续处于由于PFC帧导致的停止发包状态时,watchdog判定PFC死锁发生,此时,网络设备可以丢弃该出端口队列中的数据包或者忽略该出端口队列接收到的PFC帧,使该出端口队列强制发包以实现破锁。
[0005]但是,采用watchdog机制应对PFC死锁问题时,仅能在确定出端口队列发生PFC死锁后,针对该出端口队列进行破锁,若该出端口队列仍开启PFC功能,则该出端口队列在后续转发数据包的过程中仍可能会发生PFC死锁,因此watchdog机制无法从根因上解决出端口队列发生PFC死锁的问题。

技术实现思路

[0006]本申请提供了一种网络异常根因定位方法、装置及系统、计算机存储介质,可以解决目前无法从根因上解决出端口队列发生PFC死锁的问题。
[0007]第一方面,提供了一种网络异常根因定位方法。当网络设备的第一出端口队列发生PFC死锁时,网络设备基于访问控制列表确定第一出端口队列中的异常数据流,该异常数
据流的出端口和入端口均为网络设备的上行端口,第一出端口队列为网络设备中的任一出端口队列。网络设备向网管设备发送异常信息,该异常信息包括异常数据流的标识。
[0008]其中,访问控制列表是网络设备接口的指令列表。访问控制列表中的一条表项通常包括过滤(filter)和动作(action)这两部分,当网络设备匹配到filter中定义的内容时,执行action中定义的动作。异常数据流的标识可以是异常数据流的镜像数据流或异常数据流的五元组信息。异常数据流的五元组信息包括异常数据流的源IP地址、目的IP地址、源端口、目的端口和传输层协议。
[0009]本申请中,通过网络设备向网管设备上报异常信息,由于该异常信息中包括发生PFC死锁的出端口队列中的异常数据流的标识,网管设备在获取该异常信息后,可以在显示设备上显示该异常数据流的标识,使运维人员能够根据该异常数据流的标识确定该异常数据流的源端设备和目的端设备,进而能够排查该源端设备和该目的端设备之间的传输链路,以确定导致PFC死锁的根因,实现从根因上解决PFC死锁问题。
[0010]可选地,当网络设备中的第一出端口队列发生PFC死锁时,网络设备基于访问控制列表确定第一出端口队列中的异常数据流的过程,包括:当第一出端口队列发生PFC死锁时,生成访问控制列表;对第一出端口队列进行破锁,并基于访问控制列表,从发往第一出端口队列的数据流中确定异常数据流。
[0011]其中,网络设备对第一出端口队列进行破锁,包括网络设备丢弃第一出端口队列中的数据包或者忽略第一出端口队列接收到的PFC帧,使第一出端口队列强制发包,进而使得第一出端口队列能够接收新的数据流。
[0012]可选地,网络设备在基于访问控制列表,从发往第一出端口队列的数据流中确定异常数据流之后,可以删除访问控制列表。
[0013]可选地,可以在网络设备中预先设置访问控制列表的最大生存时间,从访问控制列表的生成时刻开始计时,当访问控制列表的生存时间达到最大生存时间时,网络设备自动删除该访问控制列表,以减少内存占用。
[0014]本申请中,当第一出端口队列在预设时间段内的发包数量为0,且第一出端口队列在预设时间段内接收到PFC帧时,网络设备可以确定第一出端口队列发生PFC死锁。
[0015]可选地,异常信息还包括网络设备的标识以及第一出端口队列所在的端口的标识。
[0016]第二方面,提供了一种网络异常根因定位方法。网管设备接收网络设备发送的异常信息,异常信息包括网络设备的第一出端口队列中的异常数据流的标识,异常数据流由网络设备在第一出端口队列发生PFC死锁时,基于访问控制列表确定,异常数据流的出端口和入端口均为网络设备的上行端口,第一出端口队列为网络设备中的任一出端口队列;网管设备向显示设备传输异常数据流的标识,供显示设备显示。
[0017]可选地,网络设备向网管设备发送的异常信息还包括网络设备的标识以及第一出端口队列所在端口的信息。本申请中,接入层网络设备和/或汇聚层网络设备在确定第一出端口队列发生PFC死锁时,向网管设备发送的异常信息中可以包括第一出端口队列中的异常数据流的标识、第一出端口队列所在的网络设备的标识以及第一出端口队列所在的端口的标识;核心网络设备在确定第一出端口队列发生PFC死锁时,也可以向网管设备发送异常信息,该异常信息中可以包括第一出端口队列所在的网络设备的标识以及第一出端口队列
所在的端口的标识。当网管设备接收到多个网络设备发送的异常信息时,可以基于每个网络设备的标识以及每个网络设备中发生PFC死锁的出端口队列所在的端口的标识,从多个网络设备中获取构成PFC死锁环的多个目标网络设备;网管设备向显示设备传输多个目标网络设备的标识,供显示设备显示。
[0018]可选地,网管设备基于每个网络设备的标识以及每个网络设备中发生PFC死锁的出端口队列所在的端口的标识,从多个网络设备中获取构成PFC死锁环的多个目标网络设备,包括:网管设备基于每个网络设备的标识以及每个网络设备中发生PFC死锁的出端口队列所在的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网络异常根因定位方法,其特征在于,所述方法包括:当网络设备的第一出端口队列发生优先级流量控制PFC死锁时,基于访问控制列表确定所述第一出端口队列中的异常数据流,所述异常数据流的出端口和入端口均为所述网络设备的上行端口,所述第一出端口队列为所述网络设备中的任一出端口队列;向网管设备发送异常信息,所述异常信息包括所述异常数据流的标识。2.根据权利要求1所述的方法,其特征在于,所述当网络设备中的第一出端口队列发生优先级流量控制PFC死锁时,基于访问控制列表确定所述第一出端口队列中的异常数据流,包括:当所述第一出端口队列发生PFC死锁时,生成所述访问控制列表;对所述第一出端口队列进行破锁,并基于所述访问控制列表,从发往所述第一出端口队列的数据流中确定所述异常数据流。3.根据权利要求2所述的方法,其特征在于,在所述基于所述访问控制列表,从发往所述第一出端口队列的数据流中确定所述异常数据流之后,所述方法还包括:删除所述访问控制列表。4.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:当所述第一出端口队列在预设时间段内的发包数量为0,且所述第一出端口队列在所述预设时间段内接收到PFC帧时,确定所述第一出端口队列发生PFC死锁。5.根据权利要求1至3任一所述的方法,其特征在于,所述异常信息还包括所述网络设备的标识以及所述第一出端口队列所在的端口的标识。6.一种网络异常根因定位方法,其特征在于,所述方法包括:接收网络设备发送的异常信息,所述异常信息包括所述网络设备的第一出端口队列中的异常数据流的标识,所述异常数据流由所述网络设备在所述第一出端口队列发生PFC死锁时,基于访问控制列表确定,所述异常数据流的出端口和入端口均为所述网络设备的上行端口,所述第一出端口队列为所述网络设备中的任一出端口队列;向显示设备传输所述异常数据流的标识,供所述显示设备显示。7.根据权利要求6所述的方法,其特征在于,所述异常信息还包括所述网络设备的标识以及所述第一出端口队列所在端口的信息,所述方法还包括:当接收到多个网络设备发送的异常信息时,基于每个所述网络设备的标识以及每个所述网络设备中发生PFC死锁的出端口队列所在的端口的标识,从所述多个网络设备中获取构成PFC死锁环的多个目标网络设备;向所述显示设备传输所述多个目标网络设备的标识,供所述显示设备显示。8.根据权利要求7所述的方法,其特征在于,所述基于每个所述网络设备的标识以及每个所述网络设备中发生PFC死锁的出端口队列所在的端口的标识,从所述多个网络设备中获取构成PFC死锁环的多个目标网络设备,包括:基于每个所述网络设备的标识以及每个所述网络设备中发生PFC死锁的出端口队列所在的端口的标识,生成PFC死锁环,所述PFC死锁环中的每个环节点对应一个所述目标网络设备;所述向所述显示设备传输所述多个目标网络设备的标识,包括:向所述显示设备传输所述PFC死锁环。
9.一种网络异常根因定位装置,其特征在于,所述装置包括:第一确定模块,用于当网络设备的第一出端口队列发生优先级流量控制PFC死锁时,基于访问控制列表确定所述第一出端口队列中的异常数据流,所述异常数据流的出端口和入端口均为所述网络设备的上行端口,所述第一出端口队列为所述网络设备中的任一出端口队列;发送模块,用于向网管设备发送异常信息,所述异常信息包括所述异常数据流的标识。10.根据权利要求9所述的...

【专利技术属性】
技术研发人员:冀智刚晏思宇
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1