The invention discloses a network fault detection method, which is applied to the programmable switching chip of switching equipment. The method includes: the programmable switching chip detects the data flow of the received transmission control protocol TCP message, obtains the five-tuple information of the TCP message and the TCP serial number, and judges the TCP sequence when recording the five-tuple information of the TCP message. If the TCP sequence number is not greater than the record sequence number corresponding to the five-tuple information, the number of retransmissions corresponding to the five-tuple information is increased by one, and the record sequence number is updated to the TCP sequence number; whether the number of retransmissions is greater than the preset threshold of retransmissions is judged; if the number of retransmissions is greater than the preset threshold of retransmissions, the number of retransmissions is increased by one. Value, then the TCP message is identified as a fault message and sent to the fault processing equipment for fault processing. The embodiment of the invention can improve the accuracy of network fault detection.
【技术实现步骤摘要】
一种网络故障检测方法及装置
本专利技术涉及通信
,尤指一种网络故障检测方法及装置。
技术介绍
网络故障一直是数据中心网络需要解决的问题,随着网络环境愈加复杂,越难以及时准确地发现哪里发生了故障。TCP协议会通过报文重传的方式处理少量的报文丢包,但如果网络出现故障则会出现大量的重传报文。因此,少量的TCP重传并不一定说明网络发生故障,而网络故障必然会导致大量的报文重传,因此可以通过一定时间内的重传数量大小来粗略判断网络是否发生故障。现有检测网络故障主要是在网络外部进行探测,当通信主机的TCP报文大量重传,得知网络出现故障时,在网络外部通过traceroute等手段来探测网络的连通性。但这种方法无法精确感知网络内部情况,还有多径等多种因素影响,准确性不高。因此,现有网络故障的检测方案准确率不高,效率太低。
技术实现思路
本专利技术实施例提供一种网络故障检测方法及装置,用以解决现有技术中网络故障检测准确率不高、效率低下的问题。一种网络故障检测方法,应用于交换设备的可编程交换芯片中,所述方法包括:所述可编程交换芯片对接收到的传输控制协议TCP报文进行数据流检测,获取所述TCP报文的五元组信息以及TCP序列号;当根据所述TCP报文的五元组信息找到对应的记录序列号时,判断所述TCP序列号是否大于所述记录序列号;若所述TCP序列号不大于所述记录序列号,则将所述五元组信息对应的重传次数加一,并将所述记录序列号更新为所述TCP序列号;判断所述重传次数是否大于预设重传次数阈值;若所述重传次数大于所述预设重传次数阈值,则将所述TCP报文确定为故障报文并发送给故障处理设备以进行 ...
【技术保护点】
1.一种网络故障检测方法,其特征在于,应用于交换设备的可编程交换芯片中,所述方法包括:所述可编程交换芯片对接收到的传输控制协议TCP报文进行数据流检测,获取所述TCP报文的五元组信息以及TCP序列号;当根据所述TCP报文的五元组信息找到对应的记录序列号时,判断所述TCP序列号是否大于所述记录序列号;若所述TCP序列号不大于所述记录序列号,则将所述五元组信息对应的重传次数加一,并将所述记录序列号更新为所述TCP序列号;判断所述重传次数是否大于预设重传次数阈值;若所述重传次数大于所述预设重传次数阈值,则将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理。
【技术特征摘要】
1.一种网络故障检测方法,其特征在于,应用于交换设备的可编程交换芯片中,所述方法包括:所述可编程交换芯片对接收到的传输控制协议TCP报文进行数据流检测,获取所述TCP报文的五元组信息以及TCP序列号;当根据所述TCP报文的五元组信息找到对应的记录序列号时,判断所述TCP序列号是否大于所述记录序列号;若所述TCP序列号不大于所述记录序列号,则将所述五元组信息对应的重传次数加一,并将所述记录序列号更新为所述TCP序列号;判断所述重传次数是否大于预设重传次数阈值;若所述重传次数大于所述预设重传次数阈值,则将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理。2.根据权利要求1所述的方法,其特征在于,当根据所述TCP报文的五元组信息未找到对应的记录序列号时,所述方法,还包括:将所述TCP报文的TCP序列号记录为所述五元组信息对应的记录序列号,并设置所述五元组信息对应的重传次数为0;所述五元组信息包括源IP、目的IP、协议号、目的端口号、源端口号。3.根据权利要求2所述的方法,其特征在于,所述将所述TCP报文的TCP序列号记录为所述五元组信息对应的记录序列号,并设置所述五元组信息对应的重传次数为0,具体为:将所述五元组信息进行哈希算法,得到五元组哈希值;分别将所述TCP序列号和初始化为0的重传次数存入以所述五元组哈希值为索引的两个缓存中。4.根据权利要求1所述的方法,其特征在于,在将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理之后,所述方法,还包括:将所述五元组信息对应的重传次数清零。5.根据权利要求1至4任一所述的方法,其特征在于,所述将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理,包括:将所述TCP报文确定为故障报文并复制给所述交换设备的CPU进行故障处理;或者将所述TCP报文确定为故障报文并镜像所述TCP报文至监控设备进行故障处理。6.一种网络故障检测装置,其...
【专利技术属性】
技术研发人员:郑文楷,
申请(专利权)人:锐捷网络股份有限公司,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。