基于分布式PCIE系统的线卡故障恢复方法及相关设备技术方案

技术编号:9740046 阅读:137 留言:0更新日期:2014-03-06 23:22
本发明专利技术公开了一种基于分布式PCIE系统的线卡故障恢复方法、装置及线卡,该方法包括:所述分布式PCIE系统中的故障线卡自动重启后,关闭所述故障线卡上的PCIE端口,以通知所述分布式PCIE系统中与所述故障线卡连接的交换芯片丢弃目的地址为所述故障线卡的地址的数据;获取预先保存的所述故障线卡的PCIE配置信息后,根据获取的PCIE配置信息进行配置;开启所述PCIE端口,以通知所述交换芯片恢复发送目的地址为所述故障线卡的地址的数据。该方案可以有效避免整个PCIE系统发生拥塞,节省了主控卡的软件资源。

【技术实现步骤摘要】
基于分布式PCIE系统的线卡故障恢复方法及相关设备
本专利技术涉及通信
,尤指一种基于分布式快速外设部件互联(PeripheralComponentInterconnectExpress,PCIE)系统的线卡故障恢复方法、装置及线卡。
技术介绍
PCIE总线是应用于通信系统中各组件之间传输数据的高性能总线。在PCIE系统中采用点对点连接方式,每一对互连的组件之间都拥有独立的PCIE总线,各组件之间并发进行数据传输互不影响。由于采用点对点的互连技术,通过PCIE交换芯片(Switch,SW)还可以灵活扩展PCIE系统的拓扑结构。PCIE系统一般包括根组件(RootComplex,RC)、PCIESW和端点(EndPoint,EP)。RC一般集成在中央处理器(CentralProcessingUnit,CPU)中,除了通常的数据传输功能外,还可以实现对整个PCIE系统进行扫描、配置、管理等等功能。PCIESW至少包含两个以上的端口,允许数据从一个端口传输到另一个端口,它的主要功能是扩展PCIE系统的拓扑。EP是各种集成了PCIE端口的设备,EP可以通过PCIE总线实现和其他的EP或RC之间的数据传输。如图1所示为一个简单的PCIE系统的结构。下面介绍PCIE系统的几个特性。第一是扫描,在PCIE系统刚上电时,RC看不到PCIE系统上的其他组件,因此必须进行扫描。扫描时,RC会发出特定报文,接收到该特定报文的组件会向RC发送响应报文,RC接收到响应报文后就确认该组件存在。扫描完成后,RC就可以确认整个PCIE系统存在的组件及其连接方式等信息。第二是配置,在扫描完成后,RC还需要对PCIE系统里的各个组件进行配置,配置的目的是为了合理设置各组件里的寄存器,使整个PCIE系统可以进行正常的数据传输。例如,RC要对各个EP内部的基址寄存器进行设置,而基址寄存器存储的是RC分配给各个EP的内存空间,EP就是根据基址寄存器里的内容,来判断是否应该接收出现在PCIE总线上数据。第三是流控,PCIE系统是一种可靠的数据传输系统,所有的数据传输都必须遵守基于信用点的流控来保证数据在PCIE系统里不被随意丢弃。信用点是和可发送的数据相对应的,信用点多,则表示可发送的数据多,反之,则表示可发送的数据少。假设组件A和组件B为PCIE系统中的两个组件,组件A向组件B发送报文的基本原理如图2所示。首先组件B会根据自己内部空闲缓冲区的大小,定期发送携带信用点信息的报文给组件A,组件A收到后会更新自己的信用池。组件A向组件B发送报文前,要先查询自身的信用池,判断是否有足够的信用点,若信用点足够,则向组件B发送报文,同时信用池内的信用点就会相应的减少;若信用点不够,则不能向设备B发送报文。由于组件内的信用池反映的是对端组件空闲缓冲区的大小,从而保证只有对端组件的空闲缓冲区足够大时,才能向对端组件发送报文,避免对端组件因为缓冲区不足而发生丢包,保证数据传输的可靠性。一般情况下,RC集成在CPU内部,有独立的软件系统,PCIESW以芯片的形式存在,EP的形式比较灵活,可以是没有独立运行软件系统的一般接口芯片,也可以是有独立运行软件系统并集成了EP功能的CPU。若EP的形式是后者,则PCIE系统拥有至少两个CPU和软件系统,这样的PCIE系统称为分布式PCIE系统。在分布式PCIE系统中,RC所在的板卡称为主控卡,EP所在的板卡称为线卡,如图3所示是拥有三个CPU的分布式PCIE系统。目前,随着网络通信技术的快速发展,分布式PCIE系统应用在越来越多的网络设备中,特别是要求高性能和强大处理能力的核心网络设备。分布式PCIE系统由于存在多个CPU,处理性能很高,而可靠性却比较差。因为每个CPU有自己的软件系统,很容易因为软件方面的原因出现故障,例如当软件陷入死循环、出现跑飞等等情况时都会出现故障,线卡检测到自己的CPU故障后,会重启CPU,该CPU所在的线卡上的配置信息全部丢失,无法继续正常传输数据。线卡要想恢复正常的传输数据,需要在主控卡检测到线卡发生故障、并对其重新进行扫描和配置后才行。由于从线卡发生故障到主控卡检测出线卡发生故障并重新进行扫描和配置需要一段比较长的时间,这段时间内有可能因为故障线卡触发整个PCIE系统发生拥塞,进而影响其他正常线卡的数据传输;并且,在故障恢复的过程中需要主控卡重新进行扫描和配置,还会浪费主控卡的软件资源。
技术实现思路
本专利技术实施例提供一种基于分布式PCIE系统的线卡故障恢复方法、装置及线卡,用以解决现有的基于分布式PCIE系统对故障线卡进行恢复的过程中,可能触发整个PCIE系统发生拥塞、进而影响其他正常线卡的数据传输,以及浪费主控卡的软件资源的问题。因此,根据本专利技术实施例,提供一种基于分布式PCIE系统的线卡故障恢复方法,包括:所述分布式PCIE系统中的故障线卡自动重启后,关闭所述故障线卡上的PCIE端口,以通知所述分布式PCIE系统中与所述故障线卡连接的交换芯片丢弃目的地址为所述故障线卡的地址的数据;获取预先保存的所述故障线卡的PCIE配置信息后,根据获取的PCIE配置信息进行配置;开启所述PCIE端口,以通知所述交换芯片恢复发送目的地址为所述故障线卡的地址的数据。具体的,预先保存所述故障线卡的PCIE配置信息,具体包括:所述故障线卡发生故障之前,在存储器中保存所述PCIE配置信息。具体的,获取预先保存的所述故障线卡的PCIE配置信息,具体包括:从所述存储器中获取所述PCIE配置信息。具体的,所述存储器为非易失存储器。还提供一种基于分布式PCIE系统的线卡故障恢复装置,包括:关闭单元,用于自身所在的所述分布式PCIE系统中的故障线卡自动重启后,关闭所述故障线卡上的PCIE端口,以通知所述分布式PCIE系统中所述故障线卡连接的交换芯片丢弃目的地址为所述故障线卡的地址的数据;配置单元,用于获取预先保存的所述故障线卡的PCIE配置信息后,根据获取的PCIE配置信息进行配置;开启单元,用于开启所述PCIE端口,以通知所述交换芯片恢复发送目的地址为所述故障线卡的地址的数据。具体的,所述配置单元,用于预先保存所述故障线卡的PCIE配置信息,具体用于:在所述故障线卡发生故障之前,在存储器中保存所述PCIE配置信息。具体的,所述配置单元,用于获取预先保存的所述故障线卡的PCIE配置信息,具体用于:从所述存储器中获取所述PCIE配置信息。具体的,所述存储器为非易失存储器。还提供一种线卡,包括上述基于分布式PCIE系统的线卡故障恢复装置。本专利技术实施例提供的基于分布式PCIE系统的线卡故障恢复方法、装置及线卡,由于在线卡故障前保存了PCIE配置信息,从而可以保证线卡发生故障并自动重启后,自身可以进行配置,并通过关闭和开启PCIE端口来实现通知分布式PCIE系统中与故障线卡连接的交换芯片丢弃还是恢复发送目的地址为故障线卡的地址的数据,在故障恢复的过程中可以有效避免整个PCIE系统发生拥塞,进而保证其他正常线卡的数据传输;并且,故障恢复过程无需主控卡的参与就可以完成,节省了主控卡的软件资源。附图说明图1为现有技术PCIE系统的结构示意图;图2为现有技术中组件A和组件B之间基于信用点传输数据的示意图;图3为现有技术中分布本文档来自技高网
...
基于分布式PCIE系统的线卡故障恢复方法及相关设备

【技术保护点】
一种基于分布式PCIE系统的线卡故障恢复方法,其特征在于,包括:所述分布式快速外设部件互联PCIE系统中的故障线卡自动重启后,关闭所述故障线卡上的PCIE端口,以通知所述分布式PCIE系统中与所述故障线卡连接的交换芯片丢弃目的地址为所述故障线卡的地址的数据;获取预先保存的所述故障线卡的PCIE配置信息后,根据获取的PCIE配置信息进行配置;开启所述PCIE端口,以通知所述交换芯片恢复发送目的地址为所述故障线卡的地址的数据。

【技术特征摘要】
1.一种基于分布式PCIE系统的线卡故障恢复方法,其特征在于,包括:所述分布式快速外设部件互联PCIE系统中的故障线卡自动重启后,关闭所述故障线卡上的PCIE端口,以通知所述分布式PCIE系统中与所述故障线卡连接的交换芯片丢弃目的地址为所述故障线卡的地址的数据;获取预先保存的所述故障线卡的PCIE配置信息后,根据获取的PCIE配置信息进行配置;开启所述PCIE端口,以通知所述交换芯片恢复发送目的地址为所述故障线卡的地址的数据;其中,预先保存所述故障线卡的PCIE配置信息,具体包括:所述故障线卡发生故障之前,在存储器中保存所述PCIE配置信息。2.如权利要求1所述的方法,其特征在于,获取预先保存的所述故障线卡的PCIE配置信息,具体包括:从所述存储器中获取所述PCIE配置信息。3.如权利要求1或2所述的方法,其特征在于,所述存储器为非易失存储器。4.一种基于分布式PCIE系统的线卡故障恢复装置,其特征在于,包括:关闭单元,用于自身所在的...

【专利技术属性】
技术研发人员:黄冠华
申请(专利权)人:福建星网锐捷网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1