System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() PCIE扩展盒、服务器、控制数据传输的方法、装置及产品制造方法及图纸_技高网

PCIE扩展盒、服务器、控制数据传输的方法、装置及产品制造方法及图纸

技术编号:40486591 阅读:6 留言:0更新日期:2024-02-26 19:18
本申请涉及PCIE技术领域,公开了一种PCIE扩展盒、服务器、控制数据传输的方法、装置及产品。PCIE扩展盒包括切换单元和至少一个PCIE插槽,切换单元包括一个下行接口及至少两个上行接口;其中,PCIE插槽用于安装PCIE设备;下行接口用于连接PCIE插槽;至少两个上行接口用于连接主板端的CPU,进而形成多通道的数据链路;切换单元在数据传输过程中,选择多通道的数据链路中任一通道进行数据传输。采用本申请提供的PCIE扩展盒,能够在PCIE链路报错时的自动切换数据传输通道,实现资源稳定传输,从而在不关机的情况下稳定业务正常运行,对比单一传输链路来说,PCIE链路的稳定性和可靠性大大提升。

【技术实现步骤摘要】

本申请涉及pcie,特别是涉及一种pcie扩展盒、服务器、控制数据传输的方法、装置及产品。


技术介绍

1、pcie(peripheral component interconnect express)是一种高速串行计算机扩展总线标准,它采用了高速串行通信技术,使得数据传输速度得到了大幅提升。在实际应用中,根据带宽需求,常用的pcie槽位主要有x2、x4、x8、x16等几种。不同的槽位速率能够支持各种不同的pcie设备。随着pcie速率的持续提升,支持的pcie设备种类也变得越来越丰富,pcie链路的问题逐渐增多,故障的影响范围和程度也在扩大。虽然一些轻微的错误报告,例如ce(correctable error,可纠正错误)可能对业务影响不大,但如uce(uncorrectableerror,不可纠正错误)、降速、降带宽甚至掉卡等严重的问题,会对业务的正常运转造成严重影响。例如,致命的不可纠正错误往往会导致pcie链路和硬件异常,这种情况需要复位链路和硬件设备操作,导致业务中断无法进行。

2、在pcie设备和链路的日常维护中,若pcie链路存在uce报错或ce报错的数量达到一定的阈值,通常采用定位报错设备并移除报错设备的方式进行故障修复。当设备支持热插拔时,可通过hot-plug按键来实现设备的更换。但这种方式只能解决设备引起的故障问题,当pcie链路发生故障时,更换或初始化设备无法直接解决问题,需要重启系统来尝试解决链路问题,但物理链路发生问题时,及时重启系统也无法恢复。在这种情况下,排查故障耗费大量时间,严重影响到业务的正常运行。因此,如何提高pcie链路的稳定性和可靠性是需要解决的问题。


技术实现思路

1、有鉴于此,本申请旨在提出一种高速串行计算机扩展总线扩展盒、服务器、控制数据传输的方法、装置及产品,以提高高速串行计算机扩展总线链路的稳定性及可靠性的问题。

2、为达到上述目的,本申请的技术方案如下:

3、本申请实施例第一方面提供一种高速串行计算机扩展总线扩展盒,该高速串行计算机扩展总线扩展盒应包括:切换单元和至少一个高速串行计算机扩展总线插槽,所述切换单元包括一个下行接口及至少两个上行接口;其中:

4、所述高速串行计算机扩展总线插槽用于安装高速串行计算机扩展总线设备;

5、所述下行接口用于连接所述高速串行计算机扩展总线插槽;

6、所述至少两个上行接口用于连接主板端的中央处理器,进而形成多通道的数据链路;

7、所述切换单元在数据传输过程中,选择所述多通道的数据链路中任一通道进行数据传输。

8、可选地,所述切换单元中下行接口的带宽为所有高速串行计算机扩展总线插槽的带宽之和;

9、所述切换单元中任一上行接口的带宽不小于所述下行接口的带宽。

10、可选地,所述切换单元中所有上行接口的带宽相等。

11、可选地,所述高速串行计算机扩展总线插槽为一个x16插槽,或,两个x8插槽;

12、所述切换单元,包括一个下行接口及两个上行接口,其中,每个上行接口的带宽均与所述下行接口的带宽相等;所述下行接口的带宽为所有高速串行计算机扩展总线插槽的带宽之和。

13、根据本申请实施例的第二方面,提供一种服务器,所述服务器包括:

14、至少一个高速串行计算机扩展总线扩展盒,所述高速串行计算机扩展总线扩展盒为本申请实施例的第一方面所提供的高速串行计算机扩展总线扩展盒,所述高速串行计算机扩展总线扩展盒为多通道的高速串行计算机扩展总线扩展盒;

15、中央处理器,通过主板端的多个高速串行计算机扩展总线接口,分别连接每个高速串行计算机扩展总线扩展盒的上行接口,与所述高速串行计算机扩展总线扩展盒上的高速串行计算机扩展总线设备进行数据通信;当所述多通道的数据链路中任一通道出现故障时,禁用所述通道在主板端的高速串行计算机扩展总线接口。

16、可选地,所述中央处理器上运行有基本输入输出系统;所述基本输入输出系统用于执行以下步骤:当所述服务器启动时,基本输入输出系统为每个多通道的数据链路中至少一个通道分配对应的高速串行计算机扩展总线资源;其中,每个通道的带宽不小于所述高速串行计算机扩展总线扩展盒中所有高速串行计算机扩展总线插槽的带宽之和。

17、可选地,所述服务器还包括:

18、基板管理控制器,用于在所述服务器启动时,对每个高速串行计算机扩展总线扩展盒进行通道识别;若所述高速串行计算机扩展总线扩展盒具有多通道,则为所述高速串行计算机扩展总线扩展盒设置一条默认通道;

19、所述切换单元,还用于优先选择所述默认通道进行数据传输;

20、所述基本输入输出系统,还用于为每个高速串行计算机扩展总线扩展盒的所有通道分配对应的高速串行计算机扩展总线资源。

21、可选地,所述基板管理控制器,用于当所述服务器启动时,通过识别所述高速串行计算机扩展总线扩展盒的底层芯片组fru,确定所述高速串行计算机扩展总线扩展盒是否具有多通道;当所述默认通道设置完成后,将所述默认通道的信息存储在可擦编程只读存储器中。

22、可选地,所述基本输入输出系统,还用于在所述服务器的操作系统启动时,执行以下步骤:

23、检测当前的通道中是否存在不可纠正错误;若存在不可纠正错误,则判定当前的通道发生故障;或,检测当前的通道中出现的可纠正错误的数量是否达到第一阈值;若达到所述第一阈值,则判定当前的通道发生故障;

24、当判定当前的通道发生故障时,禁用当前的通道在主板端的高速串行计算机扩展总线接口;

25、所述切换单元,还用于根据所述主板端的高速串行计算机扩展总线接口的禁用信息,切换所述当前的通道所在数据链路的剩余通道进行数据传输。

26、可选地,所述基本输入输出系统,还用于在高速串行计算机扩展总线设备的运行过程中,执行以下步骤:

27、持续读取所述中央处理器的寄存器,若所述寄存器中出现不可纠正错误,则判定当前的通道发生故障;或,持续读取所述中央处理器的寄存器,若所述寄存器中可纠正错误的数量达到第二阈值,则判定当前的通道发生故障;

28、当判定当前的通道发生故障时,禁用当前的通道在主板端的高速串行计算机扩展总线接口;

29、所述切换单元,还用于根据所述主板端的高速串行计算机扩展总线接口的禁用信息,切换所述当前的通道所在数据链路的剩余通道进行数据传输。

30、可选地,所述基本输入输出系统,还用于基于当前所有发生故障的通道生成故障信息,将所述故障信息及切换通道的信息发送给所述服务器的操作系统及所述基板管理控制器;

31、所述服务器的操作系统,根据接收到的所述故障信息及所述切换通道的信息,记录故障日志;

32、所述基板管理控制器,根据接收到的所述故障信息及所述切换通道的信息,记录故障日志。

33、可选地,所述基板管理控制器本文档来自技高网...

【技术保护点】

1.一种高速串行计算机扩展总线扩展盒,其特征在于,包括:切换单元和至少一个高速串行计算机扩展总线插槽,所述切换单元包括一个下行接口及至少两个上行接口;其中:

2.根据权利要求1所述的高速串行计算机扩展总线扩展盒,其特征在于,所述切换单元中下行接口的带宽为所有高速串行计算机扩展总线插槽的带宽之和;

3.根据权利要求1所述的高速串行计算机扩展总线扩展盒,其特征在于,所述切换单元中所有上行接口的带宽相等。

4.根据权利要求1所述的高速串行计算机扩展总线扩展盒,其特征在于,所述高速串行计算机扩展总线插槽为一个X16插槽,或,两个X8插槽;

5.一种服务器,其特征在于,包括:

6.根据权利要求5所述的服务器,其特征在于,所述中央处理器上运行有基本输入输出系统;所述基本输入输出系统用于执行以下步骤:当所述服务器启动时,基本输入输出系统为每个多通道的数据链路中至少一个通道分配对应的高速串行计算机扩展总线资源;其中,每个通道的带宽不小于所述高速串行计算机扩展总线扩展盒中所有高速串行计算机扩展总线插槽的带宽之和。

7.根据权利要求6所述的服务器,其特征在于,还包括:

8.根据权利要求7所述的服务器,其特征在于,所述基板管理控制器,用于当所述服务器启动时,通过识别所述高速串行计算机扩展总线扩展盒的底层芯片组FRU,确定所述高速串行计算机扩展总线扩展盒是否具有多通道;当所述默认通道设置完成后,将所述默认通道的信息存储在可擦编程只读存储器中。

9.根据权利要求6所述的服务器,其特征在于,所述基本输入输出系统,还用于在所述服务器的操作系统启动时,执行以下步骤:

10.根据权利要求6所述的服务器,其特征在于,所述基本输入输出系统,还用于在高速串行计算机扩展总线设备的运行过程中,执行以下步骤:

11.根据权利要求9或10所述的服务器,其特征在于,所述基本输入输出系统,还用于基于当前所有发生故障的通道生成故障信息,将所述故障信息及切换通道的信息发送给所述服务器的操作系统及基板管理控制器;

12.根据权利要求11所述的服务器,其特征在于,所述基板管理控制器,根据接收到的故障信息,进行链路故障的告警。

13.根据权利要求11所述的服务器,其特征在于,所述基板管理控制器,还用于当接收到的故障信息中,数据链路的所有通道均发生故障时,判定发生设备故障,并进行设备故障的告警。

14.一种控制数据传输的方法,其特征在于,应用于权利要求5-13任一所述的服务器,包括:

15.根据权利要求14所述的控制数据传输的方法,其特征在于,检测当前的通道是否发生故障,包括:

16.根据权利要求14所述的控制数据传输的方法,其特征在于,检测当前的通道是否发生故障,包括:

17.根据权利要求15或16所述的控制数据传输的方法,其特征在于,还包括:

18.根据权利要求17所述的控制数据传输的方法,其特征在于,还包括:

19.一种控制数据传输的装置,其特征在于,用于实现权利要求14-18任一所述的方法,包括:

20.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求14-18任一所述的方法中的步骤。

21.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求14-18任一所述的方法中的步骤。

...

【技术特征摘要】

1.一种高速串行计算机扩展总线扩展盒,其特征在于,包括:切换单元和至少一个高速串行计算机扩展总线插槽,所述切换单元包括一个下行接口及至少两个上行接口;其中:

2.根据权利要求1所述的高速串行计算机扩展总线扩展盒,其特征在于,所述切换单元中下行接口的带宽为所有高速串行计算机扩展总线插槽的带宽之和;

3.根据权利要求1所述的高速串行计算机扩展总线扩展盒,其特征在于,所述切换单元中所有上行接口的带宽相等。

4.根据权利要求1所述的高速串行计算机扩展总线扩展盒,其特征在于,所述高速串行计算机扩展总线插槽为一个x16插槽,或,两个x8插槽;

5.一种服务器,其特征在于,包括:

6.根据权利要求5所述的服务器,其特征在于,所述中央处理器上运行有基本输入输出系统;所述基本输入输出系统用于执行以下步骤:当所述服务器启动时,基本输入输出系统为每个多通道的数据链路中至少一个通道分配对应的高速串行计算机扩展总线资源;其中,每个通道的带宽不小于所述高速串行计算机扩展总线扩展盒中所有高速串行计算机扩展总线插槽的带宽之和。

7.根据权利要求6所述的服务器,其特征在于,还包括:

8.根据权利要求7所述的服务器,其特征在于,所述基板管理控制器,用于当所述服务器启动时,通过识别所述高速串行计算机扩展总线扩展盒的底层芯片组fru,确定所述高速串行计算机扩展总线扩展盒是否具有多通道;当所述默认通道设置完成后,将所述默认通道的信息存储在可擦编程只读存储器中。

9.根据权利要求6所述的服务器,其特征在于,所述基本输入输出系统,还用于在所述服务器的操作系统启动时,执行以下步骤:

10.根据权利要求6所述的服务器,其特征在于,所述基本输入输出系...

【专利技术属性】
技术研发人员:胥志泉李德新路明远
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1