一种图形处理器拓扑切换设备和图形处理器板卡制造技术

技术编号:28373378 阅读:27 留言:0更新日期:2021-05-08 00:00
本发明专利技术公开了一种图形处理器拓扑切换设备和图形处理器板卡,设备包括:连接第一中央处理器与图形处理器的第一PCIE切换器的第一端口的第一纵向PCIE线缆、连接第二中央处理器与图形处理器的第二PCIE切换器的第一端口的第二纵向PCIE线缆、连接第一PCIE切换器的第二端口和第二PCIE切换器的第二端口的横向PCIE光纤线缆,以及基板管理控制器;基板管理控制器通过内部集成电路总线连接到第一纵向PCIE线缆、第二纵向PCIE线缆、和横向PCIE光纤线缆,配置为获取并基于第一纵向PCIE线缆、第二纵向PCIE线缆、和横向PCIE光纤线缆的配置标识而配置第一PCIE切换器和第二PCIE切换器的固件,以形成图形处理器拓扑。本发明专利技术能够提升各拓扑下的节点性能并拓宽应用场景。

【技术实现步骤摘要】
一种图形处理器拓扑切换设备和图形处理器板卡
本专利技术涉及人工智能领域,更具体地,特别是指一种图形处理器拓扑切换设备和图形处理器板卡。
技术介绍
随着人工智能相关产业的快速发展,以GPU(图形处理器)服务器为代表的AI(人工智能)服务器需求量大增,其中PCIE(计算机与外部设备的连接标准扩展)标准卡形态的GPU或者AI加速卡,因为其遵循PCIE规范,适用性强,且价格相对便宜,获得了广泛的使用。但是PCIE标准卡形态的GPU卡,由于GPU卡和GPU卡之间不存在单独的通信链路,需要借助PCIE链路完成CPU和GPU之间的通信以及GPU和GPU之间的通信。不同的PCIE链路拓扑各有利弊,现有技术使用PCIE多路选择器(MUX)来切换拓扑。但使用PCIEMUX会增加链路的SI(信噪比)损耗,导致可能需要增加信号增强的部件,带来成本的提升和调试的困难。另外,MUX支持的拓扑种类较少,不满足实际需要,单个拓扑的性能也只能适用于不同的应用场景,无法覆盖所有的应用场景。针对现有技术中拓扑切换的性能不佳、使用环境受限的问题,目前尚无有效的解决方案。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提出一种图形处理器拓扑切换设备和图形处理器板卡,能够提升各拓扑下的节点性能并拓宽应用场景。基于上述目的,本专利技术实施例的第一方面提供了一种图形处理器拓扑切换设备,包括:第一纵向PCIE线缆,配置为在第一中央处理器和连接到多个图形处理器的第一PCIE切换器的第一端口之间建立PCIE连接;<br>第二纵向PCIE线缆,配置为在第二中央处理器和连接到多个图形处理器的第二PCIE切换器的第一端口之间建立PCIE连接;横向PCIE光纤线缆,配置为在第一PCIE切换器的第二端口和第二PCIE切换器的第二端口之间建立PCIE连接;基板管理控制器,通过内部集成电路总线连接到第一纵向PCIE线缆、第二纵向PCIE线缆、和横向PCIE光纤线缆,配置为获取并基于第一纵向PCIE线缆、第二纵向PCIE线缆、和横向PCIE光纤线缆的配置标识而配置第一PCIE切换器和第二PCIE切换器的固件,以形成图形处理器拓扑。在一些实施方式中,设备还包括PCIE线缆配置标识模块,通过通用输入输出总线连接到基板管理控制器,配置为对基板管理控制器提供配置标识和相对应的图形处理器拓扑之间的对应关系。在一些实施方式中,图形处理器拓扑包括平衡模式;基板管理控制器基于第一纵向PCIE线缆、第二纵向PCIE线缆、和横向PCIE光纤线缆的配置标识而配置第一PCIE切换器和第二PCIE切换器的固件,以形成平衡模式的拓扑包括:启用第一PCIE切换器的第一端口并禁用第一PCIE切换器的第二端口;启用第二PCIE切换器的第一端口并禁用第二PCIE切换器的第二端口;将第一PCIE切换器和第二PCIE切换器配置为允许连接到第一PCIE切换器的多个图形处理器和连接到第二PCIE切换器的多个图形处理器之间通过在第一中央处理器和第二中央处理器之间建立连接的超级通道互连而进行超级通道互连通信。在一些实施方式中,图形处理器拓扑包括级联模式;基板管理控制器基于第一纵向PCIE线缆、第二纵向PCIE线缆、和横向PCIE光纤线缆的配置标识而配置第一PCIE切换器和第二PCIE切换器的固件,以形成级联模式的拓扑包括:启用第一PCIE切换器的第一端口和第二端口,并将第一PCIE切换器的第二端口配置为下行端口;禁用第二PCIE切换器的第一端口,启用第二PCIE切换器的第二端口,并将第二PCIE切换器的第二端口配置为上行端口;将第一PCIE切换器和第二PCIE切换器配置为允许连接到第一PCIE切换器的多个图形处理器和连接到第二PCIE切换器的多个图形处理器之间通过横向PCIE光纤线缆进行点对点通信。在一些实施方式中,图形处理器拓扑包括综合模式;基板管理控制器基于第一纵向PCIE线缆、第二纵向PCIE线缆、和横向PCIE光纤线缆的配置标识而配置第一PCIE切换器和第二PCIE切换器的固件,以形成综合模式的拓扑包括:启用第一PCIE切换器的第一端口和第二端口;启用第二PCIE切换器的第一端口和第二端口;将第一PCIE切换器和第二PCIE切换器配置为允许连接到第一PCIE切换器的多个图形处理器和连接到第二PCIE切换器的多个图形处理器之间通过横向PCIE光纤线缆进行点对点通信。在一些实施方式中,第一中央处理器和第二中央处理器均为intel处理器。基于上述目的,本专利技术实施例的第二方面提供了另一种图形处理器拓扑切换设备,包括:第一纵向PCIE线缆,配置为在第一中央处理器和连接到多个图形处理器的第一PCIE切换器的第一端口之间建立PCIE连接;第二纵向PCIE线缆,配置为在第二中央处理器和连接到多个图形处理器的第二PCIE切换器的第一端口之间建立PCIE连接;第一横向PCIE线缆,配置为在第二中央处理器和第一PCIE切换器的第二端口之间建立PCIE连接;第二横向PCIE线缆,配置为在第一中央处理器和第二PCIE切换器的第二端口之间建立PCIE连接;基板管理控制器,通过内部集成电路总线连接到第一纵向PCIE线缆、第二纵向PCIE线缆、第一横向PCIE线缆、和第二横向PCIE线缆,配置为获取并基于第一纵向PCIE线缆、第二纵向PCIE线缆、第一横向PCIE线缆、和第二横向PCIE线缆的配置标识而配置第一PCIE切换器和第二PCIE切换器的固件,以形成图形处理器拓扑。在一些实施方式中,设备还包括PCIE线缆配置标识模块,通过通用输入输出总线连接到基板管理控制器,配置为对基板管理控制器提供配置标识和相对应的图形处理器拓扑之间的对应关系。在一些实施方式中,图形处理器拓扑包括AMD模式;基板管理控制器基于第一纵向PCIE线缆、第二纵向PCIE线缆、第一横向PCIE线缆、和第二横向PCIE线缆的配置标识而配置第一PCIE切换器和第二PCIE切换器的固件,以形成AMD模式的拓扑包括:启用第一PCIE切换器的第一端口和第二端口;启用第二PCIE切换器的第一端口和第二端口;将第一PCIE切换器和第二PCIE切换器配置为允许连接到第一PCIE切换器的多个图形处理器和连接到第二PCIE切换器的多个图形处理器之间通过在第一中央处理器和第二中央处理器之间建立连接的超级通道互连而进行超级通道互连通信。本专利技术实施例的第三方面提供了一种图形处理器板卡,包括:通过超级通道互连的第一中央处理器和第二中央处理器;第一PCIE切换器和第二PCIE切换器;分别连接到第一PCIE切换器和第二PCIE切换器多个图形处理器;前述的图形处理器拓扑切换设备。本专利技术具有以下有益技术效果:本专利技术实施例提供的图形处理器拓扑切换设备和图形处理器板卡,通过使用基板管理控制器通过内部集成电路总线连接到第一纵向PCIE线缆、第二纵向PCIE本文档来自技高网...

【技术保护点】
1.一种图形处理器拓扑切换设备,其特征在于,包括:/n第一纵向PCIE线缆,配置为在第一中央处理器和连接到多个图形处理器的第一PCIE切换器的第一端口之间建立PCIE连接;/n第二纵向PCIE线缆,配置为在第二中央处理器和连接到多个图形处理器的第二PCIE切换器的第一端口之间建立PCIE连接;/n横向PCIE光纤线缆,配置为在第一PCIE切换器的第二端口和第二PCIE切换器的第二端口之间建立PCIE连接;/n基板管理控制器,通过内部集成电路总线连接到所述第一纵向PCIE线缆、所述第二纵向PCIE线缆、和所述横向PCIE光纤线缆,配置为获取并基于所述第一纵向PCIE线缆、所述第二纵向PCIE线缆、和所述横向PCIE光纤线缆的配置标识而配置所述第一PCIE切换器和所述第二PCIE切换器的固件,以形成图形处理器拓扑。/n

【技术特征摘要】
1.一种图形处理器拓扑切换设备,其特征在于,包括:
第一纵向PCIE线缆,配置为在第一中央处理器和连接到多个图形处理器的第一PCIE切换器的第一端口之间建立PCIE连接;
第二纵向PCIE线缆,配置为在第二中央处理器和连接到多个图形处理器的第二PCIE切换器的第一端口之间建立PCIE连接;
横向PCIE光纤线缆,配置为在第一PCIE切换器的第二端口和第二PCIE切换器的第二端口之间建立PCIE连接;
基板管理控制器,通过内部集成电路总线连接到所述第一纵向PCIE线缆、所述第二纵向PCIE线缆、和所述横向PCIE光纤线缆,配置为获取并基于所述第一纵向PCIE线缆、所述第二纵向PCIE线缆、和所述横向PCIE光纤线缆的配置标识而配置所述第一PCIE切换器和所述第二PCIE切换器的固件,以形成图形处理器拓扑。


2.根据权利要求1所述的设备,其特征在于,还包括:
PCIE线缆配置标识模块,通过通用输入输出总线连接到所述基板管理控制器,配置为对所述基板管理控制器提供所述配置标识和相对应的图形处理器拓扑之间的对应关系。


3.根据权利要求2所述的设备,其特征在于,所述图形处理器拓扑包括平衡模式;所述基板管理控制器基于所述第一纵向PCIE线缆、所述第二纵向PCIE线缆、和所述横向PCIE光纤线缆的配置标识而配置所述第一PCIE切换器和所述第二PCIE切换器的固件,以形成平衡模式的拓扑包括:
启用所述第一PCIE切换器的第一端口并禁用所述第一PCIE切换器的第二端口;
启用所述第二PCIE切换器的第一端口并禁用所述第二PCIE切换器的第二端口;
将所述第一PCIE切换器和所述第二PCIE切换器配置为允许连接到所述第一PCIE切换器的多个图形处理器和连接到所述第二PCIE切换器的多个图形处理器之间通过在所述第一中央处理器和所述第二中央处理器之间建立连接的超级通道互连而进行超级通道互连通信。


4.根据权利要求2所述的设备,其特征在于,所述图形处理器拓扑包括级联模式;所述基板管理控制器基于所述第一纵向PCIE线缆、所述第二纵向PCIE线缆、和所述横向PCIE光纤线缆的配置标识而配置所述第一PCIE切换器和所述第二PCIE切换器的固件,以形成级联模式的拓扑包括:
启用所述第一PCIE切换器的第一端口和第二端口,并将所述第一PCIE切换器的第二端口配置为下行端口;
禁用所述第二PCIE切换器的第一端口,启用所述第二PCIE切换器的第二端口,并将所述第二PCIE切换器的第二端口配置为上行端口;
将所述第一PCIE切换器和所述第二PCIE切换器配置为允许连接到所述第一PCIE切换器的多个图形处理器和连接到所述第二PCIE切换器的多个图形处理器之间通过所述横向PCIE光纤线缆进行点对点通信。


5.根据权利要求2所述的设备,其特征在于,所述图形处理器拓扑包括综合模式;所述基板管理控制器基于所述第一纵向PCIE线缆、所述第二纵向PCIE线缆、和所述横向PCIE光纤线缆的配置标识而配置所述第一PCIE切换器和所述第...

【专利技术属性】
技术研发人员:杨洋
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1