一种通用GPU节点装置及通用16GPU BOX装置制造方法及图纸

技术编号:21453829 阅读:22 留言:0更新日期:2019-06-26 04:45
本发明专利技术公开了一种通用GPU节点装置,包括,GPU板卡、Switch板卡、电源板;GPU板卡包括8只GPU、GPU通信模块和通信管理模块,通信管理模块的输入端与Switch板卡的输出端连接,通信管理模块的输出端与GPU通信模块连接;GPU通信模块与GPU连接;GPU与Switch板卡连接;switch板卡包括PCIE扩展模块,PCIE扩展模块的输入端与CPU连接,输出端与GPU板卡连接。还公开了一种通用16GPU BOX装置,能够搭配多种通用型号的服务器,具有GPU数量多,通用性强的优点。

【技术实现步骤摘要】
一种通用GPU节点装置及通用16GPUBOX装置
本专利技术涉及板卡设计
,尤其是一种通用GPU节点装置及通用16GPUBOX装置。
技术介绍
随着人工智能(AI)领域的飞速发展,市场对于GPU服务器的需求也越来越高。目前市场上主要的GPU服务器架构都为CPU板和GPU板都集成在同一个箱体内,且GPU数量较少,一般为4GPU或8GPU。在这样的架构中,GPU板为专门设计,只能在对应的服务器中使用,不具有通用性,且GPU数量较少,因此无法满足日益增长的计算要求。
技术实现思路
本专利技术的目的是提供一种通用GPU节点装置及通用16GPUBOX装置,能够搭配多种通用型号的服务器,具有GPU数量多,通用性强的优点。为实现上述目的,本专利技术采用下述技术方案:本专利技术第一方面提供了一种通用GPU节点装置,包括,GPU板卡、完成GPU板卡互连和管理的Switch板卡、为GPU板卡和Switch板卡进行供电的电源板;所述GPU板卡包括8只GPU、GPU通信模块和通信管理模块,所述通信管理模块的输入端与Switch板卡的输出端连接,通信管理模块的输出端与GPU通信模块连接;所述GPU通信模块与GPU连接;所述GPU与Switch板卡连接;所述switch板卡包括PCIE扩展模块,所述PCIE扩展模块的输入端与CPU连接,输出端与GPU板卡连接。结合第一方面,在第一方面第一种可能的实现方式中,所述GPU通信模块包括6只NVLINKSwitch芯片;所述通信管理模块包括PEX8725芯片;每只GPU分别与6只NVLINKSwitch芯片的NVLINK接口连接;所述PEX8725芯片的上行PCIE接口与Switch板卡连接,下行PCIE接口分别与6只NVLINKSwitch芯片连接。结合第一方面,在第一方面第二种可能的实现方式中,所述PCIE扩展模块包括3个PEX9797芯片:PEX9797_1芯片、PEX9797_2芯片、PEX9797_3芯片,和1个PEX8749芯片;PEX9797_1芯片的port1和port2与CPU通信连接,port4和5分别连接PEX9797_2的port1口和PEX9797_3的port1口;port3和6外接两个标准的X16PCIEslot;PEX9797_2芯片的port1与PEX9797_1芯片通信,port2下接PEX8749芯片的port1口,port3至port6口分别挂接GPU板的4个GPU芯片;PEX9797_3芯片的port1与PEX9797_1芯片通信,port2至port5分别挂接GPU板的4个GPU芯片,port6外接标准的X16PCIEslot;PEX8749的port1与PEX9797_2互联,port2外接标准X16PCIEslot,port3连接GPU板的PEX8725芯片。结合第一方面,在第一方面第三种可能的实现方式中,所述电源板包括54V转12V电源模块,电源板外接54V电源,一路经54V转12V电源模块输出12V电压,为Switch板供电;电源板另一路通过radsok连接器为GPU板进行54V供电。本专利技术第二方面提供了一种通用16GPUBOX装置,包括两组GPU节点装置:上GPU节点和下GPU节点;所述上GPU节点的GPU通信模块与下GPU节点的GPU通信模块连接。结合第二方面,在第二方面第一种可能的实现方式中,所述上GPU节点的6只NVLINKSwitch芯片与下GPU节点的6只NVLINKSwitch芯片一一对应连接。结合第二方面,在第二方面第二种可能的实现方式中,所述上GPU节点包括6个高速连接器,,外接高速线缆传输NVLINK信号,所述上GPU节点的6只NVLINKSwitch芯片通过高速连接器与下GPU节点的6只NVLINKSwitch芯片连接。结合第二方面,在第二方面第三种可能的实现方式中,所述上GPU节点的6只NVLINKSwitch芯片与下GPU节点的6只NVLINKSwitch芯片通过PCB板卡一一对应连接。
技术实现思路
中提供的效果仅仅是实施例的效果,而不是专利技术所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:本专利技术系统对外提供4组X16的PCIE信号,可以和多种通用服务器进行搭配使用,内部共包括16个全互联的GPU,能够提供足够强大的计算能力。只有GPU部分,和CPU部分独立开来,且最多可支持16GPU,能够搭配多种通用型号的服务器,具有GPU数量多,通用性强的优点。附图说明图1是本专利技术通用GPU节点装置结构示意图;图2是本专利技术通用16GPUBOX装置实施例一结构示意图;图3是本专利技术通用16GPUBOX装置实施例二结构示意图。具体实施方式为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本专利技术进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本专利技术的不同结构。为了简化本专利技术的公开,下文中对特定例子的部件和设置进行描述。此外,本专利技术可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本专利技术省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本专利技术。如图1所示,一种通用GPU节点装置,包括,GPU板卡、完成GPU板卡互连和管理的Switch板卡、为GPU板卡和Switch板卡进行供电的电源板。Switch板的主要作用为扩展从计算节点传输来的PCIE信号,以实现对GPU板的互联和管理,同时扩展出4个标准的PCIEslot用于挂接网卡等PCIE设备。Switch板主要包括3个PEX9797芯片和1个PEX8749芯片,PEX9797和PEX8749皆为PCIE扩展芯片,用于扩展出更多的PCIE接口。每个PEX9797芯片包括P1-P6共6个X16port;PEX8749芯片包括3个X16port。其中PEX9797_1芯片的port1和2配置为上行口用于和CPU通信,其他4个port配置为下行口,port4和5分别连接PEX9797_2和PEX9797_3的port1口;port3和6外接两个标准的X16PCIEslot。PEX9797_2芯片的port1配置为上行口用于和PEX9797_1芯片通信,其他port配置为下行口,其中port2下接PEX8749芯片的port1口,port3-6口分别挂接GPU板的4个GPU芯片。PEX9797_3芯片配置方式和PEX9797_2类似,port1配置为上行口用于和PEX9797_1芯片通信,其他port配置为下行口,port2-5分别挂接GPU板的4个GPU芯片,port6外接标准的X16PCIEslot。PEX8749的port1配置为上行口和PEX9797_2互联,port2和3配置为下行口,其中port2外接标准X16PCIEslot,port3连接GPU板的PEX8725芯片。GPU板主要包括8个GPU、6个NVLINKSwitch以及1个用于管理NVLINKSwitch芯片的PEX8725芯片。每个GPU分别通过1个X16的PCIE信号同Switch板PEX9797芯片互联,并且每个GPU集成6组NVLINK信号分别连接至本文档来自技高网
...

【技术保护点】
1.一种通用GPU节点装置,其特征是,包括,GPU板卡、完成GPU板卡互连和管理的Switch板卡、为GPU板卡和Switch板卡进行供电的电源板;所述GPU板卡包括8只GPU、GPU通信模块和通信管理模块,所述通信管理模块的输入端与Switch板卡的输出端连接,通信管理模块的输出端与GPU通信模块连接;所述GPU通信模块与GPU连接;所述GPU与Switch板卡连接;所述switch板卡包括PCIE扩展模块,所述PCIE扩展模块的输入端与CPU连接,输出端与GPU板卡连接。

【技术特征摘要】
1.一种通用GPU节点装置,其特征是,包括,GPU板卡、完成GPU板卡互连和管理的Switch板卡、为GPU板卡和Switch板卡进行供电的电源板;所述GPU板卡包括8只GPU、GPU通信模块和通信管理模块,所述通信管理模块的输入端与Switch板卡的输出端连接,通信管理模块的输出端与GPU通信模块连接;所述GPU通信模块与GPU连接;所述GPU与Switch板卡连接;所述switch板卡包括PCIE扩展模块,所述PCIE扩展模块的输入端与CPU连接,输出端与GPU板卡连接。2.如权利要求1所述的通用GPU节点装置,其特征是,所述GPU通信模块包括6只NVLINKSwitch芯片;所述通信管理模块包括PEX8725芯片;每只GPU分别与6只NVLINKSwitch芯片的NVLINK接口连接;所述PEX8725芯片的上行PCIE接口与Switch板卡连接,下行PCIE接口分别与6只NVLINKSwitch芯片连接。3.如权利要求1所述的通用GPU节点装置,其特征是,所述PCIE扩展模块包括3个PEX9797芯片:PEX9797_1芯片、PEX9797_2芯片、PEX9797_3芯片,和1个PEX8749芯片;PEX9797_1芯片的port1和port2与CPU通信连接,port4和5分别连接PEX9797_2的port1口和PEX9797_3的port1口;port3和6外接两个标准的X16PCIEslot;PEX9797_2芯片的port1与PEX9797_1芯片通信,port2下接PEX8749芯片的port1口,port3至port6口分别挂接GPU板...

【专利技术属性】
技术研发人员:邓文博薛广营季冬冬
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1