多类型GPU混合计算平台的硬件设备制造技术

技术编号:20208000 阅读:51 留言:0更新日期:2019-01-25 23:23
本实用新型专利技术涉及多类型GPU混合计算平台的硬件设备,1080TI GPU服务器、TitanXP GPU服务器、V100 GPU服务器连接Infiniband交换机;数据预处理服务器、1080TI GPU服务器、TitanXP GPU服务器、V100 GPU服务器、集中式存储服务器、分布式存储服务器连接万兆交换机;管理登录服务器、数据预处理服务器、1080TI GPU服务器、TitanXP GPU服务器、V100 GPU服务器、集中式存储服务器、分布式存储服务器连接千兆交换机。利用Infiniband网络实现物理意义上显存共享;大型数据计算分析时,调用多台服务器和多GPU共同完成。

【技术实现步骤摘要】
多类型GPU混合计算平台的硬件设备
本技术涉及一种多类型GPU混合计算平台的硬件设备。
技术介绍
目前,根据业务需求,为科研用户提供GPU为主的计算服务和多种类的数据服务。用户通过认证后,可登录到系统门户网站,在其中提交训练任务至调度服务器,由调度服务器配置相应资源,执行任务。系统配备存储设备,用于放置数据。有两类主要需求:一是多样化的数据集访问,用户在某些数据集上试验其算法,模型在计算过程中不断地从存储设备中获取分批数据,同时,也存在多个用户读取同一数据集的情况,随学习训练任务的不同,数据集的种类繁多,大文件、小文件均有可能,该部分的存储需求预计在800TB左右;二是使用用户较少,但大容量的脑图谱科研数据,支撑脑科学研究,预计在1.2PB左右,以小文件形式组织形成4TB一套的数据。
技术实现思路
本技术的目的是克服现有技术存在的不足,提供一种多类型GPU混合计算平台的硬件设备。本技术的目的通过以下技术方案来实现:多类型GPU混合计算平台的硬件设备,特点是:包含管理登录服务器、数据预处理服务器、1080TIGPU服务器、TitanXPGPU服务器、V100GPU服务器、集中式存储服务器、分布式存储服务器、Infiniband交换机、万兆交换机以及千兆交换机,所述1080TIGPU服务器、TitanXPGPU服务器、V100GPU服务器分别连接Infiniband交换机;所述数据预处理服务器、1080TIGPU服务器、TitanXPGPU服务器、V100GPU服务器、集中式存储服务器、分布式存储服务器分别连接万兆交换机;所述管理登录服务器、数据预处理服务器、1080TIGPU服务器、TitanXPGPU服务器、V100GPU服务器、集中式存储服务器、分布式存储服务器分别连接千兆交换机。进一步地,上述的多类型GPU混合计算平台的硬件设备,其中,所述管理登录服务器是型号为XP-22301EN的服务器。进一步地,上述的多类型GPU混合计算平台的硬件设备,其中,所述数据预处理服务器是型号为XP-22301EN的服务器。进一步地,上述的多类型GPU混合计算平台的硬件设备,其中,所述1080TIGPU服务器是型号为XP-48201G的服务器。进一步地,上述的多类型GPU混合计算平台的硬件设备,其中,所述TitanXPGPU服务器是型号为XP-48201G的服务器。进一步地,上述的多类型GPU混合计算平台的硬件设备,其中,所述V100GPU服务器是型号为GMAX-1V的服务器。进一步地,上述的多类型GPU混合计算平台的硬件设备,其中,所述集中式存储服务器是型号为XP-42301ST的服务器。进一步地,上述的多类型GPU混合计算平台的硬件设备,其中,所述分布式存储服务器是型号为XP-22301ST的服务器。进一步地,上述的多类型GPU混合计算平台的硬件设备,其中,所述Infiniband交换机是型号为MSB7700-ES2F的交换机。进一步地,上述的多类型GPU混合计算平台的硬件设备,其中,所述万兆交换机是型号为S6720-54C-EI-48S-AC的交换机,千兆交换机是型号为S5700-52X-LI-AC的交换机。本技术与现有技术相比具有显著的优点和有益效果,具体体现在以下方面:多类型GPU混合计算平台的硬件设备的V100GPU服务器主要考虑大显存数据计算场景,包含大规模科学计算需求,不可切分的数据集训练等;TitanXPGPU服务器在做单卡训练时有得天独厚的优势,可以将多个独立训练场景分别放到TitanXPGPU服务器中进行训练,有效提高深度学习的训练效率,1080TIGPU服务器拥有庞大的数量体系,可以提供400多片GPU应用,可以满足几百人独立使用。存储服务器分为分布式存储和集中式存储。计算网络采用Infiniband交换机,管理网络采用万兆交换机,远程IPMI网络采用千兆交换机。通过NVIDIARDMA技术以及GPUDirector技术,利用Infiniband网络实现物理意义上显存共享;大型数据计算分析时,调用多台服务器和多GPU共同完成,需要完成多类型数据计算分析时,将多个任务分配给不同服务器,实现多模型训练的并发进行。本技术的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本技术具体实施方式了解。本技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。附图说明为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1:本技术的架构示意图。图中各附图标记的含义见下表:具体实施方式下面将结合本技术实施例中附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本技术的描述中,方位术语和次序术语等仅用于区分描述,而不能理解为指示或暗示相对重要性。如图1所示,多类型GPU混合计算平台的硬件设备,包含管理登录服务器1、数据预处理服务器2、1080TIGPU服务器3、TitanXPGPU服务器4、V100GPU服务器5、集中式存储服务器6、分布式存储服务器7、Infiniband交换机8、万兆交换机9以及千兆交换机10,1080TIGPU服务器3、TitanXPGPU服务器4、V100GPU服务器5分别连接Infiniband交换机8;数据预处理服务器2、1080TIGPU服务器3、TitanXPGPU服务器4、V100GPU服务器5、集中式存储服务器6、分布式存储服务器7分别连接万兆交换机9;管理登录服务器1、数据预处理服务器2、1080TIGPU服务器3、TitanXPGPU服务器4、V100GPU服务器5、集中式存储服务器6、分布式存储服务器7分别连接千兆交换机10。管理登录服务器1是型号为XP-22301EN的服务器。独立的管理登录节点能更有效的管理集群的使用成员,可对集群使用者进行分组,可以分别不同的集群资源给不同的组别使用。集中管理登陆者的信息,优化使用环境。通过千兆交换机10管理集群。数据预处理服务器2是型号为XP-22301EN的服务器。采用2U机架式服务器,可以根据需求,调整PCIe插槽的数量,带宽模式,还能进行不同电源的更改,最大可以支持2片GPU产品应用,为数据密集型客户增加单节点计算能力提供便捷。数据交互是通过万兆交换机本文档来自技高网...

【技术保护点】
1.多类型GPU混合计算平台的硬件设备,其特征在于:包含管理登录服务器(1)、数据预处理服务器(2)、1080TI GPU服务器(3)、TitanXP GPU服务器(4)、V100 GPU服务器(5)、集中式存储服务器(6)、分布式存储服务器(7)、Infiniband交换机(8)、万兆交换机(9)以及千兆交换机(10),所述1080TI GPU服务器(3)、TitanXP GPU服务器(4)、V100 GPU服务器(5)分别连接Infiniband交换机(8);所述数据预处理服务器(2)、1080TI GPU服务器(3)、TitanXP GPU服务器(4)、V100 GPU服务器(5)、集中式存储服务器(6)、分布式存储服务器(7)分别连接万兆交换机(9);所述管理登录服务器(1)、数据预处理服务器(2)、1080TI GPU服务器(3)、TitanXP GPU服务器(4)、V100 GPU服务器(5)、集中式存储服务器(6)、分布式存储服务器(7)分别连接千兆交换机(10)。

【技术特征摘要】
1.多类型GPU混合计算平台的硬件设备,其特征在于:包含管理登录服务器(1)、数据预处理服务器(2)、1080TIGPU服务器(3)、TitanXPGPU服务器(4)、V100GPU服务器(5)、集中式存储服务器(6)、分布式存储服务器(7)、Infiniband交换机(8)、万兆交换机(9)以及千兆交换机(10),所述1080TIGPU服务器(3)、TitanXPGPU服务器(4)、V100GPU服务器(5)分别连接Infiniband交换机(8);所述数据预处理服务器(2)、1080TIGPU服务器(3)、TitanXPGPU服务器(4)、V100GPU服务器(5)、集中式存储服务器(6)、分布式存储服务器(7)分别连接万兆交换机(9);所述管理登录服务器(1)、数据预处理服务器(2)、1080TIGPU服务器(3)、TitanXPGPU服务器(4)、V100GPU服务器(5)、集中式存储服务器(6)、分布式存储服务器(7)分别连接千兆交换机(10)。2.根据权利要求1所述的多类型GPU混合计算平台的硬件设备,其特征在于:所述管理登录服务器(1)是型号为XP-22301EN的服务器。3.根据权利要求1所述的多类型GPU混合计算平台的硬件设备,其特征在于:所述数据预处理服务器(2...

【专利技术属性】
技术研发人员:李宇歌
申请(专利权)人:苏州超集信息科技有限公司
类型:新型
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1