【技术实现步骤摘要】
本申请涉及计算机,尤其涉及一种gpu热插拔方法和服务器系统。
技术介绍
1、数据中心是一个用于集中管理和处理大量计算任务、存储数据、以及提供网络服务的专门设施。它承载了大量工作负载,给现有基础设施带来了压力,并加速了升级需求。为了满足这种需求,分解和可组合架构的发展日益受到推动。这些架构利用计算、内存、存储和硬件加速的池化资源,以更高效地满足各种需求。人工智能服务器是基于先进池化理念,采用业界领先的pcie架构,搭载gpu扩展板的高端服务器。
2、人工智能服务器整机通常由机箱、pcba板、电源、风扇、gpu卡、网卡、nvme盘等多个部件组成。在维护过程中,通常要求不下架服务器。为此,人工智能服务器采用了模组化设计,使得模组能够快速拆卸和替换,从而提高了维护的效率和便捷性。
3、但是,现有技术中,在人工智能服务器中的个别gpu槽位发生故障时,为对其进行维修,需要在整机断电、中断业务的情况下才能维修发生故障的槽位,这不仅导致业务中断,还增加了维护工作的难度,效率较低。
技术实现思路
1、有本文档来自技高网...
【技术保护点】
1.一种服务器系统,其特征在于,所述服务器系统包括主板、以及与所述主板连接的扩展板;所述扩展板包括BMC、PCIE交换机、CPLD、电源组件、N个GPU、N个电压调节器和N个IO扩展器;其中,
2.根据权利要求1所述的服务器系统,其特征在于,所述CPLD,还用于在通过所述BMC接收到针对插入GPU的插入指令时,根据所述插入指令,确定与所述插入GPU连接的第二目标IO扩展器,并通过所述第二目标IO扩展器向所述PCIE交换机发送插入通知;
3.根据权利要求2所述的服务器系统,其特征在于,所述第二目标IO扩展器,还用于在使所述插入GPU上电后,通过所
...【技术特征摘要】
1.一种服务器系统,其特征在于,所述服务器系统包括主板、以及与所述主板连接的扩展板;所述扩展板包括bmc、pcie交换机、cpld、电源组件、n个gpu、n个电压调节器和n个io扩展器;其中,
2.根据权利要求1所述的服务器系统,其特征在于,所述cpld,还用于在通过所述bmc接收到针对插入gpu的插入指令时,根据所述插入指令,确定与所述插入gpu连接的第二目标io扩展器,并通过所述第二目标io扩展器向所述pcie交换机发送插入通知;
3.根据权利要求2所述的服务器系统,其特征在于,所述第二目标io扩展器,还用于在使所述插入gpu上电后,通过所述复位信号线向所述插入gpu发送复位信号,以使得所述插入gpu复位;
4.根据权利要求1所述的服务器系统,其特征在于,所述n个io扩展器中的每个io扩展器...
【专利技术属性】
技术研发人员:邱多,何立权,尹吉达,林韦成,万大炎,俞跃渊,
申请(专利权)人:安擎计算机信息股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。