一种计算系统、方法、设备、介质及程序产品技术方案

技术编号:43852024 阅读:25 留言:0更新日期:2024-12-31 18:43
本申请公开了计算机技术领域内的一种计算系统、方法、设备、介质及程序产品。本申请使内置以太网控制器的异构加速卡形成异构加速池,异构加速池通过以太网方式或远程直接数据存取方式,与以太网交换模块,而以太网交换模块连接计算资源池;计算资源池中的管理核能够管理至少一个异构加速池中的各加速卡、计算核与加速卡之间的绑定关系,并分发处理任务给至少一个异构加速池中的各加速卡,使得至少一个异构加速池中的各加速卡协同完成处理任务。其中,通过以太网方式或远程直接数据存取方式加速数据传输,不仅能够为任务的运行提供足够算力支持,还能够为任务的高速通信、大数据量传输提供高带宽和低延时,有利于模型训练任务的快速稳定运行。

【技术实现步骤摘要】

本申请涉及计算机,特别涉及一种计算系统、方法、设备、介质及程序产品


技术介绍

1、目前,模型训练需要海量算力的支撑,通常需要由大量的服务器作为节点,通过高速网络组成集群,服务器之间互联互通,相互协作完成任务。但是,大规模、长时间的模型训练任务,仅仅是单次计算迭代需要的通信量就达到了百gb量级,此外还有各种并行模式的通信需求。如果网络的带宽不够大、延时长,不仅会让算力边际递减,还增加了模型训练的时间成本。此外,大模型训练对时延和丢包要求也比较高。

2、因此,如何为模型训练任务构建相应的算力系统,是本领域技术人员需要解决的问题。


技术实现思路

1、有鉴于此,本申请的目的在于提供一种计算系统、方法、设备、介质及程序产品,以为模型训练任务构建相应的算力系统。其具体方案如下:

2、第一方面,本申请提供了一种计算系统,包括:计算资源池、至少一个异构加速池以及连接于所述计算资源池和所述至少一个异构加速池之间的以太网交换模块;

3、所述至少一个异构加速池包括:多个加速卡;各加速卡包括:以本文档来自技高网...

【技术保护点】

1.一种计算系统,其特征在于,包括:计算资源池、至少一个异构加速池以及连接于所述计算资源池和所述至少一个异构加速池之间的以太网交换模块;

2.根据权利要求1所述的计算系统,其特征在于,所述至少一个异构加速池中的各加速卡包括:金手指和电源连接器;所述金手指和所述电源连接器连接相应加速卡中的各器件,并为相应加速卡中的各器件供电。

3.根据权利要求2所述的计算系统,其特征在于,所述至少一个异构加速池中的各加速卡中的金手指和电源连接器,在相应加速卡开机启动过程中同时供电。

4.根据权利要求1所述的计算系统,其特征在于,所述至少一个异构加速池中的各加速卡中的以太...

【技术特征摘要】

1.一种计算系统,其特征在于,包括:计算资源池、至少一个异构加速池以及连接于所述计算资源池和所述至少一个异构加速池之间的以太网交换模块;

2.根据权利要求1所述的计算系统,其特征在于,所述至少一个异构加速池中的各加速卡包括:金手指和电源连接器;所述金手指和所述电源连接器连接相应加速卡中的各器件,并为相应加速卡中的各器件供电。

3.根据权利要求2所述的计算系统,其特征在于,所述至少一个异构加速池中的各加速卡中的金手指和电源连接器,在相应加速卡开机启动过程中同时供电。

4.根据权利要求1所述的计算系统,其特征在于,所述至少一个异构加速池中的各加速卡中的以太网控制器和相应加速卡中的运算核之间,连接有交换芯片;

5.根据权利要求1所述的计算系统,其特征在于,所述至少一个异构加速池中的各加速卡包括:同源时钟器件,所述同源时钟器件连接相应加速卡中的运算核、交换芯片和以太网控制器。

6.根据权利要求5所述的计算系统,其特征在于,所述至少一个异构加速池中的各加速卡包括:时钟发生器,所述时钟发生器连接于相应加速卡中的同源时钟器件与运算核之间、同源时钟器件与交换芯片之间、同源时钟器件与以太网控制器之间;

7.根据权利要求1所述的计算系统,其特征在于,所述至少一个异构加速池中的各加速卡包括:控制单元;所述控制单元用于实现相应加速卡中信息传输的时序控制。

8.根据权利要求1所述的计算系统,其特征在于,所述至少一个异构加速池中的各加速卡包括:链路选择器;所述链路选择器连接相应加速卡中的运算核、交换芯片、以太网控制器、同源时钟器件、电源器件和控制单元。

9.根据权利要求1所述的计算系统,其特征在于,所述以太网交换模块包括:至少一个交换机;所述至少一个交换机连接所述计算资源池和所述至少一个异构加速池。

<...

【专利技术属性】
技术研发人员:高显扬
申请(专利权)人:浪潮电子信息产业股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1