一种计算集群中架构重构方法、系统及存储介质技术方案

技术编号:43813117 阅读:19 留言:0更新日期:2024-12-27 13:28
本发明专利技术公开了一种计算集群中架构重构方法、系统及存储介质,涉及计算机技术领域。其中,应用于计算集群,计算集群至少包括集群管理节点和计算芯片,该方法包括:通过集群管理节点获取管理调度平台下发的集群切分指令;通过集群管理节点基于集群切分指令以及计算芯片的芯片标识信息确定目标计算芯片,将目标计算芯片的芯片标识信息反馈至管理调度平台;通过计算芯片响应于管理调度平台基于芯片标识信息下发的组网指令,基于目标计算芯片的芯片标识信息目标构建集群子系统。本发明专利技术实施例,实现对计算集群进行切分多个集群子系统,快速重构计算体系,以使计算集群并行计算多重任务,满足不同算力、业务场景需求,灵活适配,提升计算效率。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种计算集群中架构重构方法、系统及存储介质


技术介绍

1、随着人工智能、生物医药、新型材料研究领域的蓬勃发展,算力需求呈现爆发式的增长,特别是三维仿真计算方向的需求旺盛,需要大规模计算集群进行适配。

2、但是现有技术中,对于运行小计算量的任务也会独占算力,无法并行计算多个计算任务,不够灵活,造成计算任务堆积,降低了计算效率。故,如何在不改变硬件架构状态下将一个大计算系统可以划分为几个独立的子计算系统,避免一个计算任务占用一整套计算集群的资源成为了目前亟待解决的问题。


技术实现思路

1、本专利技术提供了一种计算集群中架构重构方法、系统及存储介质,以解决对于运行小计算量的任务也会独占算力,无法并行计算多个计算任务的问题。

2、根据本专利技术的一方面,提供了一种计算集群中架构重构方法,其中,应用于计算集群,所述计算集群至少包括集群管理节点和计算芯片,所述方法包括:

3、通过集群管理节点获取管理调度平台下发的集群切分指令;

4、通过集群管本文档来自技高网...

【技术保护点】

1.一种计算集群中架构重构方法,其特征在于,应用于计算集群,所述计算集群至少包括集群管理节点和计算芯片,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在通过集群管理节点获取管理调度平台下发的集群切分指令之前,还包括:

3.根据权利要求2所述的方法,其特征在于,通过计算芯片基于所述集群组网指令、所述芯片标识信息以及所述各轴向通信接口确定所述第一计算芯片之间的链路关系,包括:

4.根据权利要求1所述的方法,其特征在于,所述通过集群管理节点基于所述集群切分指令以及计算芯片的芯片标识信息确定目标计算芯片,将所述目标计算芯片的芯片标识信息反馈至所述管...

【技术特征摘要】

1.一种计算集群中架构重构方法,其特征在于,应用于计算集群,所述计算集群至少包括集群管理节点和计算芯片,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在通过集群管理节点获取管理调度平台下发的集群切分指令之前,还包括:

3.根据权利要求2所述的方法,其特征在于,通过计算芯片基于所述集群组网指令、所述芯片标识信息以及所述各轴向通信接口确定所述第一计算芯片之间的链路关系,包括:

4.根据权利要求1所述的方法,其特征在于,所述通过集群管理节点基于所述集群切分指令以及计算芯片的芯片标识信息确定目标计算芯片,将所述目标计算芯片的芯片标识信息反馈至所述管理调度平台,包括:

5.根据权利要求1所述的方法,其特征在于,所述通过计算芯片响应于所述管理调度平台基于所述芯片标识信息下发的组网指令,基于所述目标计算芯片的芯片标识信息目标构建集群子系统,包括:...

【专利技术属性】
技术研发人员:张伟冯岩相飞
申请(专利权)人:上海思朗万维计算技术有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1