【技术实现步骤摘要】
阵列服务器算力集群方法、控制模块、阵列服务器和介质
[0001]本申请属于数据处理
,特别是涉及一种阵列服务器算力集群方法、控制模块、阵列服务器和介质。
技术介绍
[0002]阵列服务器中包含多个处理模块以提供算力。每个处理模块都具体包括有CPU算力(Central Processing Unit,中央处理器)、GPU算力(Graphics Processing Unit,图形处理器)、NPU算力(Neural Network Processing Unit,神经网络处理器)、VPU算力(Vedio Processing Unit,视频处理器)等。目前每一个处理模块都是各自运行独立的系统,每一个处理模块都是作为一个个体在使用。可以理解的是,作为个体使用时算力有上限,而AI算力集群需求在过去6年增长30万倍,单节点已无法满足AI算力要求。如何充分利用阵列服务器中处理模块的算力,是本领域技术人员亟待解决的技术问题。
[0003]前面的叙述在于提供一般的背景信息,并不一定构成现有技术。
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.一种阵列服务器算力集群方法,应用于阵列服务器中的控制模块,其特征在于,包括如下步骤:获取运行信息和包括算力集群需求的数据包,所述运行信息用于表明所述阵列服务器中处理模块的运行情况;根据所述算力集群需求和所述运行信息确定集群模式;根据所述集群模式控制将所述数据包划分为多个子包,并发送至多个所述处理模块中进行处理;汇总所述处理模块的处理结果并输出。2.如权利要求1所述的阵列服务器算力集群方法,其特征在于,所述算力集群需求包括算力大小需求,所述运行信息包括空闲模块数量和所述处理模块的剩余算力;所述根据所述算力集群需求和所述运行信息确定集群模式,包括:若所述算力大小需求大于所述剩余算力,则匹配第一集群模式,所述第一集群模式用于将所述数据包划分为多个第一子包,所述第一子包用于优先填满所述剩余算力最大的所述处理模块;若所述算力大小需求小于或等于所述剩余算力,且所述空闲模块数量小于预设数量,则匹配第二集群模式,所述第二集群模式用于将所述数据包划分为多个第二子包,所述第二子包用于平均每个所述处理模块的所述剩余算力;若所述算力大小需求小于或等于所述剩余算力,且所述空闲模块数量大于预设数量,则匹配第三集群模式,所述第三集群模式用于将所述数据包划分为大小均等的多个第三子包,所述第三子包用于优先填满剩余算力最大的所述处理模块。3.如权利要求1所述的阵列服务器算力集群方法,其特征在于,所述算力集群需求包括至少一项算力能力需求,所述算力能力需求表明所述数据包需要执行的处理任务,所述算力能力需求包括数据处理需求、图形处理需求、视频处理需求、神经网络处理需求中的一项;所述处理模块包括多个算力处理器,所述算力处理器用于完成对应的处理任务,所述算力处理器包括:中央处理器、图形处理器、视频处理器、神经网络处理器;所述根据所述算力集群需求和所述运行信息确定集群模式,包括:根据所述算力能力需求确定所述数据包将要分发的所述算力处理器,以确定所述集群模式。4.如权利要求3所述的阵列服务器算力集群方法,其特征在于,当所述算力能力需求包括所述神经网络处理需求时,所述根据所述集群模式将所述数据包划分为多个子包,并发送至多个所述处理模块中进行处理,包括:控制所述处理模块...
【专利技术属性】
技术研发人员:吴大鹏,张定乾,
申请(专利权)人:启朔深圳科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。