【技术实现步骤摘要】
算力卸载方法、装置、电子设备和存储介质
[0001]本专利技术涉及计算机
,尤其涉及一种算力卸载方法、装置、电子设备和存储介质。
技术介绍
[0002]随着神经网络、深度学习、云计算的飞速发展,算网进一步融合,算力资源需要在网络中尽可能实现互联互通,以中央处理器(全称central processing unit,简称CPU)为代表的传统算力资源已经远远不够满足如此庞大的算力需求。因此,亟需一种能够节省中央处理器算力开销的算力卸载方法。
技术实现思路
[0003]本专利技术提供一种算力卸载方法、装置、电子设备和存储介质,实现节省中央处理器算力开销。
[0004]本专利技术提供一种算力卸载方法,应用于控制主服务器,所述方法包括:控制驱动模块向智能网卡发送连接信息;控制所述智能网卡基于所述连接信息与所述驱动模块进行数据交互,以绕过中央处理器的控制实现所述智能网卡与所述驱动模块进行数据交互;控制容器管理器确定容器创建脚本;控制所述容器管理器基于所述容器创建脚本,将容器创建在异构硬件上,以实现所述中央处 ...
【技术保护点】
【技术特征摘要】
1.一种算力卸载方法,应用于控制主服务器,其特征在于,所述方法包括:控制驱动模块向智能网卡发送连接信息;控制所述智能网卡基于所述连接信息与所述驱动模块进行数据交互,以绕过中央处理器的控制实现所述智能网卡与所述驱动模块进行数据交互;控制容器管理器确定容器创建脚本;控制所述容器管理器基于所述容器创建脚本,将容器创建在异构硬件上,以实现所述中央处理器的算力资源分配;其中,所述容器创建脚本包括所述容器的参数配置和所述容器在所述异构硬件上的创建位置信息;所述异构硬件表征与所述中央处理器结构相异的硬件。2.根据权利要求1所述的算力卸载方法,其特征在于,所述控制所述智能网卡基于所述连接信息与所述驱动模块进行数据交互,包括:控制所述智能网卡基于所述连接信息完成与所述驱动模块的通信连接,并控制所述驱动模块通过轮询模式基于数据包与所述智能网卡进行数据交互。3.根据权利要求1所述的算力卸载方法,其特征在于,所述方法还包括:控制所述容器管理器确定所述容器创建脚本不包括所述创建位置信息时,控制主调度器根据当前各个异构硬件的算力资源,查找所述算力资源小于设定阈值的目标异构硬件,并将所述容器创建在所述目标异构硬件上。4.一种算力卸载方法,应用于控制可编程交换机,其特征在于,所述方法包括:接收智能网卡发送的数据包;所述数据包是所述智能网卡与驱动模块进行数据交互得到的;所述智能网卡和所述驱动模块分别设于主服务器上;发送所述数据包至多个工作服务器进行分布式训练;在所述多个工作服务器的分布式训练中进行参数处理。5.根据权利要求4所述的算力卸载方法,其特征在于,所述在所述多个工作服务器的分布式训练中进行参数处理,包括:存储所述多个工作服务器在分布式训练中的返回参数;和/或,基于所述多个工作服务器在分布式训练中的返回参数进行聚合计算。6.根据权利要求4所述的算力卸载方法,其特征在于,所述方法还包括:向多个工作服务器发送数据包过程中,获取所述数...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。