一种设备配置回归方法及相关装置制造方法及图纸

技术编号:43922540 阅读:60 留言:0更新日期:2025-01-03 13:26
本申请实施例公开了一种设备配置回归方法及相关装置,首先获取基础容器配置信息、基础系统配置信息和参考网络配置信息;然后基于基础容器配置信息对目标计算设备中的目标容器进行容器配置回归处理,基于基础系统配置信息对目标计算设备的系统参数配置进行系统配置回归处理,基于参考网络配置信息对目标计算设备的网络参数配置进行网络配置回归处理。如此,在目标计算设备进行算力共享流转前,将目标计算设备的容器环境配置、系统参数配置和网络参数配置均回归至对应的初始状态,从而避免此前在目标计算设备上执行的AI训练任务的基础环境配置对此后执行的AI训练任务产生干扰;可以更高效地还原目标计算设备的相关配置,减少算力资源的损失。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种设备配置回归方法及相关装置


技术介绍

1、随着人工智能(artificial intelligence,ai)技术的不断发展,ai模型在很多业务中被广泛应用;并且随着业务对相关服务的要求的提高,参数量大、性能优良的ai大模型逐渐兴起。由于ai大模型的训练参数量大,并且训练过程中交换数据的规模量高,因此需要使用算力规模大的计算设备执行此类训练任务,此类计算设备的单机配置普遍较高,且使用成本较高。

2、为了使上述计算设备的算力资源得到充分利用,避免因算力空闲而产生成本浪费,往往需要在此类计算设备上实现算力资源的共享流转,即在利用计算设备完成对于某ai模型的训练任务后,继续利用该计算设备的算力资源执行其它的ai模型的训练任务。

3、然而,训练不同ai模型时依赖的基础环境配置可能不同,且不同的基础环境配置可能会干扰其它ai模型的正常训练。因此,如何在实现计算设备的算力资源的共享流转时,避免使之前训练ai模型时的基础环境配置对之后将要执行的ai模型训练任务产生影响,是目前亟待解决的问题。p>

本文档来自技高网...

【技术保护点】

1.一种设备配置回归方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述参考网络配置信息是根据基于所述原始的网络参数的配置信息执行的网络调优操作确定的,所述参考网络配置信息包括各个网络配置项各自对应的固化配置信息、以及至少一个网络配置项对应的暂存配置信息,所述暂存配置信息是通过历史的所述网络调优操作确定的能够优化网络性能的配置信息;

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,在所述将所述目标计算设备中目标容器对应的目标容器配置信息和所述基础容器配置信息进行对比前,所...

【技术特征摘要】

1.一种设备配置回归方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述参考网络配置信息是根据基于所述原始的网络参数的配置信息执行的网络调优操作确定的,所述参考网络配置信息包括各个网络配置项各自对应的固化配置信息、以及至少一个网络配置项对应的暂存配置信息,所述暂存配置信息是通过历史的所述网络调优操作确定的能够优化网络性能的配置信息;

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,在所述将所述目标计算设备中目标容器对应的目标容器配置信息和所述基础容器配置信息进行对比前,所述方法还包括:

5.根据权利要求1或4所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:查冲
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1