【技术实现步骤摘要】
本申请涉及计算机,尤其涉及一种设备配置回归方法及相关装置。
技术介绍
1、随着人工智能(artificial intelligence,ai)技术的不断发展,ai模型在很多业务中被广泛应用;并且随着业务对相关服务的要求的提高,参数量大、性能优良的ai大模型逐渐兴起。由于ai大模型的训练参数量大,并且训练过程中交换数据的规模量高,因此需要使用算力规模大的计算设备执行此类训练任务,此类计算设备的单机配置普遍较高,且使用成本较高。
2、为了使上述计算设备的算力资源得到充分利用,避免因算力空闲而产生成本浪费,往往需要在此类计算设备上实现算力资源的共享流转,即在利用计算设备完成对于某ai模型的训练任务后,继续利用该计算设备的算力资源执行其它的ai模型的训练任务。
3、然而,训练不同ai模型时依赖的基础环境配置可能不同,且不同的基础环境配置可能会干扰其它ai模型的正常训练。因此,如何在实现计算设备的算力资源的共享流转时,避免使之前训练ai模型时的基础环境配置对之后将要执行的ai模型训练任务产生影响,是目前亟待解决的问题。
...【技术保护点】
1.一种设备配置回归方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述参考网络配置信息是根据基于所述原始的网络参数的配置信息执行的网络调优操作确定的,所述参考网络配置信息包括各个网络配置项各自对应的固化配置信息、以及至少一个网络配置项对应的暂存配置信息,所述暂存配置信息是通过历史的所述网络调优操作确定的能够优化网络性能的配置信息;
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,在所述将所述目标计算设备中目标容器对应的目标容器配置信息和所述基础容器配
...【技术特征摘要】
1.一种设备配置回归方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述参考网络配置信息是根据基于所述原始的网络参数的配置信息执行的网络调优操作确定的,所述参考网络配置信息包括各个网络配置项各自对应的固化配置信息、以及至少一个网络配置项对应的暂存配置信息,所述暂存配置信息是通过历史的所述网络调优操作确定的能够优化网络性能的配置信息;
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,在所述将所述目标计算设备中目标容器对应的目标容器配置信息和所述基础容器配置信息进行对比前,所述方法还包括:
5.根据权利要求1或4所述的方法,其特征在于,所...
【专利技术属性】
技术研发人员:查冲,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。