模型训练环境的部署方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38591981 阅读:23 留言:0更新日期:2023-08-26 23:30
本申请提供了一种模型训练环境的部署方法、装置、电子设备及存储介质,其中,在模型训练环境的部署方法中,首先硬件集群环境,其中,所述硬件集群环境中集成了模型训练需要的各个硬件。然后制作环境容器镜像,生成镜像文件。接着将所述镜像文件复制到所述各个硬件,并加载所述镜像文件。创建所述镜像文件的配置文件。最后利用所述配置文件进行模型训练环境的部署。由此可知,利用本申请的方法,搭建硬件集群环境,对现有可用硬件资源进行统一管理和调度,提高资源利用率。利用容器化技术,创建应用程序的容器及容器镜像,通过镜像移植和配置文件自动创建容器实现应用程序环境的快速部署,并可实施监控环境的稳定性。并可实施监控环境的稳定性。并可实施监控环境的稳定性。

【技术实现步骤摘要】
模型训练环境的部署方法、装置、电子设备及存储介质


[0001]本申请涉及互联网
,尤其涉及一种模型训练环境的部署方法、装置、电子设备及存储介质。

技术介绍

[0002]随着人工智能的飞速发展,深度学习被广泛应用于日常生活中。这使得很多企业及研究机构在构建深度学习模型时越来越关注模型训练环境的快速部署、计算机资源的快速分配,充分利用可用资源,提高模型训练的效率,加快模型的开发速度。目前用于模型训练较多的Tensorflow环境部署和配置较为复杂,尤其是用于模型分布式训练的Tensorflow环境部署和配置耗时较长,严重影响模型研发和训练的进度。

技术实现思路

[0003]有鉴于此,本申请提供了一种模型训练环境的部署方法、装置、电子设备及存储介质,以解决现有技术中模型分布式训练的Tensorflow环境部署和配置耗时较长,严重影响模型研发和训练的进度的问题。
[0004]为实现上述目的,本申请提供如下技术方案:
[0005]本申请第一方面公开了一种模型训练环境的部署方法,包括:
[0006]硬件集群环境本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种模型训练环境的部署方法,其特征在于,包括:搭建硬件集群环境,其中,所述硬件集群环境中集成了模型训练需要的各个硬件;制作环境容器镜像,生成镜像文件;将所述镜像文件复制到所述各个硬件,并加载所述镜像文件;创建所述镜像文件的配置文件;利用所述配置文件进行模型训练环境的部署。2.根据权利要求1所述的方法,其特征在于,所述制作环境容器镜像,生成镜像文件之前,还包括:下载要训练的深度学习模型代码及对应数据集。3.根据权利要求1所述的方法,其特征在于,所述利用所述配置文件进行模型训练环境的部署,包括:基于所述配置文件,创建所述模型训练环境对应的容器;设置各个容器间的通信,进行所述模型训练环境的部署。4.根据权利要求1所述的方法,其特征在于,所述基于所述配置文件,创建所述模型训练环境对应的容器之后,还包括:对所述容器进行数据校验。5.一种模型训练环境的部署装置,其特征在于,包括:搭建单元,用于硬件集群环境,其中,所述硬件集群环境中集成了模型训练需要的各个硬件;制作单元,用于制作环境容器镜像,生成镜像文件...

【专利技术属性】
技术研发人员:王良帆
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1