【技术实现步骤摘要】
一种深度学习开发环境的构建方法、装置、设备及介质
本申请涉及人工智能
,特别涉及一种深度学习开发环境的构建方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着人工智能(AI)行业的蓬勃发展,AI应用所需的计算资源和数据资源越来越庞大。通常,AI应用多基于GPU集群构建,但随着集群规模的扩大,如何快速分配GPU计算资源以搭建AI训练环境成为了一个亟需解决的问题。当前业界中普遍由集群管理员手动分配资源、手动创建深度学习开发环境。由于GPU集群规模越来越过大,手动分配的复杂度和难度越来越大;并且现有技术中依赖虚拟机搭建AI环境受限较多,使得手工操作工作量大、过程繁琐、灵活性差。鉴于此,提供一种解决上述技术问题的方案,已经是本领域技术人员所亟需关注的。
技术实现思路
本申请的目的在于提供一种深度学习开发环境的构建方法、装置、电子设备及计算机可读存储介质,以便在大规模GPU集群中快速有效地搭建深度学习开发环境,减轻开发人员工作量并提高工作效率。为解决上述技术问题,第一方面,本申请公开了一 ...
【技术保护点】
1.一种深度学习开发环境的构建方法,其特征在于,包括:/n接收输入的硬件资源设置参数和深度学习训练框架类型;/n基于预设的开发环境调度系统,根据所述硬件资源设置参数为所述深度学习开发环境分配硬件资源,获取并加载对应类型的深度学习训练框架容器镜像;/n基于所述开发环境调度系统,加载与硬件资源适配的驱动,启动所述深度学习开发环境。/n
【技术特征摘要】
1.一种深度学习开发环境的构建方法,其特征在于,包括:
接收输入的硬件资源设置参数和深度学习训练框架类型;
基于预设的开发环境调度系统,根据所述硬件资源设置参数为所述深度学习开发环境分配硬件资源,获取并加载对应类型的深度学习训练框架容器镜像;
基于所述开发环境调度系统,加载与硬件资源适配的驱动,启动所述深度学习开发环境。
2.根据权利要求1所述的深度学习开发环境的构建方法,其特征在于,所述硬件资源设置参数包括CPU数和GPU数。
3.根据权利要求1所述的深度学习开发环境的构建方法,其特征在于,所述获取并加载对应类型的深度学习训练框架容器镜像,包括:
判断本地是否存在对应类型的深度学习训练框架容器镜像;
若有,则加载本地的所述深度学习训练框架容器镜像;
若无,则从预设docker容器镜像管理仓库中获取并加载所述深度学习训练框架容器镜像。
4.根据权利要求1所述的深度学习开发环境的构建方法,其特征在于,所述加载与硬件资源适配的驱动,包括:
通过预设docker驱动映射程序加载与硬件资源适配的驱动。
5.根据权利要求1所述的深度学习开发环境的构建方法,其特征在于,在所述启动所述深度学习开发环境之后,还包括:
启动...
【专利技术属性】
技术研发人员:袁绍,
申请(专利权)人:浪潮北京电子信息产业有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。