【技术实现步骤摘要】
深度学习训练平台的训练日志可视化系统、方法及设备
本专利技术涉及计算机
,特别是涉及一种深度学习训练平台的训练日志可视化系统、方法及设备。
技术介绍
容器集群是一种将多台物理机抽象为逻辑上单一容器的技术,是一种比虚拟机技术更加节省计算资源,也更加灵活的虚拟化技术。而随着互联网应用的高速发展,通过容器集群来实现用户应用也越来越常见。Kubernetes是常用的开源的容器集群管理系统,用于管理云平台中多个主机上的容器化的应用,可以为容器化的应用提供部署运行、资源调度、服务发现和动态伸缩等一系列完整功能。深度学习的算法人员可以在云平台中对训练模型进行训练,即在云平台中运行训练任务。但是,深度学习的算法人员只能获取到经过训练之后的训练模型,而在实际应用中,部分算法人员可能还需要训练过程中产生的日志数据,从而进行训练模型的分析改进。但由于目前的云平台中,深度学习的算法人员只能获取到经过训练之后的训练模型,因此无法满足部分算法人员获取训练日志的这一需求。综上所述,如何有效地向用户提供训练日志,是目前本领域技术人员急 ...
【技术保护点】
1.一种深度学习训练平台的训练日志可视化系统,其特征在于,包括:/n工具选取模块,用于在接收到针对目标训练任务的第一可视化请求时,选取对应于所述目标训练任务的预设的可视化工具;/n工具加载模块,用于创建目标资源,在所述目标资源上加载选取出的所述可视化工具,并暴露出所述目标资源的定位地址;/n可视化展示模块,用于在接收到针对所述目标训练任务的第二可视化请求时,通过所述定位地址启用所述可视化工具,将所述目标训练任务的训练日志进行显示。/n
【技术特征摘要】
1.一种深度学习训练平台的训练日志可视化系统,其特征在于,包括:
工具选取模块,用于在接收到针对目标训练任务的第一可视化请求时,选取对应于所述目标训练任务的预设的可视化工具;
工具加载模块,用于创建目标资源,在所述目标资源上加载选取出的所述可视化工具,并暴露出所述目标资源的定位地址;
可视化展示模块,用于在接收到针对所述目标训练任务的第二可视化请求时,通过所述定位地址启用所述可视化工具,将所述目标训练任务的训练日志进行显示。
2.根据权利要求1所述的深度学习训练平台的训练日志可视化系统,其特征在于,还包括:
资源释放模块,用于在检测出释放条件成立时,删除所述目标资源。
3.根据权利要求2所述的深度学习训练平台的训练日志可视化系统,其特征在于,所述释放条件为发送所述第一可视化请求的用户处于离线状态。
4.根据权利要求2所述的深度学习训练平台的训练日志可视化系统,其特征在于,所述释放条件为发送所述第一可视化请求的用户处于离线状态,且离线时长大于预设的时长阈值。
5.根据权利要求1所述的深度学习训练平台的训练日志可视化系统,其特征在于,所述工具加载模块,具体用于:
创建pod作为目标资源,在所述目标资源上加载选取出的所述可视化工具,并建立与所述目标资源绑定的kubernetes服务,通过所述kubernetes服务暴...
【专利技术属性】
技术研发人员:王文潇,
申请(专利权)人:广东浪潮大数据研究有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。