【技术实现步骤摘要】
本专利技术涉及人工智能,特别是涉及一种异构计算系统及其训练耗时预测方法、设备、介质、产品。
技术介绍
1、随着人工智能技术的快速发展,神经网络模型的规模越来越大,受限于计算资源和存储资源的大量需求,执行大规模神经网络模型的训练任务的计算设备要求也越来越高。
2、为了高效完成大规模神经网络模型的训练任务,相关技术会在异构计算系统上部署需要执行的任务,然后根据该任务和异构计算系统的计算能力预测异构计算系统在单个训练迭代的计算耗时。但是,这种方法无法在不实际部署执行训练的情况下进行耗时预测,且耗时预测的精度不高。
3、鉴于此,在异构计算系统不实际部署训练任务的基础上,实现对待部署训练任务的单次迭代训练耗时的高精度预测。
4、需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
1、本专利技术提供了一种异构计算系统及其训练耗时预测方法、电子设备、非易失性存储介质、计算
...【技术保护点】
1.一种异构计算系统训练耗时预测方法,其特征在于,包括:
2.根据权利要求1所述的异构计算系统训练耗时预测方法,其特征在于,基于待训练网络模型的各神经层在单次迭代训练过程中的工作流程,包括:
3.根据权利要求2所述的异构计算系统训练耗时预测方法,其特征在于,所述训练任务执行图包括前传执行图和反传执行图,根据各神经层在一次训练迭代过程中的工作流程,生成训练任务执行图,包括:
4.根据权利要求3所述的异构计算系统训练耗时预测方法,其特征在于,预测各神经层的计算量和内存读取量,包括:
5.根据权利要求1所述的异构计算系统训练耗
...【技术特征摘要】
1.一种异构计算系统训练耗时预测方法,其特征在于,包括:
2.根据权利要求1所述的异构计算系统训练耗时预测方法,其特征在于,基于待训练网络模型的各神经层在单次迭代训练过程中的工作流程,包括:
3.根据权利要求2所述的异构计算系统训练耗时预测方法,其特征在于,所述训练任务执行图包括前传执行图和反传执行图,根据各神经层在一次训练迭代过程中的工作流程,生成训练任务执行图,包括:
4.根据权利要求3所述的异构计算系统训练耗时预测方法,其特征在于,预测各神经层的计算量和内存读取量,包括:
5.根据权利要求1所述的异构计算系统训练耗时预测方法,其特征在于,获取异构计算系统为满足所述用户训练方案数据,提供的资源最大供给数据,包括:
6.根据权利要求5所述的异构计算系统训练耗时预测方法,其特征在于,通过解析待部署训练任务对应的用户训练方案数据,确定训练精度、用户执行所述待部署训练任务需求的目标内存及目标计算单元,包括:
7.根据权利要求1至6任意一项所述的异构计算系统训练耗时预测方法,其特征在于,分别预测各神经层的计算量和内存读取量,包括:
8.根据权利要求7所述的异构计算系统训练耗时预测方法,其特征在于,根据所述待训练网络模型的各神经层在一次迭代训练过程中所处的计算阶段及计算类型,确定...
【专利技术属性】
技术研发人员:唐轶男,郭振华,高开,李晓川,杜国光,刘璐,贾麒,张洪伟,
申请(专利权)人:山东海量信息技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。