【技术实现步骤摘要】
本专利技术涉及计算机科学人工智能和云计算领域,尤其涉及一种基于强化学习的跨域云平台神经网络训练任务调度方法。
技术介绍
1、随着人工智能云计算技术的不断发展,越来越多的企业和组织开始将他们的ai应用程序迁移到云端。然而,由于不同云平台之间的差异和限制,跨云平台ai应用程序调度变得越来越重要。
2、在传统的本地部署环境中,企业可以选择使用单个云平台(如aws、azure、googlecloud等)来运行和管理他们的ai应用程序。这种方法可以提供更高的灵活性和可扩展性,但也存在一些限制,例如:
3、1.单一云平台的资源利用率可能不够高,导致成本过高。
4、2.不同云平台之间的数据传输和同步可能会带来额外的时间和成本开销。
5、3.当需要在多个云平台上部署相同的应用程序时,需要手动进行重复的工作。
6、为了解决这些问题,跨云平台ai应用程序调度应运而生。跨云平台ai应用程序调度是指在一个统一的管理平台上管理和调度多个云平台上的ai应用程序。通过跨云平台ai应用程序调度,企业可以更好地
...【技术保护点】
1.一种基于强化学习的跨域云平台神经网络训练任务调度方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述步骤一中,还包括:将实时获取的用户提交的神经网络训练任务构建成任务队列。
3.根据权利要求1所述的方法,其特征在于,所述步骤三中,浮点数计算总数FLOAPS通过如下公式计算获取:
4.根据权利要求1所述的方法,其特征在于,所述步骤四中,采用启发式或者经验法预测需要的GPU数目。
5.根据权利要求1所述的方法,其特征在于,所述步骤五中,训练时间预估方法具体如下:使用用户提交的神经网络训练任务中
...【技术特征摘要】
1.一种基于强化学习的跨域云平台神经网络训练任务调度方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述步骤一中,还包括:将实时获取的用户提交的神经网络训练任务构建成任务队列。
3.根据权利要求1所述的方法,其特征在于,所述步骤三中,浮点数计算总数floaps通过如下公式计算获取:
4.根据权利要求1所述的方法,其特征在于,所述步骤四中,采用启发式或者经验法预测需要的gpu数目。
5.根据权利要求1所述的方法,其特征在于,所述步骤五中,训练时间预估方法具体如下:使用用户提交的神经网络训练任务中的模型及参数进行若干个训练周期的预训练,收集除第一个训练周期以外其他训练周期需要的时间计算平均值,在将平均值乘以提取的训练信息中的训练周期数,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。