【技术实现步骤摘要】
一种基于Kubernetes的集群负载调节方法及存储介质
本专利技术涉及深度学习领域,特别涉及一种基于Kubernetes的集群负载调节方法及存储介质。
技术介绍
深度学习的发展为计算机领域的传统问题带来了新的解决方式,它作为学术界的热点议题、工业界的全新机遇,已经受到高度重视与广泛支持。作为执行算法训练、优化网络模型的基础设施,构建实现数据处理与模型训练的深度学习平台已具有重要意义与研究价值。传统的进行深度学习训练的方法主要是个人或组织购置硬件设施、在电脑或服务器上配置相应的深度学习环境、在构建完成的环境中直接进行训练工作。这一系列的步骤在经济与经验上都具有较高的门槛,难以面向各行各业进行推广,为大众开展深度学习的研发工作提供了不少障碍。对于高校而言,实验室团队往往已经配备一定规模的服务器集群,但学生需要自己手动开展环境配置工作,不仅入门难度较高,还容易对他人的实验环境造成影响。近年来,各大云服务商逐渐开始研发、推出深度学习平台,它们大多能为用户带来训练上的便捷,但对高校实验室多团队协作开发这一应用场景的适应性较差 ...
【技术保护点】
1.一种基于Kubernetes的集群负载调节方法,其特征在于,包括以下内容:/n对集群中的节点添加不同的标签,并将添加标签后的节点分配给不同的使用场景;/n对同一使用场景中的节点的忙闲程度进行打分,得出所有节点的得分并计算得分平均值,统计得分低于得分平均值的节点得到忙碌节点;/n将所述忙碌节点按得分升序排列,并对所述忙碌节点添加污点值;/n根据所述污点值的添加情况对同一使用场景中的集群负载进行调节。/n
【技术特征摘要】
1.一种基于Kubernetes的集群负载调节方法,其特征在于,包括以下内容:
对集群中的节点添加不同的标签,并将添加标签后的节点分配给不同的使用场景;
对同一使用场景中的节点的忙闲程度进行打分,得出所有节点的得分并计算得分平均值,统计得分低于得分平均值的节点得到忙碌节点;
将所述忙碌节点按得分升序排列,并对所述忙碌节点添加污点值;
根据所述污点值的添加情况对同一使用场景中的集群负载进行调节。
2.根据权利要求1所述的一种基于Kubernetes的集群负载调节方法,其特征在于,所述对所述忙碌节点添加污点值包括:对排序靠前的忙碌节点添加第一污点值NoScheduler,对剩余的忙碌节点添加第二污点值PreferNoScheduler。
3.根据权利要求2所述的一种基于Kubernetes的集群负载调节方法,其特征在于,所述将添加标签后的节点分配给不同的使用场景包括:当用户指定应用场景、提交训练需求并创建Pod时,根据所述Pod指定的信息,选择有相应标签的节点进行调度。
4.根据权利要求3所述的一种基于Kubernetes的集群负载调节方法,其特征在于,不将所述Pod调度到添加了第一污点值NoScheduler的忙碌节点上,尽量不将所述Pod调度到添加了第二污点值PreferNoScheduler的忙碌节点上。
5.根据权利要求1所述的一种基于Kubernetes的集群负载调节方法,其特征在于,所述对同一使用场景中的节点的忙闲程度进行打分的计算公式为:Score(pi)表示第i个节点的性能得分,计算公式如下:
Score(pi)=λcpu×Ccpu×Score(cpui)+λmemo...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。