【技术实现步骤摘要】
一种人工智能训练平台的运营方法、系统、介质及设备
[0001]本专利技术涉及人工智能
,尤其涉及一种人工智能训练平台的运营方法、系统、介质及设备。
技术介绍
[0002]K8S(Kubernetes,一个开源的容器集群管理系统)是为容器服务而生的一个可移植容器的编排管理工具,越来越多的公司正在拥抱K8S,并且当前K8S已经主导了云业务流程,推动了微服务架构等热门技术的普及和落地,正在如火如荼地发展。
[0003]AI Station(人工智能训练平台)是面向人工智能企业训练场景的人工智能开发资源平台,可实现容器化部署、可视化开发、集中化管理等,为用户提供极高性能的AI(Artificial Intelligence,人工智能)计算资源,实现高效的计算力支撑、精准的资源管理和调度、敏捷的数据整合及加速、流程化的AI场景及业务整合,有效打通开发环境、计算资源与数据资源,提升开发效率。用户通过AI Station平台能够创建不同的深度学习框架环境,可以自由进行模型的开发,通过命令行方式调试模型,然后通过开发平台快速提 ...
【技术保护点】
【技术特征摘要】
1.一种人工智能训练平台的运营方法,其特征在于,包括以下步骤:响应于人工智能训练平台接收到用户群的服务请求,基于所述服务请求的类型和初始规模将所述服务请求分配至对应的应用软件;将所述应用软件分别分配至容器集群管理系统内相应的弹性伸缩组中,并按照初始化部署策略在每个弹性伸缩组中将其应用软件部署至对应的容器中;为所述每个弹性伸缩组设置资源使用量的监控阈值范围以及伸缩策略;针对所述每个弹性伸缩组,基于其中服务请求的当前规模判断当前资源使用量与对应的监控阈值范围的关系,并基于判断结果使用所述伸缩策略对相应的容器数量进行调整。2.根据权利要求1所述的方法,其特征在于,基于所述服务请求的类型和初始规模将所述服务请求分配至对应的应用软件包括:基于所述服务请求的类型确定对应的应用软件的种类,并基于所述服务请求的初始规模确定各个种类的应用软件的数量,并将所述服务请求分配至对应的应用软件。3.根据权利要求2所述的方法,其特征在于,将所述应用软件分别分配至容器集群管理系统内相应的弹性伸缩组中包括:将属于同一种类的应用软件分配至容器集群管理系统内的同一个弹性伸缩组中。4.根据权利要求2或3所述的方法,其特征在于,按照初始化部署策略在每个弹性伸缩组中将其应用软件部署至对应的容器中包括:针对每个弹性伸缩组,基于其应用软件的数量确定容器的数量,并将每个应用软件部署至对应的容器中。5.根据权利要求1所述的方法,其特征在于,针对所述每个弹性伸缩组,基于其中服务请求的当前规模判断当前资源使用量与对应的监控阈值范围的关系,并基于判断结果使用所述伸缩策略对相应的容器数量进行调整包括:针对所述每个弹性伸缩组,基于其中服务请求的当前规模判断当前资源使用量是否超过对应的监控阈值范围的上限值;响应于所述当前资源使用量超过所述上限值,基于所述伸缩策略增加相应的容器数量,以使所述每个弹性伸缩组的资源使用量位于对应的监控阈值范围之...
【专利技术属性】
技术研发人员:高言,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。