pod容量控制方法及装置制造方法及图纸

技术编号：38735646 阅读：20 留言：0更新日期：2023-09-08 23:22

本说明书提供一种pod容量控制方法及装置，涉及云计算平台技术领域，其中pod容量控制方法包括：监测用于调用预设的AI模型集中至少一个AI模型的至少一个预测服务请求，以确定相应的服务请求队列集；针对各个AI模型，确定AI模型的实时TPS、预设的单副本TPS、预设的TPS标准值和相应服务请求队列的阻塞队列指标；根据实时TPS、TPS标准值和阻塞队列指标，控制扩大或缩减针对AI模型所对应的pod副本数量。由此，保障不同AI模型的容器资源能够被合理调控，满足并行运行的多个AI模型的实时数据处理的性能需求，同时保障各个AI预测服务能够实现较高的服务响应效率。的服务响应效率。的服务响应效率。

全部详细技术资料下载

【技术实现步骤摘要】
pod容量控制方法及装置

[0001]本说明书涉及云计算平台
，尤其涉及一种pod容量控制方法及装置。

技术介绍

[0002]随着AI（Artificial Intelligence, 人工智能）技术的不断发展，各行各业正在相继结合AI技术，利用AI技术提升产品竞争力，为企业创造更大的价值。
[0003]AI模型是AI技术落地的核心组成部分，其能够为不同的实际推理预测业务赋能，例如人脸识别、指纹识别和文本识别等等，而AI模型推理预测服务（Inference Service）是将AI模型应用到实际业务的最后环节，通过将多个AI模型封装成一个在线或离线的Service，使用者通过API或SDK调用的方式获取模型的能力，使得AI模型的价值得以充分利用。
[0004]随着云计算平台技术的不断更新，众多厂商选择通过在云计算平台上部署多个AI模型以支持多样化的推理预测业务。基于K8s（Kubernetes）的管理系统较广泛地应用于各类云计算平台，以高效运行、配置及管理云计算平台中的容器化应用程序，即Kubernetes使用一个pod（容器组）来相应管理一个容器化应用，pod也是K8s编排的最小粒度。目前，K8s管理系统依据pod内CPU或内存的使用量，对相应被管理的容器化应用的副本数进行调整，例如自动增加或减少容器化应用的副本数。
[0005]然而，针对AI模型推理预测服务，影响其服务性能的关键指标是服务访问请求的并发数量、AI服务的差异化类型等其他因素，例如图像识别服务一般相比于文本识别服务需求更...

【技术保护点】

【技术特征摘要】
1.一种pod容量控制方法，其特征在于，所述方法包括：监测用于调用预设的AI模型集中至少一个AI模型的至少一个预测服务请求，以确定相应的服务请求队列集；其中，每一所述AI模型分别配置有相应的服务请求队列；针对各个所述AI模型，确定所述AI模型的实时TPS、预设的单副本TPS、预设的TPS标准值和相应服务请求队列的阻塞队列指标；所述实时TPS为所述AI模型当前实际承载的每秒处理事务数，以及所述单副本TPS为所述AI模型所对应的单个pod副本所能够最大承载的每秒处理事务数；从各个所述AI模型中，确定待扩容AI模型和/或待缩容AI模型；其中，所述待扩容AI模型定义了等待进行pod扩容的AI模型，所述待缩容AI模型定义了等待进行pod缩容的AI模型；所述待扩容AI模型的实时TPS超过相应的TPS标准值，或者对应的阻塞队列指标指示存在队列阻塞；所述待缩容AI模型的实时TPS未超过相应的TPS标准值，且对应的阻塞队列指标指示不存在队列阻塞；根据所述待扩容AI模型的实时TPS、TPS标准值和单副本TPS控制扩大所述待扩容AI模型所对应的pod副本数量，和/或，根据所述待缩容AI模型的实时TPS、TPS标准值和单副本TPS控制缩减所述待缩容AI模型所对应的pod副本数量。2.根据权利要求1所述的pod容量控制方法，其特征在于，所述TPS标准值和所述单副本TPS是通过以下操作而预设置的：获取用户设置指令，所述用户设置指令包括模型标识信息、单副本TPS设置信息和TPS标准设置信息；根据所述单副本TPS设置信息和所述TPS标准设置信息，分别确定与所述模型标识信息对应的AI模型的单副本TPS和TPS标准值。3.根据权利要求1所述pod容量控制方法，其特征在于，根据所述待缩容AI模型的实时TPS、TPS标准值和单副本TPS控制缩减所述待缩容AI模型所对应的pod副本数量，包括：在确定所述待缩容AI模型的实时TPS为零，且阻塞队列指标指示所述待缩容AI模型相应的服务请求队列超过预设时间段未新增服务请求的情况下，清空所述待缩容AI模型所对应的pod副本数量。4.根据权利要求1所述pod容量控制方法，其特征在于，所述根据所述待扩容AI模型的实时TPS、TPS标准值和单副本TPS控制扩大所述待扩容AI模型所对应的pod副本数量，和/或，根据所述待缩容AI模型的实时TPS、TPS标准值和单副本TPS控制缩减所述待缩容AI模型所对应的pod副本数量，包括：获取历史扩缩容记录；所述历史扩缩容记录包括至少一个历史扩缩容操作和相应的历史操作时间，所述历史扩缩容操作包括历史扩容操作和历史缩容操作；计算各个所述历史操作时间与当前时间之间的时间间隔；在确定各个所述时间间隔中的最小值大于预设的冷却时间的情况下，根据所述待扩容AI模型的实时TPS、TPS标准值和单副本TPS控制扩大所述待扩容AI模型所对应的pod副本数量，和/或，根据所述待缩容AI模型的实时TPS、TPS标准值和单副本TPS控制缩减所述待缩容AI模型所对应的pod副本数量。5.根据权利要求1所述pod容量控制方法，其特征在于，所述根据所述待扩容AI模型的实时TPS、所述TPS标准值和单副本TPS控制扩大所述待扩容AI模型所对应的pod副本数量，
包括：根据所述待扩容AI模型的实时TPS、所述TPS标准值和单副本TPS，确定所述待扩容AI模型所对应的待扩充的需求pod副本数量；在确定预设的副本调度池中的pod副本的数量大于或等于所述需求pod副本数量的情况下，根据所述副本调度池中的pod副本控制扩大所述待扩容AI模型所对应的pod副本数量；所述副本调度池用于供调度以向所述各个AI模型扩充相应的pod副本，以及收集从所述各个AI模型所对应的已缩减的pod副本。6.根据权利要求5所述pod容量控制方法，其特征在于...

【专利技术属性】
技术研发人员：张超，程昊，张晓，杨嘉屹，李方遒，苏清博，张晓慧，密晓光，张晴，张月，
申请(专利权)人：中海石油气电集团有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人