一种在线模型推理系统技术方案

技术编号：24888371 阅读：15 留言：0更新日期：2020-07-14 18:15

本申请涉及一种在线模型推理系统，本申请实施例通过建立模型仓库和存储有推理模型所需的容器镜像的容器镜像仓库，当接收用户的在线推理请求时，根据用户的配置信息使模型微服务引擎从模型仓库调取用户需要的推理模型，并从容器镜像仓库容器镜像，避免训练模型所需容器镜像与实际容器镜像不一致的情况，进而能够将推理模型封装为可容器化运行的推理服务，提供在线推理服务。

全部详细技术资料下载

【技术实现步骤摘要】
一种在线模型推理系统
本申请涉及分布式存储
，尤其涉及一种在线模型推理系统。
技术介绍
随着大数据技术和人工智能技术的发展，越来越多的业务场景，如金融风控、在线广告、商品推荐、智能城市等，采用大量的机器学习技术来提升服务质量和智能决策水平。针对具体的任务，在模型指定的训练环境中训练得到模型后，需要将其封装，再将模型部署为在线推理服务，当用户使用与训练环境相同的运行环境时，即可使用该推理服务。但是在实现本专利技术过程中，专利技术人发现随着推理服务需求量增加，需要部署的推理模型种类增多，容易出现推理模型的训练环境与用户的运行环境不同，造成部署推理模型上线后进行在线推理服务运行错误的问题。
技术实现思路
为了解决上述技术问题或者至少部分地解决上述技术问题，本申请实施例提供了一种在线模型推理系统。第一方面，本申请实施例提供了一种在线模型推理系统，所述系统包括：模型仓库、容器镜像仓库、服务设计器以及模型微服务引擎；所述模型仓库，用于存储推理模型和所述推理模型的元数据；所述容器镜像仓库，用于存储所述推理模型运行所需的容器镜像；所述服务设计器，用于接收用户对待对外提供在线推理服务的推理模型的配置信息；所述模型微服务引擎，用于按照述配置信息在容器镜像仓库中拉取容器镜像、从所述模型仓库中拉取推理模型及元数据；以及，将所述推理模型、元数据和容器镜像进行封装，得到为可容器化运行的模型推理服务，以对外提供在线推理服务。可选地，所述系统还包括：服务状态监控装置；...

【技术保护点】
1.一种在线模型推理系统，其特征在于，所述系统包括：模型仓库、容器镜像仓库、服务设计器以及模型微服务引擎；/n所述模型仓库，用于存储推理模型和所述推理模型的元数据；/n所述容器镜像仓库，用于存储所述推理模型运行所需的容器镜像；/n所述服务设计器，用于接收用户对待对外提供在线推理服务的推理模型的配置信息；/n所述模型微服务引擎，用于按照述配置信息在容器镜像仓库中拉取容器镜像、从所述模型仓库中拉取推理模型及元数据；以及，将所述推理模型、元数据和容器镜像进行封装，得到为可容器化运行的模型推理服务，以对外提供在线推理服务。/n

【技术特征摘要】
1.一种在线模型推理系统，其特征在于，所述系统包括：模型仓库、容器镜像仓库、服务设计器以及模型微服务引擎；
所述模型仓库，用于存储推理模型和所述推理模型的元数据；
所述容器镜像仓库，用于存储所述推理模型运行所需的容器镜像；
所述服务设计器，用于接收用户对待对外提供在线推理服务的推理模型的配置信息；
所述模型微服务引擎，用于按照述配置信息在容器镜像仓库中拉取容器镜像、从所述模型仓库中拉取推理模型及元数据；以及，将所述推理模型、元数据和容器镜像进行封装，得到为可容器化运行的模型推理服务，以对外提供在线推理服务。

2.根据权利要求1所述的在线模型推理系统，其特征在于，所述系统还包括：服务状态监控装置；
所述服务状态监控模块用于确定所述模型微服务引擎中的各个用于搭载推理服务的容器实例的CPU使用率、GPU使用率、内存使用率、响应时延以及容器实例数量；以及，计算所述模型微服务引擎中的所述推理服务的准确性指标。

3.根据权利要求2所述的在线模型推理系统，其特征在于，所述系统还包括：容器编排器；
所述容器编排器用于根据所述CPU使用率、GPU使用率、内存使用率、响应时延以及推理服务数量计算期望容器实例数量，并依据所述期望容器实例数量对所述模型微服务引擎中的容器实例进行增加/删减。

4.根据权利要求3所述的在线模型推理系统，其特征在于，根据所述CPU使用率、GPU使用率、内存使用率、响应时延以及推理服务数量计算期望容器实例数量的公式如下：

其中，α、β、γ、δ分别为CPU使用率、GPU使用率、内存使用率、响应时延4个衡量维度的权重因子，取值范围为[0,1],总和为1，ceil表示向下取整。

5.根据权利要求1所述的在线模型推理系统，其特征在于，所述模型微服务引擎中包括：模型筛选器；
所述模型筛选器用于根据配置信息确定筛选策略，并按照所述筛选策略从所述模型仓库中拉取符合所述筛选策略的推理模型。...

【专利技术属性】
技术研发人员：黄绿君，高峰斌，
申请(专利权)人：京东数字科技控股有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人