模型部署方法、装置、系统、电子设备和存储介质制造方法及图纸

技术编号：39312127 阅读：10 留言：0更新日期：2023-11-12 15:57

本发明专利技术公开了一种模型部署方法、装置、系统、电子设备和存储介质，包括：在待部署的模型存储到云端后获取模型的元数据，元数据包括模型的提供方选择的路由信息；根据路由信息确定目标模型服务器；根据元数据为目标模型服务器生成模型配置文件并发送到目标模型服务器，目标模型服务器根据模型配置文件从云端加载模型；将路由信息发送到推荐业务集群中的节点，推荐业务集群中的节点根据路由信息向目标模型服务器发送业务请求，本实施例无需人工介入修改配置文件，实现自动化部署、更新模型，提高了模型部署效率，且可以为不同业务类型的模型配置不同路由信息，以将相同业务类型的模型部署在相同的服务器，优化了服务器资源，提高模型的预测效率。型的预测效率。型的预测效率。

全部详细技术资料下载

【技术实现步骤摘要】
模型部署方法、装置、系统、电子设备和存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种模型部署方法、装置、系统、电子设备和存储介质。

技术介绍

[0002]Tersonflow模型由于具有更高的准确性和可拓展性，被广泛应用于处理大规模的数据集和复杂的推荐场景，因此，如何部署使用TensorFlow模型以提升TensorFlow模型的使用效率尤为重要。
[0003]目前，主要是通过部署TensorFlow Server，然而，现有的TensorFlow Server服务需要在配置文件中人工指定需要加载的模型，业务端与TensorFlow Server服务相对固定，当模型改版或发布新模型时需要修改配置文件重启后才生效，并且业务端需要相应修改，降低了模型部署效率。

技术实现思路

[0004]本专利技术提供了一种模型部署方法、装置、系统、电子设备和存储介质，以解决现有模型部署需要人工修改配置文件和业务端设置，导致模型部署效率低的问题。
[0005]第一方面，本专利技术提供了一种模型部署方法，包括：
[0006]在待部署的模型存储到云端后，获取所述模型的元数据，所述元数据包括所述模型的提供方选择的路由信息；
[0007]根据所述路由信息确定目标模型服务器；
[0008]根据所述元数据为所述目标模型服务器生成模型配置文件，并发送到所述目标模型服务器，所述目标模型服务器用于根据所述模型配置文件从所述云端加载所述模型；
[0009]将所述路由信息发送到推...

【技术保护点】

【技术特征摘要】
1.一种模型部署方法，其特征在于，包括：在待部署的模型存储到云端后，获取所述模型的元数据，所述元数据包括所述模型的提供方选择的路由信息；根据所述路由信息确定目标模型服务器；根据所述元数据为所述目标模型服务器生成模型配置文件，并发送到所述目标模型服务器，所述目标模型服务器用于根据所述模型配置文件从所述云端加载所述模型；将所述路由信息发送到推荐业务集群中的节点，所述推荐业务集群中的节点用于根据所述路由信息向所述目标模型服务器发送业务请求。2.根据权利要求1所述的模型部署方法，其特征在于，在获取所述模型的元数据之前，还包括：在检测到模型训练事件时，训练模型；对所述模型进行校验，并在校验通过后将所述模型的模型文件和模型特征描述文件存储到云端。3.根据权利要求1所述的模型部署方法，其特征在于，所述在待部署的模型存储到云端后，获取所述模型的元数据，包括：在待部署的模型存储到云端后，当接收到模型部署通知时，从所述模型部署通知中确定出所述模型的元数据。4.根据权利要求1所述的模型部署方法，其特征在于，在根据所述路由信息确定目标模型服务器之前，还包括：对所述元数据进行解析得到所述模型的类型；确定所述模型的类型是否为指定类型；若是，执行根据所述路由信息确定目标模型服务器的步骤。5.根据权利要求1
‑
4任一项所述的模型部署方法，其特征在于，所述根据所述元数据为所述目标模型服务器生成模型配置文件，并发送到所述目标模型服务器，包括：从所述元数据中确定所述模型的版本信息，以及确定所述模型在所述云端的存储路径；采用所述版本信息和所述存储路径生成所述目标模型服务器的模型配置文件；将所述模型配置文件发送到所述目标模型服务器，所述目标模型服务器用于根据所述模型配置文件确定是否存在新模型或者更新的模型，若是根据所述存储路径从所述云端加载模型。6.根据权利要求1
‑
4任一项所述的模型部署方法，其特征在于，在将所述路由信息发送到推荐业务集群中的节点之前，还包括：向所述目标模型服务器发送加载进度请求，所述目标模型服务器用于在接收到所述加载进度请求时返回所述模型的加载进度；在接收到所述目标模型服务器返回的加载进度时，确定所述目标模型服务器是否已加载完所述模型；若是，执行将所述路由信息发送到推荐业务集群中的节点的步骤；若否，统计向所述目标模型服务器发送加载进度请求的次数；判断所述次数是否大于或等于预设次数；
...

【专利技术属性】
技术研发人员：黎智鑫，梁钧，
申请(专利权)人：广州趣研网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人