模型部署方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34720221 阅读:12 留言:0更新日期:2022-08-31 18:05
本公开实施例提供了一种模型部署方法、装置、电子设备及存储介质,该方法包括:从服务代码库中获取第一服务对应的服务代码文件,并将服务代码文件存储在与第一服务的运行环境相对应的第一存储环境中;根据服务代码文件,从模型文件库中获取相对应的模型文件,并将模型文件存储在与第一服务的运行环境相对应的第二存储环境中;获取配置信息,并根据配置信息对第一服务的运行环境进行配置,以使运行环境适配于运行加载模型文件后的第一服务;响应于用于启动第一服务的启动指令,将模型文件加载到第一服务的运行环境中。到第一服务的运行环境中。到第一服务的运行环境中。

【技术实现步骤摘要】
模型部署方法、装置、电子设备及存储介质


[0001]本公开实施例涉及模型部署
,尤其涉及一种模型部署方法、装置、电子设备及存储介质。

技术介绍

[0002]随着技术的不断发展,深度学习模型等技术被应用的越来越广泛。例如,由于企业业务具有复杂的场景,因此企业更多地利用深度学习模型等技术来实现业务的智能化,从而给企业带来更低的人力成本、更高的效率以及更强的业务能力。由于业务服务的多样性,对应的模型也多种多样,为了保证使用的可靠性,就需要对模型进行准确且合理地部署。
[0003]现如今,包括但不限于业务服务的模型在部署时,仍依赖于工作人员人工进行,部署的效率也较低,并且容易因各种人为因素导致模型的部署有误。

技术实现思路

[0004]为了解决上述问题,本公开实施例提供了一种模型部署方法、装置、电子设备及存储介质,以至少部分地解决上述问题。
[0005]根据本公开的一方面,提供了一种模型部署方法,该方法包括:
[0006]从服务代码库中获取第一服务对应的服务代码文件,并将所述服务代码文件存储在与所述第一服务的运行环境相对应的第一存储环境中;
[0007]根据所述服务代码文件,从模型文件库中获取相对应的模型文件,并将所述模型文件存储在与所述第一服务的运行环境相对应的第二存储环境中;
[0008]获取配置信息,并根据所述配置信息对所述第一服务的运行环境进行配置,以使所述运行环境适配于运行加载所述模型文件后的第一服务;
[0009]响应于用于启动第一服务的启动指令,将所述模型文件加载到所述第一服务的运行环境中。
[0010]在一些可选的实施例中,所述配置信息包括:在所述模型文件加载到所述第一服务的运行环境的情况下,所述第一服务运行时所需的软件资源配置信息、以及所述第一服务运行时所需的硬件资源配置信息。
[0011]在一些可选的实施例中,所述获取配置信息,并根据所述配置信息对所述第一服务的运行环境进行配置,包括:根据所述配置信息中的软件资源配置信息以及硬件资源配置信息,获取配置文件;基于所述配置文件,在所述运行环境中安装所述第一服务运行时所依赖的软件,和/或,配置所述第一服务运行时所依赖的软件资源参数,并配置所述第一服务运行时所依赖的硬件资源参数。
[0012]在一些可选的实施例中,所述根据所述服务代码文件,从模型文件库相对应的获取模型文件,包括:根据所述服务代码文件,确定所述模型文件的文件指纹,其中,所述服务代码文件与一个模型文件的文件指纹相对应,不同的服务代码文件与不同的文件指纹相对应;根据所述文件指纹,从所述模型文件库中获取所述模型文件。
[0013]在一些可选的实施例中,所述从服务代码库中获取第一服务对应的服务代码文件,包括:从所述服务代码库中获取第一服务所对应的最新版本的服务代码文件;所述根据所述服务代码文件,从模型文件库中获取相对应的模型文件,包括:根据所述服务代码文件,从所述模型文件库中获取最新版本的模型文件。
[0014]在一些可选的实施例中,所述根据所述服务代码文件,从模型文件库中获取相对应的模型文件,之前所述方法还包括:响应于对所述第一服务进行优化的优化信号,将所述模型文件上传到所述模型文件库。
[0015]在一些可选的实施例中,所述从服务代码库中获取第一服务对应的服务代码文件,并将所述服务代码文件存储在与所述第一服务的运行环境相对应的第一存储环境中,包括:响应于所述模型文件库中出现新版本的模型文件,从服务代码库中获取第一服务对应的服务代码文件,并将所述服务代码文件存储在与所述第一服务的运行环境相对应的第一存储环境中。
[0016]在一些可选的实施例中,所述模型文件通过如下方法构建:获取多个样本数据,其中,所述样本数据包括所述第一服务在历史运行过程中被输入的企业业务数据;对所述样本数据进行分词处理,得到至少一个分词;分别对每个分词进行向量转换,得到每个分词所对应的词向量;获得包括所述词向量和样本标注信息的训练数据,其中,所述样本标注信息指示所述词向量对应的企业业务数据与运行所述第一服务后的输出结果之间的对应关系;通过所述训练数据对待训练模型进行训练以获得业务模型,并将所述业务模型进行打包处理以得到所述模型文件。
[0017]根据本公开实施例中的另一方面,提供了一种模型部署装置,包括:
[0018]第一获取模块,用于从服务代码库中获取第一服务对应的服务代码文件,并将所述服务代码文件存储在与所述第一服务的运行环境相对应的第一存储环境中;
[0019]第二获取模块,用于根据所述服务代码文件,从模型文件库中获取相对应的模型文件,并将所述模型文件存储在与所述第一服务的运行环境相对应的第二存储环境中;
[0020]配置模块,用于获取配置信息,并根据所述配置信息对所述第一服务的运行环境进行配置,以使所述运行环境适配于运行加载所述模型文件后的第一服务;
[0021]加载模块,用于响应于用于启动第一服务的启动指令,将所述模型文件加载到所述第一服务的运行环境中。
[0022]根据本公开实施例中的再一方面,提供了一种电子设备,包括:所述电子设备包括存储器以及处理器,所述存储器上用于存储计算机可执行程序,所述处理器用于运行所述计算机可执行程序以实施前面任一项所述的模型部署方法。
[0023]根据本公开实施例中的再一方面,提供了一种计算机存储介质,其中,所述计算机存储介质存储有计算机指令,所述计算机指令用于使计算机执行根据前面任一项所述的模型部署方法。
[0024]根据本公开实施例中的再一方面,提供了一种计算机程序产品,其中,包括计算机程序,其中,所述计算机程序在被处理器执行时实现前面任一项所述的模型部署方法。
[0025]综合以上内容,本公开实施例中的模型部署方案,由于能够从服务代码库中获取第一服务对应的服务代码文件,并将服务代码文件存储在与第一服务的运行环境相对应的第一存储环境中,再根据服务代码文件,从模型文件库中获取模型文件,并将模型文件存储
在与第一服务的运行环境相对应的第二存储环境中,然后获取配置信息,并根据配置信息对第一服务的运行环境进行配置,以使运行环境适配于运行加载模型文件后的第一服务,最后响应于用于启动第一服务的启动指令,将模型文件加载到第一服务的运行环境中,因此本公开实施例中的模型部署方案在进行模型部署时不必依赖于人工进行,从而可以保证模型部署效率,改善因各种人为因素导致的模型部署有误的问题,也减小了人工维护成本,针对不同服务的模型实现准确且合理地部署。
附图说明
[0026]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0027]图1示出了根据本公开的一种示例性的模型部署方法的流程图。
[0028]图2示出了根据本公开的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型部署方法,包括:从服务代码库中获取第一服务对应的服务代码文件,并将所述服务代码文件存储在与所述第一服务的运行环境相对应的第一存储环境中;根据所述服务代码文件,从模型文件库中获取相对应的模型文件,并将所述模型文件存储在与所述第一服务的运行环境相对应的第二存储环境中;获取配置信息,并根据所述配置信息对所述第一服务的运行环境进行配置,以使所述运行环境适配于运行加载所述模型文件后的第一服务;响应于用于启动第一服务的启动指令,将所述模型文件加载到所述第一服务的运行环境中。2.根据权利要求1所述的方法,其中,所述配置信息包括:在所述模型文件加载到所述第一服务的运行环境的情况下,所述第一服务运行时所需的软件资源配置信息、以及所述第一服务运行时所需的硬件资源配置信息。3.根据权利要求2所述的方法,其中,所述获取配置信息,并根据所述配置信息对所述第一服务的运行环境进行配置,包括:根据所述配置信息中的软件资源配置信息以及硬件资源配置信息,获取配置文件;基于所述配置文件,在所述运行环境中安装所述第一服务运行时所依赖的软件,和/或,配置所述第一服务运行时所依赖的软件资源参数,并配置所述第一服务运行时所依赖的硬件资源参数。4.根据权利要求1所述的方法,其中,所述根据所述服务代码文件,从模型文件库获取相对应的模型文件,包括:根据所述服务代码文件,确定所述模型文件的文件指纹,其中,所述服务代码文件与一个模型文件的文件指纹相对应,不同的服务代码文件与不同的文件指纹相对应;根据所述文件指纹,从所述模型文件库中获取所述模型文件。5.根据权利要求1所述的方法,其中,所述从服务代码库中获取第一服务对应的服务代码文件,包括:从所述服务代码库中获取第一服务所对应的最新版本的服务代码文件;所述根据所述服务代码文件,从模型文件库中获取相对应的模型文件,包括:根据所述服务代码文件,从所述模型文件库中获取最新版本的模型文件。6.根据权利要求1所述的方法,其中,所述根据所述服务代码文件,从模型文件库中获取相对应的模型文件,之前所述方法还包括:响应于对所述第一服务进行优化的优化信号,将所述模型文件上传到所述模型文件库。7.根据权利要求1所述的方法,其中,所述从服务代码库中获取第一服务对应的...

【专利技术属性】
技术研发人员:刘阳
申请(专利权)人:北京金堤科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1