模型发布方法、模型部署方法、装置、设备及存储介质制造方法及图纸

技术编号:25395819 阅读:44 留言:0更新日期:2020-08-25 23:01
本申请涉及过程优化领域,公开了一种模型发布方法、模型部署方法、装置、设备及存储介质,所述模型发布方法应用于发布服务器,所述方法包括:获取待发布的服务模型;获取所述服务模型的模型信息;根据所述模型信息生成模型引用文件;将所述模型信息和所述模型引用文件发送至目标服务器,以使所述目标服务器根据所述模型信息获取容器镜像,根据所述容器镜像和所述模型引用文件创建模型容器;将所述服务模型发送给所述目标服务器,以使所述目标服务器在所述模型容器部署所述服务模型;获取所述目标服务器的可用端口,根据所述可用端口生成模型调用入口,并将所述模型调用入口发送给所述终端设备。该方法可以提高模型发布的准确率和效率。

【技术实现步骤摘要】
模型发布方法、模型部署方法、装置、设备及存储介质
本申请涉及过程优化领域,尤其涉及一种模型发布方法、模型部署方法、装置、设备及存储介质。
技术介绍
机器学习作为人工智能的一个分支,是当今大数据时代的重要业务支撑手段,机器学习可以被应用于各种应用场景,并能够显著提升企业的业绩指标。很多网络平台都推出了基于机器学习的推荐和搜索服务,这种推荐和搜索服务通常是通过在网络平台中内置机器学习模型来实现,这些模型需要由技术人员进行训练,并发布到平台上,供用户使用。目前在网络平台上进行模型发布时,大部分训练得到的模型是采用全人工手动方式进行模型发布,例如人为配置机器环境,选择服务端口及生成url。模型发布过程均严重依赖人工,且无法做到及时、自动化模型发布,发布过程容易出错且工作大量重复,费时低效。因此,如何提高模型发布的效率成为亟待解决的问题。
技术实现思路
本申请提供了一种模型发布方法、模型部署方法、装置、设备及存储介质,通过创建模型容器,以提高模型发布的准确率和效率。第一方面,本申请提供了一种模型发布方法,应用于发布服务器,所述方法包括:根据终端设备发送的模型加载指令获取待发布的服务模型;获取所述服务模型的模型信息;根据所述模型信息生成模型引用文件;将所述模型信息和所述模型引用文件发送至目标服务器,以使所述目标服务器根据所述模型信息获取容器镜像,根据所述容器镜像和所述模型引用文件创建模型容器;将所述服务模型发送给所述目标服务器,以使所述目标服务器在所述模型容器部署所述服务模型;获取所述目标服务器的可用端口,根据所述可用端口生成模型调用入口,并将所述模型调用入口发送给所述终端设备。第二方面,本申请提供了一种模型部署方法,应用于目标服务器,所述方法包括:从发布服务器上获取待发布的服务模型的模型信息和所述服务模型对应的模型引用文件;根据所述模型信息获取容器镜像;根据所述容器镜像和所述模型引用文件创建模型容器;从所述发布服务器获取所述服务模型,在所述模型容器中部署所述服务模型;将所述目标服务器的可用端口发送给所述发布服务器,以使所述发布服务器根据所述可用端口生成模型调用入口,并将所述模型调用入口发送给所述终端设备。第三方面,本申请还提供了一种模型发布装置,所述装置包括:模型获取模块,用于根据终端设备发送的模型加载指令获取待发布的服务模型;信息获取模块,用于获取所述服务模型的模型信息;文件生成模块,用于根据所述模型信息生成模型引用文件;信息传送模块,用于将所述模型信息和所述模型引用文件发送至目标服务器,以使所述目标服务器根据所述模型信息获取容器镜像,根据所述容器镜像和所述模型引用文件创建模型容器;模型部署模块,用于将所述服务模型发送给所述目标服务器,以使所述目标服务器在所述模型容器部署所述服务模型;模型调用模块,用于获取所述目标服务器的可用端口,根据所述可用端口生成模型调用入口,并将所述模型调用入口发送给所述终端设备。第四方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的模型发布方法。第五方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的模型发布方法。本申请公开了一种模型发布方法、装置、设备及存储介质,通过根据终端设备发送的模型加载指令获取待发布的服务模型和该服务模型的模型信息,并根据所述模型信息生成模型引用文件,接着将所述模型信息和所述模型引用文件发送至目标服务器,以使所述目标服务器根据所述模型信息获取容器镜像并根据所述容器镜像和所述模型引用文件创建模型容器,之后将所述服务模型发送给所述目标服务器,以使所述目标服务器在所述模型容器部署所述服务模型,最后获取所述目标服务器的可用端口,根据所述可用端口生成模型调用入口,并将所述模型调用入口发送给所述终端设备,实现在目标服务器上创建模型容器,以提高模型发布的准确率和效率。附图说明为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是应用于服务器的模型发布方法的场景示意图;图2是本申请实施例提供的一种模型发布方法的流程示意图;图3为图1中根据所述模型信息生成模型引用文件的子流程示意图;图4是本申请实施例提供的一种模型发布方法的子流程示意图;图5是本申请实施例提供的一种模型部署方法的流程示意图;图6是本申请实施例提供的一种模型发布装置的示意性框图;图7是本申请一实施例提供的一种计算机设备的结构示意性框图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。本申请的实施例提供了一种模型发布方法、模型部署方法、装置、计算机设备及存储介质。该模型发布方法用于发布服务器,实现在目标服务器上创建模型容器,以提高模型发布的准确率和效率。下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。请参阅图1是应用于服务器的模型发布方法的场景示意图。用户终端、发布服务器和目标服务器之间建立通信互联。示例性地,用户终端可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备,发布服务器和目标服务器可以为独立的服务器,也可以为服务器集群。其中,发布服务器、目标服务器可以是相同的服务器,也可以是不同的服务器。用户终端用于上传待发布的服务模型和所述服务模型的模型信息;发布服务器用于获取待发布的服务模型和所述服务模型的模型信息,并根据所述模型信息生成模型引用文件,接着将所述模型本文档来自技高网...

【技术保护点】
1.一种模型发布方法,其特征在于,应用于发布服务器,包括:/n根据终端设备发送的模型加载指令获取待发布的服务模型;/n获取所述服务模型的模型信息;/n根据所述模型信息生成模型引用文件;/n将所述模型信息和所述模型引用文件发送至目标服务器,以使所述目标服务器根据所述模型信息获取容器镜像,根据所述容器镜像和所述模型引用文件创建模型容器;/n将所述服务模型发送给所述目标服务器,以使所述目标服务器在所述模型容器部署所述服务模型;/n获取所述目标服务器的可用端口,根据所述可用端口生成模型调用入口,并将所述模型调用入口发送给所述终端设备。/n

【技术特征摘要】
1.一种模型发布方法,其特征在于,应用于发布服务器,包括:
根据终端设备发送的模型加载指令获取待发布的服务模型;
获取所述服务模型的模型信息;
根据所述模型信息生成模型引用文件;
将所述模型信息和所述模型引用文件发送至目标服务器,以使所述目标服务器根据所述模型信息获取容器镜像,根据所述容器镜像和所述模型引用文件创建模型容器;
将所述服务模型发送给所述目标服务器,以使所述目标服务器在所述模型容器部署所述服务模型;
获取所述目标服务器的可用端口,根据所述可用端口生成模型调用入口,并将所述模型调用入口发送给所述终端设备。


2.如权利要求1所述的模型发布方法,其特征在于,所述获取所述服务模型的模型信息,包括:
从所述终端设备获取发布人员输入的所述服务模型的模型信息;
所述模型信息包括以下信息中的至少一项:模型依赖环境的信息、模型调用文件的信息、模型调用类的信息。


3.如权利要求1所述的模型发布方法,其特征在于,还包括:
从所述终端设备上获取发布人员输入的所述服务模型的模型类型;
获取与所述模型类型对应的模型信息模板;
将所述模型信息模板发送给所述终端设备进行显示,以便所述发布人员输入所述待发布的服务模型对应的模型信息。


4.如权利要求1所述的模型发布方法,其特征在于,所述根据所述模型信息生成模型引用文件,包括:
根据所述模型信息获取模型依赖环境的文件、模型调用文件的数据、模型调用类的数据中的至少一种;
根据所述模型依赖环境的文件、模型调用文件的数据、模型调用类的数据中的至少一种对所述服务模型进行解析,得到所述服务模型的模型参数;
基于预设的服务模板,根据所述模型参数生成所述模型引用文件。


5.如权利要求1所述的模型发布方法,其特征在于,还包括:
获取模型调用方的信息;
从所述目标服务器获取所述模型调用方对所述模型调用入口的访问数据;
根据所述模型调用方的信息和对应的访问数据生成模型调用情况报表。

【专利技术属性】
技术研发人员:王忠
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1