一种部署模型的方法、系统、设备和存储介质技术方案

技术编号:35994250 阅读:20 留言:0更新日期:2022-12-17 23:10
本发明专利技术提供一种部署模型的方法、系统、设备和存储介质,方法包括:将训练好的模型的信息保存在模型信息数据库中,并判断是否触发服务更新;响应于触发服务更新,从所述模型信息数据库中获取模型的最新参数;根据所述最新参数对部署策略配置文件进行更新,并根据最新的部署策略配置文件为每个用户的模型容器生成模型启动配置文件;以及根据所述模型启动配置文件对模型进行部署。本发明专利技术通过对用户使用行为、模型状态变更等的感知,在无人监管的情况下自动优化部署策略,并按照策略对模型进行部署。署。署。

【技术实现步骤摘要】
一种部署模型的方法、系统、设备和存储介质


[0001]本专利技术涉及人工智能领域,更具体地,特别是指一种部署模型的方法、系统、设备和存储介质。

技术介绍

[0002]随着人工智能的不断进步,发展出了各类机器学习模型等算法模型。对话机器人在当前的生产生活中已占有较大比重,而由于各行业差别,对话机器人的针对性训练已日趋成熟,对话机器人自定义训练平台应运而生,由于该平台训练过程交于用户决策,投入生产后往往伴随着大量的模型产出与销毁,因此,将机器学习模型部署到服务器上以进行应用时的部署难度较大,部署过程较为复杂,部署时对服务器的计算资源消耗较大。如何缩短训练时间、部署时间,合理分配利用服务器资源,是目前本
人员需要解决的问题。

技术实现思路

[0003]有鉴于此,本专利技术实施例的目的在于提出一种部署模型的方法、系统、计算机设备及计算机可读存储介质,本专利技术通过对用户使用行为、模型状态变更等的感知,在无人监管的情况下自动优化部署策略,并按照策略对模型进行部署。
[0004]基于上述目的,本专利技术实施例的一方面提供了一种部署模型的方法,包括如下步骤:将训练好的模型的信息保存在模型信息数据库中,并判断是否触发服务更新;响应于触发服务更新,从所述模型信息数据库中获取模型的最新参数;根据所述最新参数对部署策略配置文件进行更新,并根据最新的部署策略配置文件为每个用户的模型容器生成模型启动配置文件;以及根据所述模型启动配置文件对模型进行部署。
[0005]在一些实施方式中,所述方法还包括:响应于触发服务更新,读取当前模型信息数据库的信息并存储于缓存数据库,并循环读取模型信息数据库的信息;以及响应于模型信息数据库的信息与所述缓存数据库的信息存在差异,将差异信息作为模型的最新参数进行传递。
[0006]在一些实施方式中,所述方法还包括:根据所述差异信息对所述缓存数据库中的信息进行更新。
[0007]在一些实施方式中,所述根据所述最新参数对部署策略配置文件进行更新包括:将训练好的模型保存在模型存储库中,并验证所述最新参数与所述模型存储库中的模型信息是否匹配。
[0008]在一些实施方式中,所述方法还包括:将保存在所述模型存储库中的模型转换成能够被所述模型启动配置文件加载的格式。
[0009]在一些实施方式中,所述方法还包括:响应于模型部署完成,将部署的模型的信息和对应的端口号存储到服务状态缓存数据库中。
[0010]在一些实施方式中,所述方法还包括:对同一用户启用单个容器提供服务,并将不同用户构成模型服务集群。
[0011]本专利技术实施例的另一方面,提供了一种部署模型的系统,包括:存储模块,配置用于将训练好的模型的信息保存在模型信息数据库中,并判断是否触发服务更新;采集模块,配置用于响应于触发服务更新,从所述模型信息数据库中获取模型的最新参数;更新模块,配置用于根据所述最新参数对部署策略配置文件进行更新,并根据最新的部署策略配置文件为每个用户的模型容器生成模型启动配置文件;以及部署模块,配置用于根据所述模型启动配置文件对模型进行部署。
[0012]本专利技术实施例的又一方面,还提供了一种计算机设备,包括:至少一个处理器;以及存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现如上方法的步骤。
[0013]本专利技术实施例的再一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现如上方法步骤的计算机程序。
[0014]本专利技术具有以下有益技术效果:通过对用户使用行为、模型状态变更等的感知,在无人监管的情况下自动优化部署策略,并按照策略对模型进行部署,无需开发人员干预,自动完成训练模型的转换、部署、启停、删除等操作,并可自主选择模型部署时单个容器所负担的模型数量,合理平衡服务性能与服务器资源。
附图说明
[0015]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
[0016]图1为本专利技术提供的部署模型的方法的实施例的示意图;
[0017]图2为本专利技术提供的部署模型的系统的实施例的示意图;
[0018]图3为本专利技术提供的部署模型的计算机设备的实施例的硬件结构示意图;
[0019]图4为本专利技术提供的部署模型的计算机存储介质的实施例的示意图。
具体实施方式
[0020]为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术实施例进一步详细说明。
[0021]需要说明的是,本专利技术实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本专利技术实施例的限定,后续实施例对此不再一一说明。
[0022]本专利技术实施例的第一个方面,提出了一种部署模型的方法的实施例。图1示出的是本专利技术提供的部署模型的方法的实施例的示意图。如图1所示,本专利技术实施例包括如下步骤:
[0023]S1、将训练好的模型的信息保存在模型信息数据库中,并判断是否触发服务更新;
[0024]S2、响应于触发服务更新,从所述模型信息数据库中获取模型的最新参数;
[0025]S3、根据所述最新参数对部署策略配置文件进行更新,并根据最新的部署策略配置文件为每个用户的模型容器生成模型启动配置文件;以及
[0026]S4、根据所述模型启动配置文件对模型进行部署。
[0027]本专利技术实施例中包括模型信息数据库、模型信息缓存数据库和服务状态缓存数据库。
[0028]模型信息数据库:作为训练平台与本专利技术提供的部署模型的系统的信息交换媒介,训练平台将信息更新在模型信息数据库中,本专利技术提供的部署模型的系统循环读取数据库内容,当内容发生改变时,系统即触发模型服务更新任务。
[0029]模型信息缓存数据库:作为存放上个状态下的模型信息,用来与模型信息数据库中的信息作为比对,当发现差异时即为状态发生改变,则触发模型服务更新任务,并且同时更新所述模型信息缓存数据库。
[0030]服务状态缓存数据库:作为存放服务更新完成后容器与端口信息存放的数据库,当训练平台发生用户使用模型情况时,训练平台服务调用程序读取服务状态缓存数据库中的端口信息完成模型调用。
[0031]获取模型变更状态及用户行为操作状态,具体流程如下:
[0032]从模型当前信息数据库中获取当前模型信息数据,将信息数据存储至历史状态缓存数据库中,循环检测模型信息数据库,并将模型信息数据库中的数据与历史状态缓存数据库中的数据进行比对;当模型信息数据库中的数据与历史状态缓存数据库中的数据产生差异时,即模型状态或用户行为操作状态发生改变时(模型训练完成、用户登录、用户登出、用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种部署模型的方法,其特征在于,包括如下步骤:将训练好的模型的信息保存在模型信息数据库中,并判断是否触发服务更新;响应于触发服务更新,从所述模型信息数据库中获取模型的最新参数;根据所述最新参数对部署策略配置文件进行更新,并根据最新的部署策略配置文件为每个用户的模型容器生成模型启动配置文件;以及根据所述模型启动配置文件对模型进行部署。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:响应于触发服务更新,读取当前模型信息数据库的信息并存储于缓存数据库,并循环读取模型信息数据库的信息;以及响应于模型信息数据库的信息与所述缓存数据库的信息存在差异,将差异信息作为模型的最新参数进行传递。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:根据所述差异信息对所述缓存数据库中的信息进行更新。4.根据权利要求1所述的方法,其特征在于,所述根据所述最新参数对部署策略配置文件进行更新包括:将训练好的模型保存在模型存储库中,并验证所述最新参数与所述模型存储库中的模型信息是否匹配。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:将保存在所述模型存储库中的模型转换成能够被所述模型启动配置文件加载的格式。6.根据权利要求1所述...

【专利技术属性】
技术研发人员:王雪飞
申请(专利权)人:浪潮通用软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1