模型部署方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:36689007 阅读:12 留言:0更新日期:2023-02-27 19:54
本申请实施例属于人工智能领域,涉及一种模型部署方法,包括:判断是否接收到用户触发的模型部署请求;若是,展示预设的信息填充页面,并接收用户在信息填充页面输入的数据回写信息;从第一预设文件中读取与模型标识对应的取数脚本;从第二预设文件中读取与模型标识对应的代码文件与模型文件;基于数据回写信息、取数脚本、代码文件以及模型文件生成目标模型的模型部署文件;基于预设的应用容器引擎与模型部署文件对目标模型进行部署。本申请还提供一种模型部署装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,模型部署文件可存储于区块链中。本申请可基于模型部署文件自动实现对于目标模型的部署,有利于提高目标模型的部署效率。型的部署效率。型的部署效率。

【技术实现步骤摘要】
模型部署方法、装置、计算机设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及模型部署方法、装置、计算机设备及存储介质。

技术介绍

[0002]人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
[0003]在人工智能领域,模型部署是一个重要研究方向。目前业界大多数平台的Jupyter、VScode训练工具都仅支持在线模型训练,如果需要部署在线模型,则需要人工重新导出代码、数据等,导出后还需在模型部署环节重新选择模型文件,镜像,数据等相关内容,并再次运行。由于部分深度学习建模场景因模型文件过大使得导出耗时长,操作麻烦,人工工作量较大,模型的部署效率低下。

技术实现思路

[0004]本申请实施例的目的在于提出一种模型部署方法、装置、计算机设备及存储介质,以解决现有的模型部署方法存在人工工作量较大,模型的部署效率低下的技术问题。
[0005]为了解决上述技术问题,本申请实施例提供一种模型部署方法,采用了如下所述的技术方案:
[0006]判断是否接收到用户触发的模型部署请求;其中,所述模型部署指令携带已完成开发的目标模型的模型标识;
[0007]若是,展示预设的信息填充页面,并接收所述用户在所述信息填充页面输入的数据回写信息;
[0008]从第一预设文件中读取与所述模型标识对应的取数脚本;
[0009]从第二预设文件中读取与所述模型标识对应的代码文件与模型文件;
[0010]基于所述数据回写信息、所述取数脚本、所述代码文件以及所述模型文件生成所述目标模型的模型部署文件;
[0011]基于预设的应用容器引擎与所述模型部署文件对所述目标模型进行部署。
[0012]进一步的,所述基于预设的应用容器引擎与所述模型部署文件对所述目标模型进行部署的步骤,具体包括:
[0013]基于所述应用容器引擎从所述部署文件中获取所述数据回写信息、所述取数脚本、所述代码文件以及所述模型文件;
[0014]从所述代码文件中获取预设的docker镜像;以及,
[0015]从所述代码文件中获取环境依赖信息;
[0016]将所述数据回写信息、所述取数脚本、所述模型文件以及所述环境依赖信息加载至与所述docker镜像对应的目标目录中,并在所述目标目录中触发所述模型文件的运行,以实现对于所述目标模型的部署。
[0017]进一步的,在所述从所述代码文件中获取预设的docker镜像的步骤之前,还包括:
[0018]从所述代码文件中解析出所述目标模型运行依赖的工具信息;
[0019]将所述工具信息打包生成对应的docker镜像;
[0020]将所述docker镜像存储至所述代码文件内的所述目标目录下。
[0021]进一步的,在所述基于预设的应用容器引擎与所述模型部署文件对所述目标模型进行部署的步骤之后,还包括:
[0022]接收所述用户输入的与所述目标模型对应的调度任务信息;
[0023]基于所述调度任务信息生成与所述目标模型对应的调度任务;
[0024]确定与所述调度任务对应的资源分配规则;
[0025]基于所述资源分配规则执行所述调度任务。
[0026]进一步的,所述确定与所述调度任务对应的资源分配规则的步骤,具体包括:
[0027]使用第一预设集群作为所述目标模型在执行所述调度任务的取数计算资源;
[0028]使用第二预设集群作为所述目标模型在执行所述调度任务的模型运行资源;
[0029]使用第三预设集群作为所述目标模型在执行所述调度任务的数据回写资源。
[0030]进一步的,在所述接收所述用户在所述信息填充页面输入的数据回写信息的步骤之后,还包括:
[0031]生成与所述数据回写信息对应的信息确认信息,并展示所述信息确认信息;
[0032]判断是否接收到所述用户输入的对于所述数据回写信息的修改操作;
[0033]若是,基于所述修改操作对所述数据回写信息进行修改处理,得到修改后的目标数据回写信息;
[0034]所述基于所述数据回写信息、所述取数脚本、所述代码文件以及所述模型文件生成所述目标模型的模型部署文件的步骤包括:
[0035]基于所述目标数据回写信息、所述取数脚本、所述代码文件以及所述模型文件生成所述目标模型的模型部署文件。
[0036]进一步的,所述模型部署请求还携带所述用户的用户身份信息,所述展示预设的信息填充页面的步骤,具体包括:
[0037]从所述模型部署请求中提取出所述用户身份信息;
[0038]判断预设的白名单内是否存储有所述用户身份信息;
[0039]若是,获取所述用户的生物特征信息;
[0040]基于所述生物特征信息对所述用户进行身份验证,并判断身份验证是否通过;
[0041]若身份验证通过,执行展示预设的信息填充页面的步骤。
[0042]为了解决上述技术问题,本申请实施例还提供一种模型部署装置,采用了如下所述的技术方案:
[0043]第一判断模块,用于判断是否接收到用户触发的模型部署请求;其中,所述模型部署指令携带已完成开发的目标模型的模型标识;
[0044]第一接收模块,用于若是,展示预设的信息填充页面,并接收所述用户在所述信息填充页面输入的数据回写信息;
[0045]第一读取模块,用于从第一预设文件中读取与所述模型标识对应的取数脚本;
[0046]第二读取模块,用于从第二预设文件中读取与所述模型标识对应的代码文件与模型文件;
[0047]第一生成模块,用于基于所述数据回写信息、所述取数脚本、所述代码文件以及所述模型文件生成所述目标模型的模型部署文件;
[0048]部署模块,用于基于预设的应用容器引擎与所述模型部署文件对所述目标模型进行部署。
[0049]为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
[0050]判断是否接收到用户触发的模型部署请求;其中,所述模型部署指令携带已完成开发的目标模型的模型标识;
[0051]若是,展示预设的信息填充页面,并接收所述用户在所述信息填充页面输入的数据回写信息;
[0052]从第一预设文件中读取与所述模型标识对应的取数脚本;
[0053]从第二预设文件中读取与所述模型标识对应的代码文件与模型文件;
[0054]基于所述数据回写信息、所述取数脚本、所述代码文件以及所述模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型部署方法,其特征在于,包括下述步骤:判断是否接收到用户触发的模型部署请求;其中,所述模型部署指令携带已完成开发的目标模型的模型标识;若是,展示预设的信息填充页面,并接收所述用户在所述信息填充页面输入的数据回写信息;从第一预设文件中读取与所述模型标识对应的取数脚本;从第二预设文件中读取与所述模型标识对应的代码文件与模型文件;基于所述数据回写信息、所述取数脚本、所述代码文件以及所述模型文件生成所述目标模型的模型部署文件;基于预设的应用容器引擎与所述模型部署文件对所述目标模型进行部署。2.根据权利要求1所述的模型部署方法,其特征在于,所述基于预设的应用容器引擎与所述模型部署文件对所述目标模型进行部署的步骤,具体包括:基于所述应用容器引擎从所述部署文件中获取所述数据回写信息、所述取数脚本、所述代码文件以及所述模型文件;从所述代码文件中获取预设的docker镜像;以及,从所述代码文件中获取环境依赖信息;将所述数据回写信息、所述取数脚本、所述模型文件以及所述环境依赖信息加载至与所述docker镜像对应的目标目录中,并在所述目标目录中触发所述模型文件的运行,以实现对于所述目标模型的部署。3.根据权利要求2所述的模型部署方法,其特征在于,在所述从所述代码文件中获取预设的docker镜像的步骤之前,还包括:从所述代码文件中解析出所述目标模型运行依赖的工具信息;将所述工具信息打包生成对应的docker镜像;将所述docker镜像存储至所述代码文件内的所述目标目录下。4.根据权利要求1所述的模型部署方法,其特征在于,在所述基于预设的应用容器引擎与所述模型部署文件对所述目标模型进行部署的步骤之后,还包括:接收所述用户输入的与所述目标模型对应的调度任务信息;基于所述调度任务信息生成与所述目标模型对应的调度任务;确定与所述调度任务对应的资源分配规则;基于所述资源分配规则执行所述调度任务。5.根据权利要求4所述的模型部署方法,其特征在于,所述确定与所述调度任务对应的资源分配规则的步骤,具体包括:使用第一预设集群作为所述目标模型在执行所述调度任务的取数计算资源;使用第二预设集群作为所述目标模型在执行所述调度任务的模型运行资源;使用第三预设集群作为所述目标模型在执行所述调度任务的数...

【专利技术属性】
技术研发人员:徐洁
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1