推理库的部署方法、装置和电子设备制造方法及图纸

技术编号：28873298 阅读：12 留言：0更新日期：2021-06-15 23:06

本公开公开了推理库的部署方法、装置和电子设备，涉及人工智能技术领域，尤其涉及深度学习领域。具体实现方案为：获取推理引擎所在硬件环境的配置信息，并基于所述配置信息，生成推理库请求命令；执行所述请求命令生成推理库请求并发送给服务器；接收所述服务器反馈的与所述硬件环境匹配的目标推理库的数据包；根据所述数据包在所述硬件环境上部署所述目标推理库。该方法中，可获取与推理引擎所在硬件环境的配置信息匹配的目标推理库的数据包，并根据数据包在硬件环境上部署目标推理库，可保证目标推理库与推理引擎所在硬件环境的兼容性，提高了目标推理库部署的可靠性，而且目标推理库的获取不需要进行源码编译，耗时较短。

全部详细技术资料下载

【技术实现步骤摘要】
推理库的部署方法、装置和电子设备
本公开涉及计算机
，尤其涉及一种推理库的部署方法、装置、电子设备、存储介质和计算机程序产品。
技术介绍
目前，推理引擎用于将模型部署到硬件环境上，利用硬件环境的计算能力，通过推理库对模型进行前向计算以获取模型的推理结果。然而，相关技术中，需要进行源码编译以获取推理库，源码编译对硬件要求较高，且耗时较长，另外，获取的推理库还可能存在与硬件环境不兼容的问题。
技术实现思路
提供了一种推理库的部署方法、装置、电子设备、存储介质和计算机程序产品。根据第一方面，提供了一种推理库的部署方法，包括：获取推理引擎所在硬件环境的配置信息，并基于所述配置信息，生成推理库请求命令；执行所述请求命令生成推理库请求并发送给服务器；接收所述服务器反馈的与所述硬件环境匹配的目标推理库的数据包；根据所述数据包在所述硬件环境上部署所述目标推理库。根据第二方面，提供了一种推理库的部署装置，包括：获取模块，用于获取推理引擎所在硬件环境的配置信息，并基于所述配置信息，生成推理库请求命令；请求模块，用于执行所述请求命令生成推理库请求并发送给服务器；接收模块，用于接收所述服务器反馈的与所述硬件环境匹配的目标推理库的数据包；部署模块，用于根据所述数据包在所述硬件环境上部署所述目标推理库。根据第三方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述...

【技术保护点】
1.一种推理库的部署方法，包括：/n获取推理引擎所在硬件环境的配置信息，并基于所述配置信息，生成推理库请求命令；/n执行所述请求命令生成推理库请求并发送给服务器；/n接收所述服务器反馈的与所述硬件环境匹配的目标推理库的数据包；/n根据所述数据包在所述硬件环境上部署所述目标推理库。/n

【技术特征摘要】
1.一种推理库的部署方法，包括：
获取推理引擎所在硬件环境的配置信息，并基于所述配置信息，生成推理库请求命令；
执行所述请求命令生成推理库请求并发送给服务器；
接收所述服务器反馈的与所述硬件环境匹配的目标推理库的数据包；
根据所述数据包在所述硬件环境上部署所述目标推理库。

2.根据权利要求1所述的推理库的部署方法，其中，所述根据所述数据包在所述硬件环境上部署所述目标推理库之后，还包括：
响应于所述推理引擎的格式与深度学习模型的格式不匹配，对所述深度学习模型的格式进行转换。

3.根据权利要求2所述的推理库的部署方法，其中，所述对所述深度学习模型的格式进行转换，包括：
基于所述推理引擎的第一格式信息和所述深度学习模型的第二格式信息，生成模型转换程序；
执行所述模型转换程序，对所述深度学习模型的格式进行转换。

4.根据权利要求3所述的推理库的部署方法，其中，所述基于所述推理引擎的第一格式信息和所述深度学习模型的第二格式信息，生成模型转换程序，包括：
从配置文件中读取所述第一格式信息和所述第二格式信息；
将所述第一格式信息和所述第二格式信息写入模型转换程序模板内，以生成所述模型转换程序。

5.根据权利要求3所述的推理库的部署方法，其中，所述基于所述推理引擎的第一格式信息和所述深度学习模型的第二格式信息，生成模型转换程序，包括：
从配置文件中读取所述第一格式信息和所述第二格式信息的存储位置；
将所述存储位置写入模型转换程序模板内，以生成所述模型转换程序。

6.根据权利要求2所述的推理库的部署方法，其中，还包括：
基于所述深度学习模型的模型参数和所述目标推理库的配置信息，构建验证数据；
基于所述验证数据，生成可执行文件并执行；
其中，所述可执行文件用于验证所述深度学习模型在所述目标推理库下的推理速度。

7.根据权利要求2所述的推理库的部署方法，其中，还包括：
基于所述深度学习模型的模型参数和所述目标推理库的配置信息，获取匹配的接口程序模板；
将所述深度学习模型的标识信息和所述目标推理库的标识信息，写入所述匹配的接口程序模板，以生成匹配的调用接口程序。

8.一种推理库的部署装置，包括：
获取模块，用于获取推理引擎所在硬件环境的配置信息，并基于所述配置信息，生成推理库请求命令；
请求模块，用于执行所述请求命令生成推理库请求并发送给服务器；
接收模块，用于接收所述服务器反馈的与所述硬件环境匹配...

【专利技术属性】
技术研发人员：张飞飞，胡志强，王运凯，赵乔，成瑜娟，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人