一种网络模型部署方法、装置、设备及可读存储介质制造方法及图纸

技术编号：26173068 阅读：38 留言：0更新日期：2020-10-31 13:54

本发明专利技术公开了一种网络模型部署方法、装置、设备及计算机可读存储介质，该方法包括：获取采用目标框架得到的网络模型文件；根据目标框架确定目标解析方式，按照目标解析方式对网络模型文件进行解析，得到中间文件；利用中间文件得到结构文件，并对结构文件进行格式转换处理，得到与FPGA设备适配的标准结构文件和控制文件；获取多个算子编码，利用多个算子编码、标准结构文件和控制文件生成比特流文件；将比特流文件存储在FPGA设备中，完成网络模型在FPGA设备上的部署；该方法通过两次转换，可以实现任一架构的网络模型在FPGA设备上的快速部署，提高了部署灵活性和部署速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种网络模型部署方法、装置、设备及可读存储介质
本专利技术涉及深度学习
，特别涉及一种网络模型部署方法、网络模型部署装置、网络模型部署设备及计算机可读存储介质。
技术介绍
为了提高神经网络模型的数据处理速度，很多厂商将神经网络模型部署在FPGA设备上，利用FPGA设备进行高速计算。相关技术将某一框架下的神经网络模型部署到FPGA设备后，如果想要部署其他框架下的神经网络模型，则需要很多其他的工作使FPGA设备支持新框架下的神经网络模型，例如可能需要对FPGA设备进行调整。这使得相关技术部署神经网络模型时灵活性较差，效率较慢。因此，如何解决相关技术存在的部署灵活性较差，部署速度较慢的问题，是本领域技术人员需要解决的技术问题。
技术实现思路
有鉴于此，本专利技术的目的在于提供一种网络模型部署方法、网络模型部署装置、网络模型部署设备及计算机可读存储介质，解决了相关技术存在的部署灵活性较差，部署速度较慢的问题。为解决上述技术问题，本专利技术提供了一种网络模型部署方法，包括：获取采用目标...

【技术保护点】
1.一种网络模型部署方法，其特征在于，包括：/n获取采用目标框架得到的网络模型文件；/n根据所述目标框架确定目标解析方式，按照所述目标解析方式对所述网络模型文件进行解析，得到中间文件；/n利用所述中间文件得到结构文件，并对所述结构文件进行格式转换处理，得到与FPGA设备适配的标准结构文件和控制文件；/n获取多个算子编码，利用多个所述算子编码、所述标准结构文件和所述控制文件生成比特流文件；/n将所述比特流文件存储在所述FPGA设备中，完成网络模型在所述FPGA设备上的部署。/n

【技术特征摘要】
1.一种网络模型部署方法，其特征在于，包括：
获取采用目标框架得到的网络模型文件；
根据所述目标框架确定目标解析方式，按照所述目标解析方式对所述网络模型文件进行解析，得到中间文件；
利用所述中间文件得到结构文件，并对所述结构文件进行格式转换处理，得到与FPGA设备适配的标准结构文件和控制文件；
获取多个算子编码，利用多个所述算子编码、所述标准结构文件和所述控制文件生成比特流文件；
将所述比特流文件存储在所述FPGA设备中，完成网络模型在所述FPGA设备上的部署。

2.根据权利要求1所述的网络模型部署方法，其特征在于，所述获取多个算子编码，包括：
识别所述网络模型文件中的多种计算算子；
获取通信算子，对所述通信算子和多种所述计算算子进行编码，得到多个所述算子编码。

3.根据权利要求1所述的网络模型部署方法，其特征在于，所述根据所述目标框架确定目标解析方式，包括：
确定所述网络模型文件的保存方式；
根据所述目标框架和所述保存方式确定所述目标解析方式。

4.根据权利要求1所述的网络模型部署方法，其特征在于，所述利用所述中间文件得到结构文件，包括：
对所述中间文件进行网络层压缩处理和优化处理，得到优化文件；
根据所述优化文件得到所述结构文件。

5.根据权利要求1所述的网络模型部署方法，其特征在于，还包括：
利用所述中间文件获取所述网络模型文件对应的权重文件；
获取输入数据，并将所述输入数据和所述权重文件发送给所述FPGA设备，以便所述FPGA设...

【专利技术属性】
技术研发人员：赵红博，阚宏伟，赵谦谦，
申请(专利权)人：苏州浪潮智能科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人