一种网络模型部署方法、装置、设备及可读存储介质制造方法及图纸

技术编号:26173068 阅读:38 留言:0更新日期:2020-10-31 13:54
本发明专利技术公开了一种网络模型部署方法、装置、设备及计算机可读存储介质,该方法包括:获取采用目标框架得到的网络模型文件;根据目标框架确定目标解析方式,按照目标解析方式对网络模型文件进行解析,得到中间文件;利用中间文件得到结构文件,并对结构文件进行格式转换处理,得到与FPGA设备适配的标准结构文件和控制文件;获取多个算子编码,利用多个算子编码、标准结构文件和控制文件生成比特流文件;将比特流文件存储在FPGA设备中,完成网络模型在FPGA设备上的部署;该方法通过两次转换,可以实现任一架构的网络模型在FPGA设备上的快速部署,提高了部署灵活性和部署速度。

【技术实现步骤摘要】
一种网络模型部署方法、装置、设备及可读存储介质
本专利技术涉及深度学习
,特别涉及一种网络模型部署方法、网络模型部署装置、网络模型部署设备及计算机可读存储介质。
技术介绍
为了提高神经网络模型的数据处理速度,很多厂商将神经网络模型部署在FPGA设备上,利用FPGA设备进行高速计算。相关技术将某一框架下的神经网络模型部署到FPGA设备后,如果想要部署其他框架下的神经网络模型,则需要很多其他的工作使FPGA设备支持新框架下的神经网络模型,例如可能需要对FPGA设备进行调整。这使得相关技术部署神经网络模型时灵活性较差,效率较慢。因此,如何解决相关技术存在的部署灵活性较差,部署速度较慢的问题,是本领域技术人员需要解决的技术问题。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种网络模型部署方法、网络模型部署装置、网络模型部署设备及计算机可读存储介质,解决了相关技术存在的部署灵活性较差,部署速度较慢的问题。为解决上述技术问题,本专利技术提供了一种网络模型部署方法,包括:获取采用目标框架得到的网络模型文本文档来自技高网...

【技术保护点】
1.一种网络模型部署方法,其特征在于,包括:/n获取采用目标框架得到的网络模型文件;/n根据所述目标框架确定目标解析方式,按照所述目标解析方式对所述网络模型文件进行解析,得到中间文件;/n利用所述中间文件得到结构文件,并对所述结构文件进行格式转换处理,得到与FPGA设备适配的标准结构文件和控制文件;/n获取多个算子编码,利用多个所述算子编码、所述标准结构文件和所述控制文件生成比特流文件;/n将所述比特流文件存储在所述FPGA设备中,完成网络模型在所述FPGA设备上的部署。/n

【技术特征摘要】
1.一种网络模型部署方法,其特征在于,包括:
获取采用目标框架得到的网络模型文件;
根据所述目标框架确定目标解析方式,按照所述目标解析方式对所述网络模型文件进行解析,得到中间文件;
利用所述中间文件得到结构文件,并对所述结构文件进行格式转换处理,得到与FPGA设备适配的标准结构文件和控制文件;
获取多个算子编码,利用多个所述算子编码、所述标准结构文件和所述控制文件生成比特流文件;
将所述比特流文件存储在所述FPGA设备中,完成网络模型在所述FPGA设备上的部署。


2.根据权利要求1所述的网络模型部署方法,其特征在于,所述获取多个算子编码,包括:
识别所述网络模型文件中的多种计算算子;
获取通信算子,对所述通信算子和多种所述计算算子进行编码,得到多个所述算子编码。


3.根据权利要求1所述的网络模型部署方法,其特征在于,所述根据所述目标框架确定目标解析方式,包括:
确定所述网络模型文件的保存方式;
根据所述目标框架和所述保存方式确定所述目标解析方式。


4.根据权利要求1所述的网络模型部署方法,其特征在于,所述利用所述中间文件得到结构文件,包括:
对所述中间文件进行网络层压缩处理和优化处理,得到优化文件;
根据所述优化文件得到所述结构文件。


5.根据权利要求1所述的网络模型部署方法,其特征在于,还包括:
利用所述中间文件获取所述网络模型文件对应的权重文件;
获取输入数据,并将所述输入数据和所述权重文件发送给所述FPGA设备,以便所述FPGA设...

【专利技术属性】
技术研发人员:赵红博阚宏伟赵谦谦
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1