一种适合硬件的卷积神经网络压缩方法技术

技术编号：21142190 阅读：51 留言：0更新日期：2019-05-18 05:28

本发明专利技术提供一种适合硬件的卷积神经网络压缩方法，包括如下步骤：S1)采用参数全为3bit的All Conv Net卷积网络结构在数据集上训练和测试；S2)设计反向传播函数计算梯度；S3)针对新的计算方法，设计FPGA的卷积阵列；S4)在深度学习框架下编写深度学习模型，并进行模型训练和测试，存储训练后的模型；S5)在python上记录模型训练的accuracy和loss。本发明专利技术通过将卷积网络中的参数都用3bit的特殊值代替，同时设计新的反向传播函数以避免在参数替换过程中造成梯度消失，从而实现适用于FPGA、减少FPGA中DSP资源以及参数存储空间的卷积神经网络压缩方法。

全部详细技术资料下载

【技术实现步骤摘要】
一种适合硬件的卷积神经网络压缩方法
本专利技术涉及卷积神经网络
，具体涉及一种适合硬件的卷积神经网络压缩方法。
技术介绍
随着深度学习的发展，各种卷积神经网络的参数越来越庞大。传统卷积网络的训练和测试都是在PC上进行的，训练过程中会获得庞大的参数量，且在测试过程中需要用到这些参数并进行大量复杂的运算，庞大的参数量及运算使得这种卷积网络不能很好地移植到移动设备上。FPGA(现场可编程门阵列)由于其并行计算的优势，是一种很好的计算卷积神经网络的硬件设备，但是也受限于卷积网络的参数量。针对上述问题，急需一种可压缩卷积网络参数量的方法，以保证在硬件(FPGA)上计算卷积网络。
技术实现思路
本专利技术的目的是提供一种适用于FPGA、减少FPGA中DSP资源以及参数存储空间的卷积神经网络压缩方法。为了达到上述目的，本专利技术通过以下技术方案来实现：一种适合硬件的卷积神经网络压缩方法，包括如下步骤：S1)采用参数全为3bit的AllConvNet卷积网络结构在数据集上训练和测试；S2)设计反向传播函数计算梯度xk＝relu(wk·xk-1+bk)，其中，xk为第k层的输入，wk为第k层的权值矩阵，relu()为RELU激活函数，bk为偏置项；S3)针对步骤S2)的计算方法，设计FPGA的卷积阵列；S4)在深度学习框架下编写深度学习模型，并进行模型训练和测试，存储训练后的模型；S5)在python上记录模型训练的accuracy和loss。进一步地，在步骤S2)中，存储参数时，对权值矩阵进行3bit编码。进一步地，在步骤S2)中，对权值矩阵中每个权值扩展权值精度，即用...

【技术保护点】
1.一种适合硬件的卷积神经网络压缩方法，其特征在于包括如下步骤：S1)采用参数全为3bit的All Conv Net卷积网络结构在数据集上训练和测试；S2)设计反向传播函数计算梯度x

【技术特征摘要】
1.一种适合硬件的卷积神经网络压缩方法，其特征在于包括如下步骤：S1)采用参数全为3bit的AllConvNet卷积网络结构在数据集上训练和测试；S2)设计反向传播函数计算梯度xk＝relu(wk·xk-1+bk)，其中，xk为第k层的输入，wk为第k层的权值矩阵，relu()为RELU激活函数，bk为偏置项；S3)针对步骤S2)的计算方法，设计FPGA的卷积阵列；S4)在深度学习框架下编写深度学习模型，并进行模型训练和测试，存储训练后的模型；S5)在python上记录模型训练的accuracy和loss。2.根据权利要...

【专利技术属性】
技术研发人员：刘勇，陈军，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人