一种基于权重归一化的深度神经网络压缩方法技术

技术编号：22187023 阅读：42 留言：0更新日期：2019-09-25 03:52

本发明专利技术公开了一种基于权重归一化的深度神经网络压缩方法，权重的量化可以分解为三个步骤，首先对权重进行归一化，然后基于最小量化误差把权重量化至极低的比特，最后进行反归一化得到量化的权重，使用量化的权重进行神经网络的正向传播。为了训练量化权重的神经网络，本发明专利技术对阶跃形式的量化函数的导数进行近似，从而使得神经网络的梯度可以进行反向传播，梯度累加在浮点权重上。基于权重归一化的权重量化在一定程度上避免了权重的长尾分布，从而减小了量化误差，进而提高了模型的性能。本发明专利技术可以把现在的一些主流神经网络的权重压缩至2比特、3比特，同时保证模型的性能没有较大的损失。

A Compression Method of Depth Neural Network Based on Weight Normalization

全部详细技术资料下载

【技术实现步骤摘要】
一种基于权重归一化的深度神经网络压缩方法
本专利技术提供一种基于权重归一化的深度神经网络压缩方法，涉及压缩(量化)神经网络的参数，可以将模型的权重量化至极低的比特数目(2比特、3比特)适用于压缩各种主流的神经网络的参数，如ResNet，MobileNet等，从而使得模型可以部署到移动端设备。
技术介绍
随着深度学习的发展，深度神经网络逐渐成为机器学习的主流模型。但是，深度学习模型有大量的参数同时需要极大的计算开销，不利于模型向移动设备和嵌入式设备部署。根据已有研究，深度神经网络中存在大量冗余，因此可以对模型的参数进行极大的压缩，同时保证模型的性能没有显著的下降。模型权重量化是模型压缩的一个主要方法，尽管现有的方法可以把模型的参数量化至8比特几乎没有性能损失，但是当权重量化至极低的比特数目时，往往会带来较大的性能损失。一种主流的权重量化方法是基于最小量化误差量化权重，但是这种方法受到权重的长尾分布的影响，导致较大的相对量化误差，进而造成量化模型性能的损失。
技术实现思路
专利技术目的：目前的基于最小量化误差的权重量化方法受到权重的长尾分布的影响，会带来较大的相对量化误差。针对上述问题，本专利技术提供了一种基于权重归一化的深度神经网络压缩方法。先对权重归一化，再基于最小量化误差对权重量化，最后对权重反归一化得到量化的权重。同时对阶跃形式的量化函数的导数进行近似，使得神经网络的反向传播可以正常进行。本专利技术通过使用最大绝对值元素进行权重归一化，从而得到最大绝对值元素的梯度形式不同于其他元素的梯度，使得最大绝对值元素在每次迭代都快速向0值靠近，从而在多次迭代之后可以...

【技术保护点】
1.一种基于权重归一化的深度神经网络压缩方法，其特征在于：在神经网络正向传播过程中，首先对权重归一化，然后基于最小量化误差量化权重，再进行反归一化得到量化的权重，使用量化的权重进行神经网络的正向传播；在反向传播过程中，对阶跃形式的量化函数的导数进行近似，使得神经网络可以反向传播，从而进行端到端的训练，梯度累加在浮点权重上。

【技术特征摘要】
1.一种基于权重归一化的深度神经网络压缩方法，其特征在于：在神经网络正向传播过程中，首先对权重归一化，然后基于最小量化误差量化权重，再进行反归一化得到量化的权重，使用量化的权重进行神经网络的正向传播；在反向传播过程中，对阶跃形式的量化函数的导数进行近似，使得神经网络可以反向传播，从而进行端到端的训练，梯度累加在浮点权重上。2.如权利要求1所述的基于权重归一化的深度神经网络压缩方法，其特征在于，在正向传播过程中，首先对权重归一化，然后基于最小量化误差量化权重，再进行反归一化得到量化的权重，具体步骤为：步骤100，获取预训练的全精度模型的参数，对所有卷积层和全连接层的每个滤波器的参数向量化，得到w∈RM；步骤101，对参数w进行归一化，使用w的最大绝对值的元素把w中的每个元素归一化到[-1,1],即步骤102，基于对的最小量化误差求解最优的量化基α，得到相应的量化值集合V(α)；步骤103，对归一化之后的权重量化得到即投影函数(量化函数)Π(·)把中的每个元素投影到量化值的集合V(α)；步骤104，对量化的归一化权重进行反归一化得到量化的权重wq，目的是保持量化的权重和原始参数w有相同的量级，即detach(·)操作把其中的变量视为常量；步骤105，由得到的量化权重wq和神经网络这一层的输入x进行卷积操作(全连接操作)得到神经网络这一层的输出y。3.如权利要求1所述的基于权重归一化的深度神经网络压缩方法，其特征在于：在反向传播过程中，对阶跃形式的量化函数的导数进行近似，使得神经网络可以反向传播，具体步骤为：步骤20...

【专利技术属性】
技术研发人员：李武军，蔡文朴，
申请(专利权)人：南京大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人