基于DCT变换的深度卷积神经网络压缩与加速方案制造技术

技术编号：15033474 阅读：977 留言：0更新日期：2017-04-05 09:24

本发明专利技术公开了一种有效的卷积神经网络压缩方法(CNNpack)。深度卷积神经网络作为一种基本的深度学习结构在许多计算机视觉任务上得到了广泛的使用。然而，目前大多数的卷积神经网络由于其本身的大存储以及高计算量使得在移动设备上的应用得到了限制。本发明专利技术针对这个问题，在频域上对网络进行了压缩；通过将卷积核看做图像，将在频域上的表示分解为共同部分(聚类中心)与私人部分(残差)，然后将低能量的系数抛掉而不影响网络精度。此外，通过线性组合DCT基的卷积响应，可以使得网络计算成本降低。本发明专利技术具有压缩比高、加速比高的特点，可以用于压缩一般的深度卷积网络。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于人工智能领域，涉及机器学习与深度学习，旨在压缩与加速目前常用的深度卷积神经网络，适应于移动端等计算设备。
技术介绍
由于大规模数据量与高性能的图像处理单元(GPU)的普及，深度学习模型(特别是卷积神经网络)已经在计算机视觉上得到了广泛的应用，例如图像分类、人脸验证、物体识别等等。然而因为本身的高存储以及计算要求，目前大多数的卷积神经网络(CNN)模型仅仅在个人电脑或者大型工作站上运行。例如，AlexNet和VGG-Net需要占用超过232MB的存储以及7.24*10^8的乘法计算；这使得它们在智能手机(如IPhone7、华为MATE等)难以得到应用。因此，如何压缩并且加速这些复杂的网络是非常重要的一个问题。虽然CNN拥有百万量级的神经元与权重，但其已被证实超过85％的权重是无用的并可被重置为0。因此，目前大多数的工作主要利用矢量量化技巧、低秩矩阵分解、哈希技巧等；常用的剪枝策略主要是基于小权重对于网络的影响小的假设。然而这些方法都忽略了对于大权重的讨论，所以如何更科学的讨论网络的权重是很有必要的。为了解决上述问题，本专利技术提出利用离散余弦变换(DCT)在频域上操作网络的压缩与加速。特别地，卷积核被看做小尺度的光滑图像块，因此在频域上对于卷积核的DCT系数的操作相当于在时域上同时操作所有的权重。进一步，每个卷积核在频域上的表示被分解为共有部分和私有部分的和；共有部分用来指代每个卷积核与其他卷积核相似的方面，而私有部分用来指代其独特的信息。这两个部分都可以通过舍弃大量微弱系数来实现压缩的目的。在标准数据集上的实验证实了本专利技术要优于目前的比...

【技术保护点】
一种利用DCT变换表示的深度卷积神经网络压缩方案，包括下列步骤：1)提取所有卷积层的卷积核，并将它们变换到DCT频域上；2)将所有卷积核进行聚类，并分解成公共部分和独立部分；3)去掉独立部分中较小的数值，并对剩余的所有数据进行量化；4)对压缩后的网络进行微调，提升精度；5)利用霍夫曼编码，对量化后的数据进行压缩；6)在DCT频域上进行卷积计算。

【技术特征摘要】
1.一种利用DCT变换表示的深度卷积神经网络压缩方案，包括下列步骤：1)提取所有卷积层的卷积核，并将它们变换到DCT频域上；2)将所有卷积核进行聚类，并分解成公共部分和独立部分；3)去掉独立部分中较小的数值，并对剩余的所有数据进行量化；4)对压缩后的网络进行微调，提升精度；5)利用霍夫曼编码，对量化后的数据进行压缩；6)在DCT频域上进行卷积计算。2.如权利要求1所述的方法，其特征在于，我们将所有层的卷积一起考虑，把它们先利用DCT转换到频域上，然后将它们修整到同样的大小。3.如权利要求1所述的方法，其特征在于，我们先利用...

【专利技术属性】
技术研发人员：王云鹤，徐畅，游山，陶大程，许超，
申请(专利权)人：北京大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人