【技术实现步骤摘要】
本专利技术属于人工智能领域,涉及机器学习与深度学习,旨在压缩与加速目前常用的深度卷积神经网络,适应于移动端等计算设备。
技术介绍
由于大规模数据量与高性能的图像处理单元(GPU)的普及,深度学习模型(特别是卷积神经网络)已经在计算机视觉上得到了广泛的应用,例如图像分类、人脸验证、物体识别等等。然而因为本身的高存储以及计算要求,目前大多数的卷积神经网络(CNN)模型仅仅在个人电脑或者大型工作站上运行。例如,AlexNet和VGG-Net需要占用超过232MB的存储以及7.24*10^8的乘法计算;这使得它们在智能手机(如IPhone7、华为MATE等)难以得到应用。因此,如何压缩并且加速这些复杂的网络是非常重要的一个问题。虽然CNN拥有百万量级的神经元与权重,但其已被证实超过85%的权重是无用的并可被重置为0。因此,目前大多数的工作主要利用矢量量化技巧、低秩矩阵分解、哈希技巧等;常用的剪枝策略主要是基于小权重对于网络的影响小的假设。然而这些方法都忽略了对于大权重的讨论,所以如何更科学的讨论网络的权重是很有必要的。为了解决上述问题,本专利技术提出利用离散余弦变换(DCT)在频域上操作网络的压缩与加速。特别地,卷积核被看做小尺度的光滑图像块,因此在频域上对于卷积核的DCT系数的操作相当于在时域上同时操作所有的权重。进一步,每个卷积核在频域上的表示被分解为共有部分和私有部分的和;共有部分用来指代每个卷积核与其他卷积核相似的方面,而私有部分用来指代其独特的信息。这两个部分都可以通过舍弃大量微弱系数来实现压缩的目的。在标准数据集上的实验证实了本专利技术要优于目前的比 ...
【技术保护点】
一种利用DCT变换表示的深度卷积神经网络压缩方案,包括下列步骤:1)提取所有卷积层的卷积核,并将它们变换到DCT频域上;2)将所有卷积核进行聚类,并分解成公共部分和独立部分;3)去掉独立部分中较小的数值,并对剩余的所有数据进行量化;4)对压缩后的网络进行微调,提升精度;5)利用霍夫曼编码,对量化后的数据进行压缩;6)在DCT频域上进行卷积计算。
【技术特征摘要】
1.一种利用DCT变换表示的深度卷积神经网络压缩方案,包括下列步骤:1)提取所有卷积层的卷积核,并将它们变换到DCT频域上;2)将所有卷积核进行聚类,并分解成公共部分和独立部分;3)去掉独立部分中较小的数值,并对剩余的所有数据进行量化;4)对压缩后的网络进行微调,提升精度;5)利用霍夫曼编码,对量化后的数据进行压缩;6)在DCT频域上进行卷积计算。2.如权利要求1所述的方法,其特征在于,我们将所有层的卷积一起考虑,把它们先利用DCT转换到频域上,然后将它们修整到同样的大小。3.如权利要求1所述的方法,其特征在于,我们先利用...
【专利技术属性】
技术研发人员:王云鹤,徐畅,游山,陶大程,许超,
申请(专利权)人:北京大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。