当前位置: 首页 > 专利查询>北京大学专利>正文

基于DCT变换的深度卷积神经网络压缩与加速方案制造技术

技术编号:15033474 阅读:977 留言:0更新日期:2017-04-05 09:24
本发明专利技术公开了一种有效的卷积神经网络压缩方法(CNNpack)。深度卷积神经网络作为一种基本的深度学习结构在许多计算机视觉任务上得到了广泛的使用。然而,目前大多数的卷积神经网络由于其本身的大存储以及高计算量使得在移动设备上的应用得到了限制。本发明专利技术针对这个问题,在频域上对网络进行了压缩;通过将卷积核看做图像,将在频域上的表示分解为共同部分(聚类中心)与私人部分(残差),然后将低能量的系数抛掉而不影响网络精度。此外,通过线性组合DCT基的卷积响应,可以使得网络计算成本降低。本发明专利技术具有压缩比高、加速比高的特点,可以用于压缩一般的深度卷积网络。

【技术实现步骤摘要】

本专利技术属于人工智能领域,涉及机器学习与深度学习,旨在压缩与加速目前常用的深度卷积神经网络,适应于移动端等计算设备。
技术介绍
由于大规模数据量与高性能的图像处理单元(GPU)的普及,深度学习模型(特别是卷积神经网络)已经在计算机视觉上得到了广泛的应用,例如图像分类、人脸验证、物体识别等等。然而因为本身的高存储以及计算要求,目前大多数的卷积神经网络(CNN)模型仅仅在个人电脑或者大型工作站上运行。例如,AlexNet和VGG-Net需要占用超过232MB的存储以及7.24*10^8的乘法计算;这使得它们在智能手机(如IPhone7、华为MATE等)难以得到应用。因此,如何压缩并且加速这些复杂的网络是非常重要的一个问题。虽然CNN拥有百万量级的神经元与权重,但其已被证实超过85%的权重是无用的并可被重置为0。因此,目前大多数的工作主要利用矢量量化技巧、低秩矩阵分解、哈希技巧等;常用的剪枝策略主要是基于小权重对于网络的影响小的假设。然而这些方法都忽略了对于大权重的讨论,所以如何更科学的讨论网络的权重是很有必要的。为了解决上述问题,本专利技术提出利用离散余弦变换(DCT)在频域上操作网络的压缩与加速。特别地,卷积核被看做小尺度的光滑图像块,因此在频域上对于卷积核的DCT系数的操作相当于在时域上同时操作所有的权重。进一步,每个卷积核在频域上的表示被分解为共有部分和私有部分的和;共有部分用来指代每个卷积核与其他卷积核相似的方面,而私有部分用来指代其独特的信息。这两个部分都可以通过舍弃大量微弱系数来实现压缩的目的。在标准数据集上的实验证实了本专利技术要优于目前的比较算法,并且实现了更高的压缩比与加速比。专利技术阐述(具体实施方式)本专利技术的压缩部分主要分为三个模块:卷积核提取与变换、聚类与残差编码以及微调与霍夫曼压缩;每一个模块采用顺序结构执行。(1)卷积核提取与变换对于每一个卷积层将所有的卷积核向量化形成矩阵然后将此矩阵进行DCT变换得到其频域表示给定一个尺度将内的所有重置到矩阵其中(2)聚类与残差编码将频域表示进行Kmeans聚类:得到K个聚类中心U=[μ1,...,μK],对每个卷积层的每个卷积核进行残差编码其中为其相应的聚类中心。利用稀疏编码,得到残差向量的最佳稀疏表示对得到的稀疏表示进行进一步量化具体操作为:其中Clip(x,-b,b)=max(-b,min(b,x)),b为参数,Ω为压缩参数。(3)网络微调与霍夫曼压缩保持丢失的部分不动,对网络进行反向微调。其中,每次微调后对于网络重新进行量化并对于量化后的残差表示进行CSR和霍夫曼编码。进过上述三个模块后,本专利技术可以实现将一个大规模的深度卷积神经网络进行压缩,可实现的压缩比有以下计算公式:其中CNNpack主要有五个重要参数:λ,K,b,Ω。p为卷积层数,H为存储霍夫曼字典的位数。可以看出λ的增大会更侧重共有部分的表示,因此相应的会使得压缩比增大;而b,Ω的增大会使得压缩比降低。参数K直接与最后压缩数据有关,大的K会使得数据的稀疏度增大,但是这会增加相应的存储成本。由上述阐述可以看出本专利技术通过将卷积核转换到频域上,利用它们的聚类中心与残差进行表示可以达到很好的压缩效果。同时本专利技术又提出利用压缩后的网络可以进一步对网络运行进行加速,从而达到实用的标准。本专利技术的做法是将压缩好的网络直接在频域上运行,省去了频域和时域相互转化的过程。给定一个卷积层以及其d×d卷积核记输入数据为和相应的H′×W′输出特征地图为Y={Y1,Y2,...,YN本文档来自技高网...

【技术保护点】
一种利用DCT变换表示的深度卷积神经网络压缩方案,包括下列步骤:1)提取所有卷积层的卷积核,并将它们变换到DCT频域上;2)将所有卷积核进行聚类,并分解成公共部分和独立部分;3)去掉独立部分中较小的数值,并对剩余的所有数据进行量化;4)对压缩后的网络进行微调,提升精度;5)利用霍夫曼编码,对量化后的数据进行压缩;6)在DCT频域上进行卷积计算。

【技术特征摘要】
1.一种利用DCT变换表示的深度卷积神经网络压缩方案,包括下列步骤:1)提取所有卷积层的卷积核,并将它们变换到DCT频域上;2)将所有卷积核进行聚类,并分解成公共部分和独立部分;3)去掉独立部分中较小的数值,并对剩余的所有数据进行量化;4)对压缩后的网络进行微调,提升精度;5)利用霍夫曼编码,对量化后的数据进行压缩;6)在DCT频域上进行卷积计算。2.如权利要求1所述的方法,其特征在于,我们将所有层的卷积一起考虑,把它们先利用DCT转换到频域上,然后将它们修整到同样的大小。3.如权利要求1所述的方法,其特征在于,我们先利用...

【专利技术属性】
技术研发人员:王云鹤徐畅游山陶大程许超
申请(专利权)人:北京大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1