【技术实现步骤摘要】
一种神经网络模型压缩方法及装置
本专利技术实施例涉及神经网络
,尤其涉及一种神经网络模型压缩方法及装置。
技术介绍
目前,神经网络在计算机视觉、语音处理等领域已经取得了突破性的进展,因而成为现代人工智能应用的基础。随着物联网技术的发展,越来越多的深度神经网络模型需要部署到端设备或者边缘设备上以满足各式各样的需求,例如人脸识别、物流自动分解等。而随着神经网络模型的层数越来越多,神经网络模型权重的数量也随之增长,再加之受限于端设备或者边缘设备的性能和功耗,因此,各种的加速器技术应用而生。其中,位串行加速器相较于其他神经网络加速器,通过改进的位串行乘法部件可以跳过8bit中位为0的运算,而只保留位为1的运算,由此可以实现性能的提升。同时对于相同的神经网络结构而言,权重二进制中1的占比越低,位串行加速器则能够跳过更多的冗余计算,也就能够更有效的实现性能的提升,因此,对神经网络模型压缩(也可称为去冗余)以提高权值位稀疏度(即提高权重二进制中0的比例)具有重要意义。
技术实现思路
鉴于此,为解决上述技术 ...
【技术保护点】
1.一种神经网络模型压缩方法,其特征在于,所述方法包括:/n对已训练的神经网络模型中的权重和激活值进行量化;/n确定量化后的神经网络模型中每一层的位剪枝强度;/n针对所述量化后的神经网络模型的每一层,基于该层的位剪枝强度对该层中的权重进行剪枝处理;/n对剪枝处理后的神经网络模型进行重训练。/n
【技术特征摘要】
1.一种神经网络模型压缩方法,其特征在于,所述方法包括:
对已训练的神经网络模型中的权重和激活值进行量化;
确定量化后的神经网络模型中每一层的位剪枝强度;
针对所述量化后的神经网络模型的每一层,基于该层的位剪枝强度对该层中的权重进行剪枝处理;
对剪枝处理后的神经网络模型进行重训练。
2.根据权利要求1所述的方法,其特征在于,所述对已训练的神经网络模型中的权重和激活值进行量化,包括:
依据设定的量化位宽对已训练的神经网络模型中的权重和激活值进行量化。
3.根据权利要求1所述的方法,其特征在于,所述确定量化后的神经网络模型中每一层的位剪枝强度,包括:
利用启发式算法对量化后的神经网络模型中每一层的冗余度进行测试;
依据测试结果确定量化后的神经网络模型中每一层的位剪枝强度。
4.根据权利要求1所述的方法,其特征在于,所述对剪枝处理后的神经网络模型进行重训练,包括:
利用改进的梯度下降算法对剪枝处理后的神经网络模型进行重训练,所述改进的随机梯度下降算法是指:利用直通梯度估计法确定下降梯度并判断使用所述下降梯度更新量化后的权重是否能够满足设定条件,如果是,则使用所述下降梯度更新量化后的权重;如果否,则不对所述量化后的权重进行更新。
5.根据权利要求1~4任一所述的方法,其特征在于,所述方法还包括:
将重训练后的神经网络模型部署到位串行加速器上。
6.一种神经网络模型压缩装置,其特征在于,所述装置包括:
量化模块,用于对已训练的神经网络模型中的权重和激活值进行量化;
确定模块,用于确定量化后的神经网络模型中每一层的位剪枝强度;
剪枝模块,用...
【专利技术属性】
技术研发人员:方济生,
申请(专利权)人:中科物栖北京科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。