一种基于深度卷积神经网络模型压缩和加速方法技术

技术编号:24686716 阅读:85 留言:0更新日期:2020-06-27 08:52
本发明专利技术公开了一种基于深度卷积神经网络模型压缩和加速方法,包括以下步骤:S1:搭建深度卷积神经网络模型,并使用训练数据对所述模型进行训练,得到预训练模型;S2:按照剪枝比率A,求解得到所述预训练模型中卷积层的冗余通道,对所述冗余通道对应的网络权重参数置零,得到剪枝模型;S3:对所述剪枝模型使用稀疏训练的方式进行训练,得到收敛剪枝模型;S4:根据所述预训练模型和所述收敛剪枝模型,搭建新网络模型;S5:将所述收敛剪枝模型的网络参数按照对应关系赋值给所述新网络模型,得到最终模型,并存储。在本发明专利技术在保持准确率基本不变的情况下,压缩模型并降低了预测时间,提升模型的检测效率。

A compression and acceleration method of neural network model based on deep convolution

【技术实现步骤摘要】
一种基于深度卷积神经网络模型压缩和加速方法
本专利技术涉及深度学习领域,特别是涉及一种基于深度卷积神经网络模型压缩和加速方法。
技术介绍
随着深度卷积神经网络的广泛应用,为达到更高的准确率,深度卷积神经网络引入更多的神经元、增加更多的网络层数,这导致深度卷积神经网络的参数变多、模型变大、预测时间变长。而在存储空间和计算资源有限的移动终端或嵌入式设备中,往往难以部署较大的模型。
技术实现思路
有鉴于此,为克服大模型在存储空间和计算资源有限的移动终端或嵌入式设备的部署问题,本专利技术提出了一种基于深度卷积神经网络模型压缩和加速方法,该方法在保持模型准确率不变的情况下,压缩深度卷积神经网络模型,降低模型预测时间。具体内容如下:一种基于深度卷积神经网络模型压缩和加速方法,包括以下步骤:S1:搭建深度卷积神经网络模型,并使用训练数据对所述模型进行训练,得到预训练模型;S2:按照剪枝比率A,求解得到所述预训练模型中卷积层的冗余通道,对所述冗余通道对应的网络权重参数置零,得到剪枝模型;S3:对所述剪枝模型使本文档来自技高网...

【技术保护点】
1.一种基于深度卷积神经网络模型压缩和加速方法,其特征在于,包括以下步骤:/nS1:搭建深度卷积神经网络模型,并使用训练数据对所述模型进行训练,得到预训练模型;/nS2:按照剪枝比率A,求解得到所述预训练模型中卷积层的冗余通道,对所述冗余通道对应的网络权重参数置零,得到剪枝模型;/nS3:对所述剪枝模型使用稀疏训练的方式进行训练,得到收敛剪枝模型;/nS4:根据所述预训练模型和所述收敛剪枝模型,搭建新网络模型;/nS5:将所述收敛剪枝模型的网络参数按照对应关系赋值给所述新网络模型,得到最终模型,并存储。/n

【技术特征摘要】
1.一种基于深度卷积神经网络模型压缩和加速方法,其特征在于,包括以下步骤:
S1:搭建深度卷积神经网络模型,并使用训练数据对所述模型进行训练,得到预训练模型;
S2:按照剪枝比率A,求解得到所述预训练模型中卷积层的冗余通道,对所述冗余通道对应的网络权重参数置零,得到剪枝模型;
S3:对所述剪枝模型使用稀疏训练的方式进行训练,得到收敛剪枝模型;
S4:根据所述预训练模型和所述收敛剪枝模型,搭建新网络模型;
S5:将所述收敛剪枝模型的网络参数按照对应关系赋值给所述新网络模型,得到最终模型,并存储。


2.根据权利要求...

【专利技术属性】
技术研发人员:罗文
申请(专利权)人:中云智慧北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1