一种压缩存储卷积神经网络模型的方法及装置制造方法及图纸

技术编号：20390804 阅读：19 留言：0更新日期：2019-02-20 03:13

本发明专利技术提供了一种压缩存储卷积神经网络模型的方法及装置，预先获取经过训练的卷积神经网络模型，包括：对卷积神经网络模型进行剪枝处理，并获取每一个卷积层对应的至少四个卷积权重参数和每一个全连接层对应的至少四个全连接权重参数；针对每一个卷积层，对卷积层对应的至少四个卷积权重参数进行聚类，获取至少一个卷积聚类权重参数和至少一个卷积权重索引；针对每一个全连接层，对全连接层对应的至少四个全连接权重参数进行聚类，获取聚类后的至少一个全连接聚类权重参数和至少一个全连接权重索引；利用二进码十进数BCD码对各个卷积权重索引和各个全连接权重索引进行压缩存储。本方案能够降低卷积神经网络模型占用的存储空间。

全部详细技术资料下载

【技术实现步骤摘要】
一种压缩存储卷积神经网络模型的方法及装置
本专利技术涉及数据存储
，特别涉及一种压缩存储卷积神经网络模型的方法及装置。
技术介绍
在机器学习领域中，卷积神经网络是一种深度前馈人工神经网络，已成功地应用于图像识别。目前，从AlexNet网络结构开始，卷积神经网络都以ImageNet可视化数据库上的分类准确率作为性能评估的主要标准。这使得卷积神经网络架构的发展没有考虑模型复杂度和计算效率问题，从而导致卷积神经网络模型过大，占用智能手机、AR/VR设备、无人机等内存较小的智能设备过多的存储空间。
技术实现思路
本专利技术实施例提供了一种压缩存储卷积神经网络模型的方法及装置，能够降低卷积神经网络模型占用的存储空间。第一方面，本专利技术实施例提供了一种压缩存储卷积神经网络模型的方法，包括：预先获取经过训练的卷积神经网络模型；还包括：对所述卷积神经网络模型进行剪枝处理；获取剪枝处理后的所述卷积神经网络模型的每一个卷积层对应的至少四个卷积权重参数，和每一个全连接层对应的至少四个全连接权重参数；针对每一个所述卷积层，对所述卷积层对应的所述至少四个卷积权重参数进行聚类，获取聚类后的至少一个卷积聚类权重参数；针对每一个所述全连接层，对所述全连接层对应的所述至少四个全连接权重参数进行聚类，获取聚类后的至少一个全连接聚类权重参数；确定所述至少一个卷积聚类权重参数对应的至少一个卷积权重索引，和所述至少一个全连接聚类权重参数对应的至少一个全连接权重索引；利用二进码十进数BCD码压缩所述至少一个卷积权重索引和所述至少一个全连接权重索引；存储压缩后的所述至少一个卷积权重索引和所述至少一...

【技术保护点】
1.一种压缩存储卷积神经网络模型的方法，其特征在于，预先获取经过训练的卷积神经网络模型，还包括：对所述卷积神经网络模型进行剪枝处理；获取剪枝处理后的所述卷积神经网络模型的每一个卷积层对应的至少四个卷积权重参数，和每一个全连接层对应的至少四个全连接权重参数；针对每一个所述卷积层，对所述卷积层对应的所述至少四个卷积权重参数进行聚类，获取聚类后的至少一个卷积聚类权重参数；针对每一个所述全连接层，对所述全连接层对应的所述至少四个全连接权重参数进行聚类，获取聚类后的至少一个全连接聚类权重参数；确定所述至少一个卷积聚类权重参数对应的至少一个卷积权重索引，和所述至少一个全连接聚类权重参数对应的至少一个全连接权重索引；利用二进码十进数BCD码压缩所述至少一个卷积权重索引和所述至少一个全连接权重索引；存储压缩后的所述至少一个卷积权重索引和所述至少一个全连接权重索引。

【技术特征摘要】
1.一种压缩存储卷积神经网络模型的方法，其特征在于，预先获取经过训练的卷积神经网络模型，还包括：对所述卷积神经网络模型进行剪枝处理；获取剪枝处理后的所述卷积神经网络模型的每一个卷积层对应的至少四个卷积权重参数，和每一个全连接层对应的至少四个全连接权重参数；针对每一个所述卷积层，对所述卷积层对应的所述至少四个卷积权重参数进行聚类，获取聚类后的至少一个卷积聚类权重参数；针对每一个所述全连接层，对所述全连接层对应的所述至少四个全连接权重参数进行聚类，获取聚类后的至少一个全连接聚类权重参数；确定所述至少一个卷积聚类权重参数对应的至少一个卷积权重索引，和所述至少一个全连接聚类权重参数对应的至少一个全连接权重索引；利用二进码十进数BCD码压缩所述至少一个卷积权重索引和所述至少一个全连接权重索引；存储压缩后的所述至少一个卷积权重索引和所述至少一个全连接权重索引。2.根据权利要求1所述的方法，其特征在于，所述对所述卷积层对应的所述至少四个卷积权重参数进行聚类，获取聚类后的至少一个卷积聚类权重参数，包括：S0：确定所述卷积层对应的所述至少四个卷积权重参数的参数量，是否大于预设的第一参数值，如果是，执行S1，否则，执行S2；S1：对所述至少四个卷积权重参数进行聚类，执行S4；S2：将所述卷积层对应的所述至少四个卷积权重参数划分为至少两个卷积等级，执行S3；S3：针对每一个所述卷积等级，对所述卷积等级的至少两个所述卷积权重参数进行聚类，执行S4；S4：获取聚类后的至少一个卷积聚类权重参数。3.根据权利要求1所述的方法，其特征在于，所述对所述全连接层对应的所述至少四个全连接权重参数进行聚类，获取聚类后的至少一个全连接聚类权重参数，包括：D0：确定所述全连接层对应的所述至少全连接四个权重参数的参数量，是否大于预设的第二参数值，如果是，执行D1，否则，执行D2；D1：对所述至少四个全连接权重参数进行聚类，执行D4；D2：将所述全连接层对应的所述至少四个全连接权重参数划分为至少全连接两个等级，执行D3；D3：针对每一个所述全连接等级，对所述全连接等级的至少两个全连接所述权重参数进行聚类，执行D4；D4：获取聚类后的至少一个全连接聚类权重参数。4.根据权利要求1所述的方法，其特征在于，所述利用二进码十进数BCD码压缩所述至少一个卷积权重索引和所述至少一个全连接权重索引，包括：将所述至少一个卷积聚类权重索引，转换为对应的卷积权重索引BCD码；将所述至少一个全连接聚类权重索引，转换为对应的全连接权重索引BCD码；则，所述存储压缩后的所述至少一个卷积权重索引和所述至少一个全连接权重索引，包括：存储所述卷积权重索引BCD码和所述全连接权重索引BCD码。5.根据权利要求1至4中任一所述的方法，其特征在于，所述对所述卷积神经网络模型进行剪枝处...

【专利技术属性】
技术研发人员：段成德，于治楼，姜凯，高岩，
申请(专利权)人：济南浪潮高新科技投资发展有限公司，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人