基于自动编码器压缩卷积神经网络的方法及装置制造方法及图纸

技术编号：19594081 阅读：28 留言：0更新日期：2018-11-28 05:07

本发明专利技术公开了一种基于自动编码器压缩卷积神经网络的方法，包括：在压缩第i个网络层时，将第i‑1层与第i+1层的激活值提取出来，其中ai‑1与ai+1分别代表第i‑1层与第i+1层在测试集上的输出；使用比第i个网络层少的卷积核或神经元的替换模型拟合ai‑1与ai+1之间的映射关系，将拟合完成的替换模型替换原卷积神经网络的第i层；对剩余参数进行调整，使压缩后的卷积神经网络模型精度不小于原卷积神经网络模型精度。该算法在降低网络规模的同时还能加快计算速度。

全部详细技术资料下载

【技术实现步骤摘要】
基于自动编码器压缩卷积神经网络的方法及装置
本专利技术涉及卷积神经网络
，具体地涉及一种基于自动编码器压缩卷积神经网络的方法及装置。
技术介绍
经过近几年的发展，卷积神经网络已经成为许多计算机视觉任务中的主要模型。然而，由于移动设备的硬件资源有限，无论在时间还是空间上都无法满足大型网络的计算需求。为此，研究人员提出了一系列优化策略。DeepCompression是模型压缩的一个代表性工作，它通过删除冗余连接来降低模型尺寸。然而，连接剪枝会导致网络结构变得稀疏，稀疏模型的计算不规则性使其无法有效利用密集型线性代数库，计算速度也就没有得到相应提升。
技术实现思路
针对上述连接剪枝所带来的技术问题，本专利技术目的是：提供了一种基于自动编码器压缩卷积神经网络的方法及装置，该算法在降低网络规模的同时还能加快计算速度。本专利技术的技术方案是：一种基于自动编码器压缩卷积神经网络的方法，包括以下步骤：S01：在压缩第i个网络层时，将第i-1层与第i+1层的激活值提取出来，其中ai-1与ai+1分别代表第i-1层与第i+1层在测试集上的输出；S02：使用比第i个网络层少的卷积核或神经元的替换模型拟合ai-1与ai+1之间的映射关系，将拟合完成的替换模型替换原卷积神经网络的第i层；S03：对剩余参数进行调整，使压缩后的卷积神经网络模型精度不小于原卷积神经网络模型精度。优选的技术方案中，若压缩后的卷积神经网络模型精度小于原卷积神经网络模型精度，使用比替换模型多的卷积核或神经元的第二替换模型进一步拟合。本专利技术还公开了一种基于自动编码器压缩卷积神经网络的装置，包括：一提取模块...

【技术保护点】
1.一种基于自动编码器压缩卷积神经网络的方法，其特征在于，包括以下步骤：S01：在压缩第i个网络层时，将第i‑1层与第i+1层的激活值提取出来，其中ai‑1与ai+1分别代表第i‑1层与第i+1层在测试集上的输出；S02：使用比第i个网络层少的卷积核或神经元的替换模型拟合ai‑1与ai+1之间的映射关系，将拟合完成的替换模型替换原卷积神经网络的第i层；S03：对剩余参数进行调整，使压缩后的卷积神经网络模型精度不小于原卷积神经网络模型精度。

【技术特征摘要】
1.一种基于自动编码器压缩卷积神经网络的方法，其特征在于，包括以下步骤：S01：在压缩第i个网络层时，将第i-1层与第i+1层的激活值提取出来，其中ai-1与ai+1分别代表第i-1层与第i+1层在测试集上的输出；S02：使用比第i个网络层少的卷积核或神经元的替换模型拟合ai-1与ai+1之间的映射关系，将拟合完成的替换模型替换原卷积神经网络的第i层；S03：对剩余参数进行调整，使压缩后的卷积神经网络模型精度不小于原卷积神经网络模型精度。2.根据权利要求1所述的基于自动编码器压缩卷积神经网络的方法，其特征在于，...

【专利技术属性】
技术研发人员：吴俊敏，吴焕，丁杰，
申请(专利权)人：中国科学技术大学苏州研究院，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人