基于块项张量分解的深度神经网络压缩方法技术

技术编号：17780475 阅读：69 留言：0更新日期：2018-04-22 09:23

本发明专利技术公开了一种基于块项张量分解的深度神经网络压缩方法。其包括获取深度神经网络框架，将权重矩阵W和输入向量x分别转化为高阶张量

全部详细技术资料下载

【技术实现步骤摘要】
基于块项张量分解的深度神经网络压缩方法
本专利技术属于深度神经网络
，尤其涉及一种基于块项张量分解的深度神经网络压缩方法。
技术介绍
近年来，以深度神经网络为代表的深度学习在图像分类、语音识别、自然语言处理等人工智能领域取得了比传统方法显著提高的效果，进而吸引了学术界、工业界和政府的广泛关注。然而深度神经网络结构复杂、层数较多、参数量巨大，训练好的模型往往占用很大的存储空间，难以移植到小型终端上；并且时间复杂性也很高，即使在高性能图形处理器上训练也常常需要数天，这些都迫使我们需要压缩深度神经网络。由于深度神经网络的权重实质上就是一些高维矩阵，因此很自然的一种压缩方法就是矩阵分解，但矩阵分解的压缩能力太低，最多只能压缩数十倍。所以最近兴起了利用张量分解压缩的办法，比如“张量火车”分解方法能够把VGG网络中单层全连接层压缩成千上万倍。然而由于张量火车分解方法本身具有“不对称”和“线性表达能力”的特性，导致了压缩后的深度神经网络难以获得更高分类精度。
技术实现思路
本专利技术的专利技术目的是：为了解决现有技术中存在的以上问题，本专利技术提出了一种基于块项张量分解的深度神经网络压缩方法，以期能够在保持精度的同时获得更高的参数量压缩比。本专利技术的技术方案是：一种基于块项张量分解的深度神经网络压缩方法，包括以下步骤：A、获取深度神经网络框架；B、将深度神经网络的全连接层中的权重矩阵W和输入向量x分别转化为高阶张量W和高阶张量X；C、对步骤B中的高阶张量W进行块项张量分解处理；D、根据步骤B中的高阶张量X和步骤C中块项张量分解后的高阶张量W将深度神经网络的全连接层替...
基于块项张量分解的深度神经网络压缩方法

【技术保护点】
一种基于块项张量分解的深度神经网络压缩方法，其特征在于，包括以下步骤：A、获取深度神经网络框架；B、将深度神经网络的全连接层中的权重矩阵W和输入向量x分别转化为高阶张量

【技术特征摘要】
1.一种基于块项张量分解的深度神经网络压缩方法，其特征在于，包括以下步骤：A、获取深度神经网络框架；B、将深度神经网络的全连接层中的权重矩阵W和输入向量x分别转化为高阶张量W和高阶张量X；C、对步骤B中的高阶张量W进行块项张量分解处理；D、根据步骤B中的高阶张量X和步骤C中块项张量分解后的高阶张量W将深度神经网络的全连接层替换为块项张量层；E、采用后向传播算法对步骤D中替换后的深度神经网络进行训练。2.如权利要求1所述的基于块项张量分解的深度神经网络压缩方法，其特征在于，所述步骤B中将深度神经网络的全连接层中的权重矩阵W转化为高阶张量W具体为：将权重矩阵W的行维度和列维度进行均匀分割，表示为层次分块矩阵形式，再将分割后的权重矩阵W转化为高阶张量W。3.如权利要求1或2所述的基于块项张量分解的深度神经网络压缩方法，其特征在于，所述步骤B中将深度神经网络的全连接层中的输入向量x转化为高阶张量X具体为：将输入向量x的维度表示为...

【专利技术属性】
技术研发人员：徐增林，李广西，叶锦棉，陈迪，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人