基于层数采样的模型压缩方法、深度神经网络模型技术

技术编号：31015329 阅读：18 留言：0更新日期：2021-11-30 02:55

本发明专利技术提供分别从两个方面提供了两种基于层数采样的模型压缩方法，均基于若干级联子网络结构完全一致的神经网络，其中一种基于层数采样的模型压缩方法包括生成在预设区间均匀分布的随机正整数，所述区间的极值不大于所述子网络的总个数；选取所述随机正整数个所述子网络进行一次迭代；其中第二种基于层数采样的模型压缩方法包括评估神经网络模型的性能，确定n的理想值；使得所述神经网络中保留在前的n个所述子网络。能够实现在训练时、推理时加快运算速度、节约计算资源且兼顾保持模型的性能。本发明专利技术还提供的深度神经网络模型因采用本发明专利技术的模型压缩方法而具有相应优势，有利于更广泛的应用场景下的实现。广泛的应用场景下的实现。广泛的应用场景下的实现。

全部详细技术资料下载

【技术实现步骤摘要】
基于层数采样的模型压缩方法、深度神经网络模型

[0001]本专利技术属于神经网络
，尤其涉及基于层数采样的神经网络的模型压缩方法及相应的神经网络模型。

技术介绍

[0002]随着人工智能，特别是深度学习技术的发展，各种基于神经网络的智慧任务已进入了普通人日常生活的方方面面。人工神经网络(artificial neural network， ANN)，简称神经网络(neural network，NN)，是一种包含多层隐层的机器学习模型。神经网络技术推动了各行各业的发展，提高了人们生活生产的便利性。
[0003]神经网络的应用一般有训练(Training)和推理(Inference)两个部分。所谓训练，通常是指用随机梯度下降等方法，依据给定数据样本和优化目标，不断迭代和优化神经网络参数的过程。所谓推理，是指将新得到的数据输入已经训练好的神经网络，得到预测结果的过程。例如，训练时，给定一百万张动物图片，要求神经网络学习对动物图片进行分类；在推理时，给定一张新的动物图片，并将其输入训练好的神经网络，获取预测的分类结果。具体来说，神经网络的训练是基于给定的数据的，例如“一亿张图片”就是给定的数据；神经网络的训练也需要给定的优化目标，例如“最小化分类错误率”，是在网络训练之前已经人为规定好的。如果说训练是制造神经网络的过程，那么推理可以理解为使用神经网络的过程，作为类比的，把神经网络比作缉毒犬，神经网络的应用就包括训练缉毒犬和要求缉毒犬在真实场景下找到毒品。推理结果即神经网络对于既定任务给出的判断，如，神经网络判断...

【技术保护点】

【技术特征摘要】
1.基于层数采样的模型压缩方法，其特征在于：基于若干级联子网络结构完全一致的神经网络，包括：步骤S1.生成在预设区间均匀分布的随机正整数，所述区间的极值不大于所述子网络的总个数；步骤S2.选取所述随机正整数个所述子网络进行一次迭代；重复所述步骤S1至所述步骤S2，完成每次迭代，直至模型收敛。2.根据权利要求1所述的基于层数采样的模型压缩方法，其特征在于：所述若干级联子网络使用的训练参数是同样的一组。3.基于层数采样的模型压缩方法，其特征在于：基于若干级联子网络结构完全一致的神经网络，包括：步骤一.设定数值，记为n，n为正整数且小于所述子网络总个数；步骤二.使得所述神经网络中保留在前的n个所述子网络；步骤一中设定数值包括：评估神经网络模型的性能，确定n的理想值。4.根据权利要求3所述的基于层数采样的模型压缩方法，其特征在于：“确定n的理想值”包括：直接选取特定数量的子网络进行保留，测试神经网络模型的性能是否下降，如无下降，则将所述特定数量确定为n的理想值。5.根据权利要求3所述的基于层数采样的模型压缩方法，其特征在于：确定n的理想值包括：选取一个正整数记为i, 保留前i个子网络后评估神经网...

【专利技术属性】
技术研发人员：黄羿衡，陈桂兴，
申请(专利权)人：江苏苏云信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人