The invention discloses a method and a device for adjusting an artificial neural network (ANN). The ANN includes a plurality of neurons, connections between neurons through the connection weight matrix, the method comprises the following steps: pruning steps, after all N weight training first connection weight matrix n in a weight set to zero; no mask re training steps in any constraint weights to zero the case of re training connection weights matrix by pruning second; mask generation steps according to the connection weight matrix generated by matrix shape mask without re training the mask and mask third; re training steps, using the mask matrix of the third connection weight matrix re training. Thus, through the re training stage to join according to the matrix generated mask steps without mask re training to realize the dynamic adjustment of the mask, so that the pruning process of some error correction and shear recovery, so as to enhance the compression performance of neural network.
【技术实现步骤摘要】
调整人工神经网络的方法和装置
本专利技术设计人工神经网络(ANN),例如,循环神经网络(RNN),尤其涉及基于掩码对神经网络的动态调整。
技术介绍
人工神经网络(ANN),简称神经网络(NNs),是一种模仿动物神经网络的行为特征,进行分布式并行信息处理的数学计算模型。近年来,神经网络发展很快,被广泛应用于诸多领域,如图像识别、语音识别、自然语言处理、天气预报、基因表达、内容推送等等。在神经网络中存在着大量彼此连接的、被称为“神经元”的节点。每个神经元通过特定的输出函数计算来自其它相邻神经元的加权输入值。各神经元之间的信息传递强度用“权值”定义,算法会不断自我学习,调整这个加权值。在神经网络中,神经元的连接关系在数学上可以表示为一系列矩阵。经过训练后的网络虽然预测准确,但其矩阵都是稠密的,即“矩阵中充满了非零元素”。随着神经网络变得愈发复杂,稠密矩阵的计算会消耗大量的存储和计算资源。由此导致的低速度和高成本使得移动端的推广应用面临着巨大的困难,从而极大地制约了神经网络的发展。近年来的研究表明,通过训练得到的神经网络模型矩阵中,仅有部分权值较大的元素代表着重要连接,而其他权值较小的元素可以被移除(置为零),与此同时对应的神经元也被剪枝。剪枝后的网络精度会下降,但是可以通过重训,对仍然保留在模型矩阵中权值的大小进行调整,从而减小精度损失。模型压缩可以将神经网络中的稠密矩阵稀疏化,有效降低存储量、减少计算量,在保持精度的同时实现加速。模型压缩对于专用的稀疏神经网络加速器而言显得极为重要。对于较为复杂的神经网络模型,尤其是多层神经网络模型而言,各层的网络模型矩阵相互 ...
【技术保护点】
一种调整人工神经网络(ANN)的方法,其中所述ANN包括多个神经元,神经元之间的连接关系通过连接权值矩阵表示,所述方法包括:剪枝步骤,将经训练的第一连接权值矩阵的所有N个权值中的n个不重要权值设为零;不带掩码重训步骤,在不强制约束任何权值为零的情况下重新训练经剪枝的第二连接权值矩阵;掩码生成步骤,根据经不带掩码重训的第三连接权值矩阵生成矩阵形状掩码;以及带掩码重训步骤,使用所述掩码矩阵对所述第三连接权值矩阵进行重新训练。
【技术特征摘要】
1.一种调整人工神经网络(ANN)的方法,其中所述ANN包括多个神经元,神经元之间的连接关系通过连接权值矩阵表示,所述方法包括:剪枝步骤,将经训练的第一连接权值矩阵的所有N个权值中的n个不重要权值设为零;不带掩码重训步骤,在不强制约束任何权值为零的情况下重新训练经剪枝的第二连接权值矩阵;掩码生成步骤,根据经不带掩码重训的第三连接权值矩阵生成矩阵形状掩码;以及带掩码重训步骤,使用所述掩码矩阵对所述第三连接权值矩阵进行重新训练。2.如权利要求1所述的方法,其中,重复所述不带掩码重训步骤、所述掩码生成步骤和带掩码重训步骤直到获得所述连接权值矩阵的优化解为止。3.如权利要求1所述的方法,其中,所述不重要权值是所有N个权值中绝对值最小的n个权值。4.如权利要求3所述的方法,其中,所述掩码生成步骤包括:将所述掩码中与所述第三连接权值矩阵中绝对值最小的n个权值对应位置上的值置零。5.如权利要求3所述的方法,其中,所述掩码生成步骤包括:将所述掩码中与所述第三连接权值矩阵中绝对值小于权重阈值的权值对应位置上的值置零。6.如权利要求4所述的方法,其中,所述权重阈值基于所述第三连接权值矩阵求得,将所述第三连接权值矩阵的权值按绝对值进行从大到小排序,所述权值阈值根据如下之一的均值设定或是所述均值本身:排序序列中前(N-n)个权值的均值;排...
【专利技术属性】
技术研发人员:姚颂,
申请(专利权)人:北京深鉴智能科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。