一种稀疏训练方法技术

技术编号：19935253 阅读：25 留言：0更新日期：2018-12-29 04:55

本公开提供了一种稀疏训练方法，包括：根据置零条件对第i层所包括的N个神经元对应的梯度值进行选择性置零；其中，i为大于1的整数，N为正整数；利用未置零的梯度值进行训练运算，得到更新后的梯度值及突触。本公开降低了计算量，提升了计算速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种稀疏训练方法
本公开涉及人工智能
，尤其涉及一种稀疏训练方法。
技术介绍
深度神经网络是目前许多人工智能应用的基础，其在语音识别、图像处理、数据分析、广告推荐系统、汽车自动驾驶等多方面得到了突破性的应用，使得深度神经网络被应用在了生活的各个方面。但是，深度神经网络的运算量巨大，一直制约着其更快速的发展和更广泛的应用。当考虑运用加速器设计来加速深度神经网络的运算时，巨大的运算量，必然会带了很大的能耗开销，同样制约着加速器的进一步的广泛应用。在神经网络的运算中，主要分为两个部分，正向推测和反向训练。而现有的技术往往通过优化正向推测部分的运算部分来达到降低计算量的目的，而对于反向训练部分，没有什么有效的方式对其进一步降低计算量。因而无法进一步降低计算量，提升运算速度。
技术实现思路
(一)要解决的技术问题为了解决或者至少部分缓解上述技术问题，本公开提供了一种神经网络稀疏训练方法。本公开稀疏训练方法，通过一定的方式，将一些神经元的前传梯度值置零，从而使得和该神经元相连的突触不更新该神经元带来的误差值，和该神经元相连的上层神经元也不累加该神经元带来的误差值。从而降低了计算量，提升了计算速度。无论突触为稠密状态或稀疏状态，均不会对该方法产生影响。同时，该方法也不会影响正向推测阶段的正常运算和相关优化。(二)技术方案根据本公开的一个方面，提供了一种稀疏训练方法，包括：根据置零条件对神经网络第i层所包括的N个神经元对应的梯度值进行选择性置零；其中，i为大于1的整数，N为正整数；利用未置零的梯度值进行训练运算，得到更新后的梯度值及突触。在一些实施例中，所述置零条件包括...

【技术保护点】
1.一种稀疏训练方法，包括：根据置零条件对神经网络第i层所包括的N个神经元对应的梯度值进行选择性置零；其中，i为大于1的整数，N为正整数；利用未置零的梯度值进行训练运算，得到更新后的梯度值及突触。

【技术特征摘要】
1.一种稀疏训练方法，包括：根据置零条件对神经网络第i层所包括的N个神经元对应的梯度值进行选择性置零；其中，i为大于1的整数，N为正整数；利用未置零的梯度值进行训练运算，得到更新后的梯度值及突触。2.根据权利要求1所述的稀疏训练方法，其中，所述置零条件包括：置零概率条件，或置零阈值条件，或置零百分比条件。3.根据权利要求1所述的稀疏训练方法，其中，在根据置零条件将筛选出的神经元对应的梯度值置零之前，还包括：采用随机方式对第i层所包括的N个神经元进行筛选。4.根据权利要求3所述的稀疏训练方法，其中，所述随机方式包括：高斯随机方法、贝叶斯概率随机方法、或等距抽样方法。5.根据权利要求3所述的稀疏训练方法，其中，所述置零条件为置零概率条件，该置零概率为p，采用所述随机方式筛选出N*p个神经元，将其对应的梯度值置0。6.根据权利要求2所述的稀疏训练方法，其中，...

【专利技术属性】
技术研发人员：不公告发明人，
申请(专利权)人：上海寒武纪信息科技有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人