用于数据处理的方法、装置和非暂时性计算机可读介质制造方法及图纸

技术编号：18204941 阅读：52 留言：0更新日期：2018-06-13 06:37

本发明专利技术实施例提供了用于数据处理的方法和装置。该方法包括：从上层神经网络接收输入数据；利用ELU激活函数对输入数据进行处理，以获得输出结果，其中，在输入数据小于0的情况下，ELU激活函数被拟合为三段式分段线性函数；将输出结果传输给下层神经网络。在本发明专利技术实施例中，在利用ELU激活函数对来自上层神经网络的输入数据进行处理时，如果输入数据小于0，使用对ELU激活函数拟合得到的三段式分段线性函数进行近似处理，不仅能够减轻运算量，而且能够避免对大量存储器资源的需求，从而能够高效且低成本地实现ELU激活函数。

全部详细技术资料下载

【技术实现步骤摘要】
用于数据处理的方法、装置和非暂时性计算机可读介质
本专利技术涉及数据处理
，具体地，涉及用于数据处理的方法、装置和非暂时性计算机可读介质。
技术介绍
近年来，深度学习成为人工智能领域的研究热点之一。针对深度学习算法的神经网络一般具有多层结构，每层神经网络可以是全连接函数。每层神经网络在计算完毕之后，会紧接着进行基于被称为激活函数的运算。目前提出了多种激活函数。例如，最早期的激活函数采用的是sigmoid或者tanh函数，因为它们的数学特性与早期在人脑神经节的生物研究中发现的生物电特性最相近。随着深度神经网络学科的不断发展，不断提出了其它新的激活函数，以实现比sigmoid和tanh更高的计算性能。然而，由于激活函数的复杂性，目前在神经网络中的实现效率并不理想。
技术实现思路
本专利技术实施例提供了用于数据处理的方法、装置和非暂时性计算机可读介质，能够高效且低成本地实现ELU激活函数。第一方面，提供了一种用于数据处理的方法，包括：从上层神经网络接收输入数据；利用ELU激活函数对所述输入数据进行处理，以获得输出结果，其中，在所述输入数据小于0的情况下，所述ELU激活函数被拟合为三段式分段线性函数；将所述输出结果传输给下层神经网络。在一种可能的实现方式中，所述三段式分段线性函数是基于与所述ELU激活函数之间的均方误差最小原则来确定的。在一种可能的实现方式中，所述ELU激活函数被表示为：其中，z表示所述输入数据，α为1；在z＜0的情况下的ELU1＝exp(z)-1被拟合为如下表示的所述三段式分段线性函数：其中，k＝(B-(-1))/(B-A)。在一种可能的实现方...
用于数据处理的方法、装置和非暂时性计算机可读介质

【技术保护点】
一种用于数据处理的方法，其特征在于，包括：从上层神经网络接收输入数据；利用ELU激活函数对所述输入数据进行处理，以获得输出结果，其中，在所述输入数据小于0的情况下，所述ELU激活函数被拟合为三段式分段线性函数；将所述输出结果传输给下层神经网络。

【技术特征摘要】
1.一种用于数据处理的方法，其特征在于，包括：从上层神经网络接收输入数据；利用ELU激活函数对所述输入数据进行处理，以获得输出结果，其中，在所述输入数据小于0的情况下，所述ELU激活函数被拟合为三段式分段线性函数；将所述输出结果传输给下层神经网络。2.根据权利要求1所述的方法，其特征在于，所述三段式分段线性函数是基于与所述ELU激活函数之间的均方误差最小原则来确定的。3.根据权利要求2所述的方法，其特征在于，所述ELU激活函数被表示为：其中，z表示所述输入数据，α为1；在z<0的情况下的ELU1＝exp(z)-1被拟合为如下表示的所述三段式分段线性函数：其中，k＝(B-(-1))/(B-A)。4.根据权利要求3所述的方法，其特征在于，A的取值在范围-10至0内，B的取值在范围-1至0内。5.根据权利要求4所述的方法，其特征在于，A的取值和B的取值使得所述三段式分段线性函数的第一输出值与所述ELU激活函数的第二输出值之间的均方误差最小，其中，所述第一输出值＝(z-A)*k+(-1)，所述第二输出值＝exp(z)-1，其中，A≤z<B。6.根据权利要求5所述的方法，其特征在于，A的取值为-2.65±C，B的取值为-0.5±D，其中，0≤C≤0.1，0≤D≤0.1。7.根据权利要求3至6中任一项所述的方法，其特征在于，所述三段式分段线性函数是使用比较器、乘法器、减法器和选择器来实现的。8.一种用于数据处理的装置，其特征在于，包括：输入端，用于从上层神经网络接收输入数据；处理模块，用于利用ELU激活函数对所述输入数据进行处理，以获得输出结果，其中，在所述输入数据小于0的情况下，所述ELU激活函数被拟合为三段式分段线性函数；输出端，用于将所述输出结果传输给下层神经网络。9.根据权利要求8所述的装置，其特征在于，所述处理模块使用的所述三段式分段线性函数是基于与所述ELU激活函数之间的均方误差最小原则来确定的。10.根据权利要求9所述的装置，其特征在于，所述ELU激活函数被表示为：其中，z表示所述输入数据，α为1；在z<0的情况下的ELU1＝exp(z...

【专利技术属性】
技术研发人员：黎明，夏昌盛，张韵东，邱嵩，
申请(专利权)人：北京中星微电子有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人