一种可训练分段式线性激活函数生成方法技术

技术编号：19264034 阅读：58 留言：0更新日期：2018-10-27 02:41

本发明专利技术的生成可训练的分段式线性激活函数的方法，用于简化硬件加速过程中复杂的非线性激活函数的计算问题。该发明专利技术利用分段式的线性函数对非线性的激活函数进行替代，通过自身学习的办法不断更新系数，以达到利用线性函数替代非线性激活函数的目的。相比一般的线性激活函数而言，本方法更为接近原本非线性激活函数，相对误差较小，并在不断的逆向传播中更新系数，加快了学习的收敛速度，并在一定范围内尽可能的消除了梯度爆炸和梯度消失的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种可训练分段式线性激活函数生成方法
本专利技术属于计算机领域，尤其涉及一种可训练分段式线性激活函数生成方法。
技术介绍
近些年来，机器学习在计算机、互联网等多个领域得到实际运用，起到了巨大的作用，大大提升了包括图像识别，语言识别等功能的成功率。在神经网络中，每一层网络的结果都通过激活函数的处理后才作为最终输出，激活函数的不断发展是深度网络不断进步完善的一个重要环节，激活函数的不断进步使得神经网络输出结果更为精准。只包含卷积层和全连接层的学习网络通过多层的运算，结果都是通过线性映射得到的，即便是深度的网络，能够表达的映射也仅仅是线性的，难以表达实际运用中的非线性数据。引入非线性激活函数使得神经网络能够利用平滑的曲线来分割平面，进行分类，不再单纯的使用复杂的线性组合逼近平滑曲线以达到相同的目的。伴随着深度网络的发展，多种多样的激活函数被利用在网络之中，但是在运用上，机器学习由于网络庞大，运用一般的硬件实现比较缓慢，因此通过硬件来对深度网络进行加速势在必行。在硬件加速的过程中，由于运算资源的缺乏，很难实现非线性激活函数复杂的运算。而现有的线性激活函数，如ReLU函数，PReLU函数等，这些线性函数的运用虽然简化了网络，但简单线性函数的运用依旧没有解决非线性映射的问题，深度网络的输出依旧滞留在线性映射的阶段。
技术实现思路
本专利技术的目的在于克服上述理论结果的不足，提供一种可训练分段式线性激活函数的生成方法利用固定的运算资源，在保证激活函数的各种特性的条件下，简化现已有的非线性激活函数的方法，具体由以下技术方案实现：所述可训练分段式线性激活函数的生成方法，具体包括...

【技术保护点】
1.一种可训练分段式线性激活函数生成方法，其特征在于具体包括如下步骤：步骤1)确定所需替代的非线性函数；步骤2)将所选非线性函数进行分段，将每一段的斜率和偏移量以步骤1)的所述非线性函数为基准进行初始化；步骤3)通过神经网络模型激活非线性函数的斜率和偏移量，并随着所述网络模型的迭代对非线性函数的斜率和偏移量进行训练更新。

【技术特征摘要】
1.一种可训练分段式线性激活函数生成方法，其特征在于具体包括如下步骤：步骤1)确定所需替代的非线性函数；步骤2)将所选非线性函数进行分段，将每一段的斜率和偏移量以步骤1)的所述非线性函数为基准进行初始化；步骤3)通过神经网络模型激活非线性函数的斜率和偏移量，并随着所述网络模型的迭代对非线性函数的斜率和偏移量进行训练更新。2.根据权利要求1所述的可训练分段式线性激活函数的生成方法，其特征在于，所述步骤1)中的非线性函数为sigmoid函数或tanh函数。3.根据权利要求1所述的可训练分段式线性激活函数的生成方法，其特征在于，所述步骤2)中的分段为八段，负半轴四段，分别为(-∞,-6]、(-6,-4]、(-4,-2]、(-2,0]；正半轴四段，分别为(0,2]、(2,4]、(4,6]、(6,+∞)，正半轴、负半轴均以y轴为中心对称轴，成轴对称分布。4.根据权利要求3所述的可训练分段式线性激活函数的生成方法，其特征在于，所述步骤2)的初始化操作为：...

【专利技术属性】
技术研发人员：潘红兵，郭良蛟，秦子迪，李丽，何书专，李伟，
申请(专利权)人：南京大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人