一种对于梯度变化敏感的卷积神经网络模型制造技术

技术编号：27370145 阅读：56 留言：0更新日期：2021-02-19 13:55

本发明专利技术公开了一种对于梯度变化敏感的卷积神经网络模型，基于当前和最近的梯度构造了一种自适应学习率调控因子，该学习率因子可以智能调控每个参数学习率因子。当代价函数在该参数的维度上处于上升沿或者下降沿时，此时代价函数对于该参数的偏导数持续为正或者持续为负，我们可以通过增大其学习率以加快代价函数的收敛；当代价函数在该参数维度上位于最小值点附近时，此时代价函数对于该参数的偏导数会呈现正负交替出现的现象，我们可以通过降低其学习率以加快代价函数的收敛。本发明专利技术弥补了Adam算法在迭代过程不充分利用局部梯度的变化的缺陷，可以有效的提高卷积神经网络模型的训练速度，进而在相同条件下提高其准确率。进而在相同条件下提高其准确率。进而在相同条件下提高其准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种对于梯度变化敏感的卷积神经网络模型

[0001]本专利技术涉及机器学习领域中的卷积神经网络模型，通过引入一个基于当前梯度和最近梯度构造的自适应学习率调控因子，在全局学习率的基础上，分配给每个参数一个合适的自适应学习率以实现代价函数的快速收敛。

技术介绍

[0002]卷积神经网络模型是机器学习的一项基础技术，该技术在图像识别，微表情分析，物体定位等方向发挥着十分重要的作用。
[0003]在卷积神经网络模型的训练过程中，梯度下降法(GD)是模型训练基础的算法，以此为中心衍生出了一系列的改进算法。这些改进算法总体而言可以分为两大方向。
[0004]其一是以Momentum算法为代表，通过引入动量因子有效的缓解了每次迭代计算中噪音较大的问题，使得收敛曲线更加平缓，同时在收敛速度上也有一定的提高。之后，在Momentum的基础上再次使用Nesterov加速，在迭代过程中引入未来的更新量进一步使得收敛曲线更为平滑稳定。
[0005]其二是以AdaGrad算法、RMSProp算法为代表，他们考虑到了每个参数在各自的优化迭代过程中的累计变化，以此为依据对下一次迭代的步长进行调整，累计变化较多的给与一个较小的步长，累计变化较少的给与一个较大的步长，使得参数迭代优化更具有针对性。
[0006]将两种思路开创性结合的Adam算法利用了梯度的一阶矩估计和二阶矩估计，偏置矫正后构建一个自适应因子动态调整每个参数的学习率，使得参数优化更为平稳。至此，卷积神经网络模型的训练算法便大多以Adam算法为基础进行改进

【技术保护点】

【技术特征摘要】
1.一种对于梯度变化敏感的卷积神经网络模型，其特征在于，包括如下步骤：步骤1、输入训练集D＝{(x1，y1)，(x2，y2)，...(x
m
，y
m
)}；步骤2、设置参数：η∈[10-4
，10-2
]；β1，β2∈[0，1)；ε＝1
×
10-8
；步骤3、引入Adam算法，在Adam算法的基础上，引入自适应学习率因子λ；步骤4、进行迭代参数运算。2.根据权利要求1所述的一种对于梯度变化敏感的卷积神经网络模型，其特征在于，所述步骤3，在Adam算法中，通过梯度的偏置矫正的一阶矩估计和二阶矩估计构造自适应因子实现每个参数学习率的个性化，参数的具体迭代公式以下列公式实现：m
t
＝β1m
t-1
+(1-β1)g
tttt
其中，g
t
，g
t-1
分别是当前梯度值和上轮迭代的梯度值，β1和β2为衰减系数，分别取0.9和0.999，mt为一阶矩估计，vt为二阶矩估计，η为学习率，δ为一个很小的常量防止分母为零，为偏置矫正后的一阶矩估计，为偏执校正后的二阶矩估计。3.根据权利要求1所述的一种对于梯度变化敏感的卷积神经网络模型，其特征在于，所述步骤3中，引入的自适应学习率因子记为λ，在本发明中λ具体定义如下：其中g
t
，g
t-1
分别是当前梯度值和上轮迭代的梯度值，sig函数类似于sigmoid函数，对于sig函数的具体计算方式如下：由sig函数的表达式可知，sig函数是一个单调递增函数并且随着底数p的...

【专利技术属性】
技术研发人员：王伟，吴小玲，刘志鹏，李修寒，冯锐，
申请(专利权)人：南京医科大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人