基于训练深度脉冲神经网络的梯度函数学习框架替换方法技术

技术编号:30163528 阅读:24 留言:0更新日期:2021-09-25 15:18
本发明专利技术提供基于训练深度脉冲神经网络的梯度函数学习框架替换方法,包括第一步:找到深度脉冲神经网络在进行梯度下降过程中的神经元连接权重梯度以及与此神经元所连接且处于此神经元下一层的神经元在膜电位进行脉冲发射时的脉冲阈值;第二步:对神经元连接权重进行预测损失后,得到预测损失对神经元连接权重的偏导。本发明专利技术所提出的基于cosh的梯度替换函数相较于以前研究提出的梯度替换函数,曲线更加符合脉冲神经元活动规律,能够有效提高脉冲神经网络训练效果。冲神经网络训练效果。冲神经网络训练效果。

【技术实现步骤摘要】
基于训练深度脉冲神经网络的梯度函数学习框架替换方法


[0001]本专利技术涉及基于深度脉冲神经网络的学习
,具体为基于训练深度脉冲神经网络的梯度函数学习框架替换方法。

技术介绍

[0002]深度脉冲神经网络指的是使用类似于深度学习的梯度下降学习方法来进行脉冲神经网络的有监督学习。目前已知深度脉冲神经网络相关专利如下:
[0003]1、申请号:202010572964.9
[0004]2、申请号:201610604373.9
[0005]其中,第一个专利构造了一种根据泄露集成点火(LIF)神经元模型的膜电压变化的特性而变化的电阻模块,其关注点主要在于改进脉冲神经元活动动态函数;
[0006]第二个专利类似,也对LIF神经元模型进行改良,并提出了更为完善的网络训练层应用于深度脉冲神经网络训练。
[0007]以上两个深度脉冲神经网络专利的创新点都集中于脉冲神经元模型结构上,然而,深度脉冲神经网络的梯度下降学习中最大的问题在于脉冲神经元存在不可微分的阶跃函数(Heaviside step function),目前常用的解决框架是使用替换梯度函数(surrogate gredient function)来替换阶跃函数的梯度,实现模型的学习。
[0008]而目前比较常用的三种替换梯度函数有:快速sigmoid函数梯度、Exponential函数以及线性分段函数pairwise linear。
[0009]但是,目前替换梯度函数的脉冲神经网络BP训练方法使用的替换梯度函数其函数形态与狄拉克函数差别较大,尤其是远离脉冲信号的情况下。
[0010]因此,基于上述问题,本专利技术提出基于cosh函数的替换梯度函数可以使得BP训练误差更接近真实误差,其次目前常用的脉冲神经元LIF模型只考虑了一阶时序相关,并且没有考虑到刺激关联的动态神经元连接权重,而本专利技术提出时序关联增强模块赋予LIF神经元动态神经元连接权重,增强SNN(脉冲神经网络)的拟合能力。

技术实现思路

[0011]针对现有技术存在的不足,本专利技术目的是提供基于训练深度脉冲神经网络的梯度函数学习框架替换方法,以解决上述
技术介绍
中提出的问题,本专利技术通过使用相较于以前研究提出梯度替换函数的基于cosh的梯度替换函数以及提出时序关联增强模块的方式,解决了现有技术中的问题。
[0012]为了实现上述目的,本专利技术是通过如下的技术方案来实现:为了实现上述目的,本专利技术是通过如下的技术方案来实现:基于训练深度脉冲神经网络的梯度函数学习框架替换方法,包括以下步骤:
[0013]第一步:找到深度脉冲神经网络在进行梯度下降过程中的神经元连接权重梯度以及与此神经元所连接且处于神经元下一层的神经元在膜电位进行脉冲发射时的脉冲阈值;
[0014]第二步:对神经元连接权重进行预测损失后,得到预测损失对神经元连接权重的偏导;
[0015]第三步:使用双曲函数cosh的替换梯度函数代替所述脉冲阈值中的阶跃函数,并基于链式规则对所述阶跃函数进行计算,得到所述阶跃函数对所述神经元在其所对应时刻处膜电位的导数,并形成双曲函数cosh的替换梯度函数所表现的脉冲梯度,以达到经脉冲神经挽留过的BP训练误差更接近真实误差;
[0016]第四步:基于步骤1,通过建立时序关联增强模块对所述梯度下降过程中某一层神经元的突触后电流进行一次加权,得到所述神经元在此时间点所对应的动态分配线性权重,以用于赋予神经元动态神经元连接权重,增强SNN的拟合能力。
[0017]作为对本专利技术中所述基于训练深度脉冲神经网络的梯度函数学习框架替换方法的改进,第一步中得到神经元连接权重的具体实施方式为:
[0018]S1

0、构建基于脉冲神经网络的脉冲神经元模型;
[0019]S1

1、计算脉冲神经元模型中l层的脉冲神经元i在时间t的突触脉冲
[0020][0021]式中,为l层的脉冲神经元i的所有脉冲,δ为一个狄拉克δ函数,为神经元的具体脉冲时间点,其中,在发射脉冲时表现为1,在没有脉冲时表现为0;
[0022]S1

2、将此次突触脉冲进行发射后,得到神经元i向下一层连接的神经元所发射的突触后电流:
[0023][0024]式中,f是突触后函数,依赖于t时刻的脉冲信号以及上一个时刻t

1的突触后电流;
[0025]S1

3、基于步骤S1

2、计算所述突触后电流在向与神经元i所连接且处于神经元i下一层的神经元j传人时的影响神经元j膜电位:
[0026][0027][0028][0029]式中,为l+1层神经元j在时刻t的膜电位,T
m
为膜电位泄露常数,w
i,j
为神经元i与神经元j的连接权重,为输入神经元j的突触前电流总和。
[0030]作为对本专利技术中所述基于训练深度脉冲神经网络的梯度函数学习框架替换方法的改进,所述神经元j在膜电位达到脉冲阈值θ后会发射脉冲,其中,第一步中得到神经元j
在膜电位进行脉冲发射时脉冲阈值θ的具体计算方式为:
[0031][0032]式中,为l+1层神经元j在时刻t的膜电位,θ为一个阶跃函数。
[0033]作为对本专利技术中所述基于训练深度脉冲神经网络的梯度函数学习框架替换方法的改进,所述神经元j在膜电位达到脉冲阈值θ后会发射脉冲后,进行膜电位重置,其中,膜电位重置的计算方式为:
[0034][0035]式中,R为重置函数。
[0036]作为对本专利技术中所述基于训练深度脉冲神经网络的梯度函数学习框架替换方法的改进,第二步中,得到预测损失对神经元连接权重的偏导具体实施方式为:
[0037]S2

0、基于第一步得到的神经元连接权重,对其进行减少,以减少预测损失L:
[0038][0039]式中,E
t
为时刻t的误差,d
t
为时刻t的目标标签,I
t
为模型在时刻t输出的突触后电流;
[0040]S2

1、基于得到的预测损失L,得到其对神经元连接权重的偏导:
[0041][0042]式中,n为脉冲神经元模型的时间节点数。
[0043]作为对本专利技术中所述基于训练深度脉冲神经网络的梯度函数学习框架替换方法的改进,第三步中,基于双曲函数cosh的替换梯度函数代替所述脉冲阈值θ对(m
(l)
(t)的导数的计算方式为:
[0044][0045]式中,基于cosh的替换梯度函数中,α取值范围为2

4,β取值范围为2

6,其中,不同的α和B代表不同替换梯度函数,(m
(l)
(t)为神经元在时刻t的膜电位,且,当t=T时,应用链式规则,可以得到:
[0046][0047]式中,为输入神经元j本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于训练深度脉冲神经网络的梯度函数学习框架替换方法,其特征在于:包括以下步骤:第一步:找到深度脉冲神经网络在进行梯度下降过程中的神经元连接权重梯度以及与此神经元所连接且处于此神经元下一层的神经元在膜电位进行脉冲发射时的脉冲阈值;第二步:对神经元连接权重进行预测损失后,得到预测损失对神经元连接权重的偏导;第三步:使用双曲函数cosh的替换梯度函数代替所述脉冲阈值中的阶跃函数,并基于链式规则对所述阶跃函数进行计算,得到所述阶跃函数对所述神经元在其所对应时刻处膜电位的导数,以达到经脉冲神经挽留过的BP训练误差更接近真实误差;第四步:基于步骤1,通过建立时序关联增强模块对所述梯度下降过程中某一层神经元的突触后电流进行一次加权,得到所述神经元在此时间点所对应的动态分配线性权重,以用于赋予神经元动态神经元连接权重,增强SNN的拟合能力。2.根据权利要求1所述的基于训练深度脉冲神经网络的梯度函数学习框架替换方法,其特征在于:第一步中得到神经元连接权重的具体实施方式为:S1

0、构建基于脉冲神经网络的脉冲神经元模型;S1

1、计算脉冲神经元模型中l层的脉冲神经元i在时间t的突触脉冲计算脉冲神经元模型中l层的脉冲神经元i在时间t的突触脉冲式中,为l层的脉冲神经元i的所有脉冲,δ为一个狄拉克δ函数,为神经元的具体脉冲时间点,其中,在发射脉冲时表现为1,在没有脉冲时表现为O;S1

2、将此次突触脉冲进行发射后,得到神经元i向下一层连接的神经元所发射的突触后电流:式中,f是突触后函数,依赖于t时刻的脉冲信号以及上一个时刻t

1的突触后电流;S1

3、基于步骤S1

2、计算所述突触后电流在向与神经元i所连接且处于神经元i下一层的神经元j传人时的影响神经元j膜电位:下一层的神经元j传人时的影响神经元j膜电位:下一层的神经元j传人时的影响神经元j膜电位:式中,为l+l层神经元j在时刻t的膜电位,T
m
为膜电位泄露常数,w
i,j
为神经元i与神经元j的连接权重,为输入神经元j的突触前电流总和。3.根据权利要求1或2所述的基于训练深度脉冲神经网络的梯度函数学习框架替换方法,其特征在于:所述神经元j在膜电位达到脉冲阈值θ后会发射脉冲,其中,第一步中得到
神经元j在膜电位进行脉冲发射时脉冲阈值θ的具体计算方式为:式中,为l+l层神经元j在时刻t的膜电位,θ为一个阶跃函数。4.根据权利要求3所述的基于训练深度脉冲神经网络的梯度函数学习框架替换方法,其特征在于:所述神经元j在膜电位达到脉冲阈值θ发射脉冲后,进行膜电位重置,其中,膜电位重置的计算方式为:式中,R为重置函数。5.根据权利要求1所述的基于...

【专利技术属性】
技术研发人员:王子剑陈龙严武
申请(专利权)人:安徽知陉智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1