当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于重加权膜电压的卷积脉冲神经网络的训练方法技术

技术编号:28038618 阅读:46 留言:0更新日期:2021-04-09 23:21
本发明专利技术公开了一种基于重加权膜电压的卷积脉冲神经网络的训练方法,该方法包括:获取输入图像并进行预处理,得到脉冲序列;基于重加权膜电压构建卷积脉冲神经网络的脉冲神经元;根据输入图像的规模设置卷积脉冲神经网络的网络层数;对脉冲神经元的输入刺激进行归一化处理;构建损失函数并基于时空反向传播算法对卷积脉冲神经网络进行训练;将脉冲序列输入到训练完成的卷积脉冲神经网络,得到输出结果。本发明专利技术可直接计算脉冲神经元的输出关于膜电压的梯度,且梯度会根据累积的膜电压值动态调整,改善了SNN训练过程中梯度不匹配问题。本发明专利技术作为一种基于重加权膜电压的卷积脉冲神经网络的训练方法,可广泛应用于脉冲神经网络领域。

【技术实现步骤摘要】
一种基于重加权膜电压的卷积脉冲神经网络的训练方法
本专利技术属于脉冲神经网络领域,尤其涉及一种基于重加权膜电压的卷积脉冲神经网络的训练方法。
技术介绍
脉冲神经网络(SpikingNeuralNetwork,SNN)是一种基于模仿生物神经元放电机制的一种神经网络模型。由于其能够有效地处理离散的时空事件,在低功耗设备上具有广阔的应用场景。目前,学习SNN的方法可以归纳为两类,第一类方法是将预先训练好的人工神经网络转换为对应的SNN,第二类方法是直接基于训练数据训练SNN。第一类方法得到的SNN相比于其他方法能够获得更好的分类准确度,这主要得益于预训练得到的人工神经网络(ArtificialNeuralNetwork,ANN)的良好的泛化性能。然而该类方法在分类任务上的良好表现建立在庞大的推理时间步之上,换句话说,第一类方法需要在一个较大的时间窗内处理输入信号才能够获得良好的分类准确度,推理效率较低,在低功耗硬件上具有一定的局限性。对于直接训练SNN,脉冲时间依赖可塑性(SpikeTimingDependentPlasticity,STDP),根据突触前后脉冲到达的时序关系对突触权重进行调整,如果突触前神经元产生脉冲早于突触后神经元,说明突触前后神经元存在因果关系,对应的突触权重增加,反之,权重值减小,但是该SNN在分类任务上的表现并不令人满意。基于脉冲的反向传播算法是直接训练SNN的另一种有效方法,然而,该类方法通常需要估计脉冲神经元的输出关于输入的近端梯度,一定程度上增加了算法设计的复杂性。专利技术内容为了解决上述技术问题,本专利技术的目的是提供一种基于重加权膜电压的卷积脉冲神经网络的训练方法,与其他基于脉冲的反向传播相比,本专利技术所提出的方法无需进行专门的梯度估计,拓展性良好,容易复现。本专利技术所采用的第一技术方案是:一种基于重加权膜电压的卷积脉冲神经网络的训练方法,包括以下步骤:获取输入图像并对输入图像进行预处理,得到脉冲序列;基于重加权膜电压构建卷积脉冲神经网络的脉冲神经元;根据输入图像的规模设置卷积脉冲神经网络的网络层数;对脉冲神经元的输入刺激进行归一化处理;构建损失函数并基于时空反向传播算法对卷积脉冲神经网络进行训练,得到训练完成的卷积脉冲神经网络;将脉冲序列输入到训练完成的卷积脉冲神经网络,得到输出结果。进一步,所述获取输入图像并对输入图像进行预处理这一步骤,其具体包括:获取输入图像并对输入图像每个通道的图像进行标准化处理,得到标准化图像;对标准化图像进行脉冲编码,得到脉冲序列。进一步,所述基于重加权膜电压构建卷积脉冲神经网络的脉冲神经元这一步骤,其具体包括:根据神经动力学模型构建原始的脉冲神经元;对原始的脉冲神经元的膜电压进行重加权处理,将其大小约束为0或1后作为脉冲神经元的输出,得到卷积脉冲神经网络的脉冲神经。进一步,在第n层网络的第f张特征图的位置(i,j),所述基于重加权膜电压构建卷积脉冲神经网络的脉冲神经元具体如下:上式中,τ表示膜电压的衰减因子,n表示第n层网络,t表示时间窗T内的第t个时刻,Vth表示阈值电压,*表示卷积操作,R(i,j)表示位置(i,j)的局部感受野,表示连接n-1层网络的第c个特征图与n层网络的第f个特征图之间的卷积核,表示脉冲输出,表示第t个时刻的输入刺激,表示在前t个时刻累积的膜电压。随后,将超出Vth的代替作为神经元的输出,即:表示点积运算,通过对和进行点积运算,使得中超出阈值电压的成员被保留,未超出阈值电压的成员将置为0。对的每个成员进行权重调整,使其输出逼近真实的脉冲,即:ε是足够小的正数,防止分母为0,此外,是与相等的常数,使得上式中的分母不参与梯度计算,且当时,能够逼近真实脉冲,即值接近于1。进一步,所述根据输入图像的规模设置卷积脉冲神经网络的网络层数这一步骤,其具体包括:根据输入图像的数据规模以及任务的复杂程度,设置卷积脉冲神经网络的网络层数,每层网络的特征图数、卷积核大小、各层权重的初始分布状态以及阈值膜电压。进一步,所述对脉冲神经元的输入刺激进行归一化处理,具体公式如下:上式中,It,n第n层网络在t时刻的整体输入刺激,表示It,n的第f张特征图(i,j)位置的成员,Fn表示第n层网络的特征图总数,hn表示特征图的高度,wn为特征图宽度,μt,n表示均值,σt,n表示方差,表示归一化后的整体输入刺激。进一步,所述构建损失函数并基于时空反向传播算法对卷积脉冲神经网络进行训练,得到训练完成的卷积脉冲神经网络这一步骤,其具体包括:构建描述网络输出以及样本真实标签的损失函数,基于时空反向传播算法,从时间、空间两个方向上对卷积脉冲神经网络的参数进行误差估计;根据误差估计对卷积脉冲神经网络隔层的突触权重进行更新,得到训练完成的卷积脉冲神经网络。进一步,所述训练完成的卷积脉冲神经网络包括输入层、隐藏层和输出层。本专利技术方法的有益效果是:本发提出的重加权方法能有效地避免以往基于脉冲反向传播算法需要专门进行梯度设计的问题,由于重加权的膜电压作为近似的脉冲输出,误差可以直接从脉冲输出传递到神经元的膜电压以及神经元的输入,从学习机制上更具有合理性,另外,基于时空反向传播算法进行训练,使得突触权重能够被有效更新,当神经元被激活,其输出关于膜电压的梯度为重加权的权重值与累积的膜电压相关,梯度的尺度会根据膜电压的大小进行调整。较小的膜电压赋予较大的梯度,较大的膜电压则赋予较小的梯度,一定程度上减缓SNN训练过程中梯度不匹配的问题。附图说明图1是本专利技术具体实施例一种基于重加权膜电压的卷积脉冲神经网络的训练方法的步骤流程图;图2是本专利技术具体实施例卷积脉冲神经网络结构示意图。具体实施方式下面结合附图和具体实施例对本专利技术做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。如图1所示,本专利技术提供了一种基于重加权膜电压的卷积脉冲神经网络的训练方法,该方法包括以下步骤:S1、获取输入图像并对输入图像进行预处理,得到脉冲序列;S2、基于重加权膜电压构建卷积脉冲神经网络的脉冲神经元;S3、根据输入图像的规模设置卷积脉冲神经网络的网络层数;S4、对脉冲神经元的输入刺激进行归一化处理;S5、构建损失函数并基于时空反向传播算法对卷积脉冲神经网络进行训练,得到训练完成的卷积脉冲神经网络;S6、将脉冲序列输入到训练完成的卷积脉冲神经网络,得到输出结果。进一步作为本方法的优选实施例,所述获取输入图像并对输入图像进行预处理这一步骤,其具体包括:获取输入图像并对输入图像每个通道的图像进行标准化处本文档来自技高网...

【技术保护点】
1.一种基于重加权膜电压的卷积脉冲神经网络的训练方法,其特征在于,包括以下步骤:/n获取输入图像并对输入图像进行预处理,得到脉冲序列;/n基于重加权膜电压构建卷积脉冲神经网络的脉冲神经元;/n根据输入图像的规模设置卷积脉冲神经网络的网络层数;/n对脉冲神经元的输入刺激进行归一化处理;/n构建损失函数并基于时空反向传播算法对卷积脉冲神经网络进行训练,得到训练完成的卷积脉冲神经网络;/n将脉冲序列输入到训练完成的卷积脉冲神经网络,得到输出结果。/n

【技术特征摘要】
1.一种基于重加权膜电压的卷积脉冲神经网络的训练方法,其特征在于,包括以下步骤:
获取输入图像并对输入图像进行预处理,得到脉冲序列;
基于重加权膜电压构建卷积脉冲神经网络的脉冲神经元;
根据输入图像的规模设置卷积脉冲神经网络的网络层数;
对脉冲神经元的输入刺激进行归一化处理;
构建损失函数并基于时空反向传播算法对卷积脉冲神经网络进行训练,得到训练完成的卷积脉冲神经网络;
将脉冲序列输入到训练完成的卷积脉冲神经网络,得到输出结果。


2.根据权利要求1所述一种基于重加权膜电压的卷积脉冲神经网络的训练方法,其特征在于,所述获取输入图像并对输入图像进行预处理这一步骤,其具体包括:
获取输入图像并对输入图像每个通道的图像进行标准化处理,得到标准化图像;
对标准化图像进行脉冲编码,得到脉冲序列。


3.根据权利要求2所述一种基于重加权膜电压的卷积脉冲神经网络的训练方法,其特征在于,所述基于重加权膜电压构建卷积脉冲神经网络的脉冲神经元这一步骤,其具体包括:
根据神经动力学模型构建原始的脉冲神经元;
对原始的脉冲神经元的膜电压进行重加权处理,将其大小约束为0或1后作为脉冲神经元的输出,得到卷积脉冲神经网络的脉冲神经。


4.根据权利要求3所述一种基于重加权膜电压的卷积脉冲神经网络的训练方法,其特征在于,在第n层网络的第f张特征图的位置(i,j),所述基于重加权膜电压构建卷积脉冲神经网络的脉冲神经元具体如下:









上式中,τ表示膜电压的衰减因子,n表示第n层网络,t表示时间窗T内的第t个时刻,Vth表示阈值电压,*表示卷积操作,R(i,j)表示位置(i,j)的局部感受野,表示连接n-1层网络的第c个特征图与n层网络的第f个特征图之间的卷积核,表示脉冲输出,表示第t个时刻的输入刺激,表示在前t个时刻累积的膜电压。
随后,将超出Vth的代替作为神经元的输出...

【专利技术属性】
技术研发人员:赖剑煌唐建雄谢晓华
申请(专利权)人:中山大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1