【技术实现步骤摘要】
一种基于膜电位自增机制的脉冲神经网络训练方法
[0001]本专利技术涉及一种脉冲神经网络训练方法,特别涉及一种基于膜电位自增机制的脉冲神经网络训练方法,属于人工智能领域。
技术介绍
[0002]脉冲神经网络模拟大脑的计算原理,相比于传统计算方法,拥有低功耗、低延迟处理等优势,与类脑传感器结合,可用于对机器人的低功耗、低延迟控制。
[0003]脉冲神经网络的训练有多种方法,主要包括:一是参考生物学原理,利用突触可塑性进行训练;二是首先进行人工神经网络训练,把训练好的网络转化为脉冲神经网络;三是把人工神经网络中的反向传播技术用于脉冲神经网络的训练,面临的挑战是脉冲神经元模型的不可导问题,当前可用的解决方案主要包括频率编码法、时间编码方法、导数替代法等。
[0004]其中,时间编码方法是把信息编码为脉冲的发出时间,通过公式转化,获得与人工神经网络一致的计算模型,使得反向传播技术可以应用于脉冲神经网络的训练,相比于其他方法更适用于在主流的深度学习平台上进行开发。但是,使用该方法时,由于脉冲神经网络的输入信号具有稀疏性 ...
【技术保护点】
【技术特征摘要】
1.一种基于膜电位自增机制的脉冲神经网络训练方法,其特征在于:包含以下步骤:步骤一、基于机器人虚拟仿真环境,采用深度强化学习方法,搭建强化学习环境,把其中的人工神经网络部分替换为脉冲神经网络;步骤二、以机器人虚拟仿真环境提供的环境状态信息,作为脉冲神经网络的输入信号;步骤三、采用引入膜电位自增机制的神经元模型构造脉冲神经网络;步骤四、在强化学习框架下,采用反向传播方法对脉冲神经网络进行训练,使其能够准确预测当前环境状态对应的未来奖励,并把其输出结果用于对机器人的控制;步骤五、脉冲神经网络的输出作为当前环境状态下,机器人采取各个动作后预期获得的未来奖励,选择未来奖励最高的动作对机器人进行控制。2.如权利要求1所述的一种基于膜电位自增机制的脉冲神经网络训练方法,其特征在于:步骤三的实现方法为:在训练过程中,采用无漏电流的积分与兴奋神经元,在其膜电位动力学公式的右端加入一个自增项βexp(t),β为可调节自增项大小的参数,新的膜电位动力学公式可以表示为:其中,V
mem
(t)为细胞膜电位,它是时间t的函数;公式右侧为输入的突触电流,w
i
为突触连接的权重,为第i个神经元发出第r个脉冲的时间,κ为突触电流的计算公式:其中,T
syn
为时间常数,为简化公式表达,把它设置为1;对公式(1)进行积分,可以得到:V
ment
(t
out
)=∑
i∈C
w
i
(1
‑
exp(
‑
t
out
+t
i
))+βexp(t
out
)
‑
β
ꢀꢀꢀꢀ
(3)其中,t
out
为神经元被激活后,产生脉冲的时间;C={i:t
i
<t
out
},为所有在t
out
之前出现的输入脉冲,只有这些脉冲能影响t
out
;V
ment
(t
out
)是神经元被激活时细胞膜电位需达到的阈值,为简化公式表达,在下列公式中...
【专利技术属性】
技术研发人员:梁东晨,曹江,平洋,吴冠霖,栾绍童,闫妍,马宁,
申请(专利权)人:中国人民解放军军事科学院战争研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。