【技术实现步骤摘要】
【国外来华专利技术】具有竞争性奖励调节脉冲时间依赖的可塑性的人工神经网络及其训练方法相关申请的交叉参考本申请要求美国临时申请第62/752,190号的优先权和利益,该申请提交于2018年10月29日,其全部内容通过引用并入本文。
技术介绍
人工神经网络越来越多地用于执行复杂的任务,诸如图像识别、计算机视觉、语音识别和医疗诊断。人工神经网络通常通过呈现已经被手动标识为正训练示例(例如,人工神经网络意图识别或标识的图像或声音的类型的示例)或负训练示例(例如,人工神经网络意图不识别或标识的图像或声音的类型的示例)的一组示例来训练。人工神经网络包括经由突触彼此连接的节点的集合,称为人工神经元。另外,人工神经元通常被聚集成层,诸如输入层、输出层、以及输入层与输出层之间的一个或多个隐藏层,这些层可对其输入执行不同类型的变换。人工神经网络可以是非脉冲神经网络(non-spikingneuralnetwork)或脉冲神经网络(spikingneuralnetwork)。在脉冲神经网络中,根据例如漏泄积分激发(Leakyintegrate-and-fire,L ...
【技术保护点】
1.一种训练人工神经网络的方法,所述人工神经网络具有多个层和至少一个权重矩阵,所述至少一个权重矩阵对所述多个层的连续层中的神经元之间的连接权重进行编码,所述方法包括:/n在所述多个层中的输入层处接收至少一个输入;/n在所述多个层中的输出层处基于所述至少一个输入生成至少一个输出;/n基于所述至少一个输出与期望输出之间的比较生成奖励;以及/n基于所述奖励来修改所述连接权重,其中所述修改所述连接权重包括将到达每个神经元的突触输入权重之和保持实质上恒定,以及将来自每个神经元的突触输出权重之和保持实质上恒定。/n
【技术特征摘要】
【国外来华专利技术】20181029 US 62/752,1901.一种训练人工神经网络的方法,所述人工神经网络具有多个层和至少一个权重矩阵,所述至少一个权重矩阵对所述多个层的连续层中的神经元之间的连接权重进行编码,所述方法包括:
在所述多个层中的输入层处接收至少一个输入;
在所述多个层中的输出层处基于所述至少一个输入生成至少一个输出;
基于所述至少一个输出与期望输出之间的比较生成奖励;以及
基于所述奖励来修改所述连接权重,其中所述修改所述连接权重包括将到达每个神经元的突触输入权重之和保持实质上恒定,以及将来自每个神经元的突触输出权重之和保持实质上恒定。
2.根据权利要求1所述的方法,进一步包括根据等式1来调整每个神经元的突触输入和输出权重,其中等式1是:
其中,Ttarget是突触输入或输出权重之目标和,Tactual是突触输入或输出权重之实际和,Wn是当前权重,并且Wn-1是先前权重。
3.根据权利要求2所述的方法,其中,所述突触输入和输出权重的调整是以规则的间隔来执行。
4.根据权利要求3所述的方法,其中,所述规则的间隔是大约50ms或更少。
5.根据权利要求1所述的方法,进一步包括将在所述人工神经网络的运行时间内的所述奖励平均成大约为零。
6.根据权利要求5所述的方法,其中,将所述奖励平均包括根据等式2计算所述奖励的移动平均分数,其中等式2是
Xn=(Xn-1*(1-α))+Sn*α,其中,α是适应速率,Sn是给定迭代的分数。
7.根据权利要求6所述的方法,其中,生成所述奖励包括根据等式3计算所述奖励,其中,等式3是Rn=Sn-Xn。
8.根据权利要求1所述的方法,其中,所述人工神经网络用于控制自主交通工具。
9.一种系统,包括:
处理器;以及
可操作地耦合到所述处理器的非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质具有存储于其中的软件指令,当所述软件指令由所述处理器执行时,使所述处理器:
利用存储在所述处理器中的人工神经网络处理输入参数;
基于所述输入参数从所述人工神经网络生成至少一个输出;
基于所述输出与期望输出之间的比较生成奖励;以及
基于所述奖励来修改所述...
【专利技术属性】
技术研发人员:史蒂芬·W·斯库黑姆,奈吉尔·D·斯特普,卢杰罗·斯科尔奇奥尼,
申请(专利权)人:HRL实验室有限责任公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。