【技术实现步骤摘要】
【国外来华专利技术】深度神经网络训练
技术介绍
[0001]本专利技术总体上涉及深度神经网络
(DNN)
训练,并且更具体地,涉及用于将斩波器值
(chopper value)
添加到电阻处理单元
(RPU)
设备的滤波信号以降低噪声的技术
。
[0002]深度神经网络
(DNN)
可被体现在诸如电阻处理单元
(RPU)
的电阻设备的模拟交叉点阵列中
。RPU
设备通常包括第一端子
、
第二端子和有源区
。
有源区的电导状态
(conductance state)
标识
RPU
的权重值,可以通过向第一
/
第二端子施加信号来更新
/
调整该
RPU
的权重值
。
[0003]基于
DNN
的模型已经被用于各种不同的基于认知的任务,诸如对象和语音标识和自然语言处理
。
在执行这样的任务时,需要
DNN
训练来提供高水平的准确度
。
训练大的
DNN
是计算密集的任务
。DNN
训练的最流行方法
(
诸如后向传播和随机梯度下降
(SGD))
要求
RPU“对称”以准确地工作
。
当受到正电压脉冲和负电压脉冲时,对称的模拟电阻设备对称地改变电导
。
然而,实际上,<
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.
一种训练深度神经网络
(DNN)
的方法,所述方法包括:通过用来自权重矩阵的激活值和误差值乘以斩波器值来更新
A
矩阵的元素来确定增量权重更新,其中所述元素包括电阻处理单元;从所述元素读取更新电压;通过将所述更新电压乘以所述斩波器值确定斩波器乘积;存储隐藏矩阵的元素,其中所述隐藏矩阵的所述元素包括所述斩波器乘积的连续迭代的总和;以及基于所述隐藏矩阵的所述元素达到阈值状态来更新所述权重矩阵的对应的元素
。2.
根据权利要求1所述的方法,其中,所述斩波器值包括选自包括正一和负一的组的状态
。3.
根据权利要求2所述的方法,其中,在正一值和负一值之间翻转所述状态的概率是用户定义的
。4.
根据权利要求1所述的方法,其中,更新所述权重矩阵的所述对应的元素包括通过所述权重矩阵的导电列配线传输电压脉冲,同时通过所述权重矩阵的导电行配线传输所述隐藏矩阵的所述元素的符号信息作为电压脉冲
。5.
根据权利要求1所述的方法,其中,所述斩波器值被施加到所述
A
矩阵的导电列线
。6.
根据权利要求1所述的方法,其中,所述斩波器值被施加到所述
A
矩阵的导电行线
。7.
一种用于训练深度神经网络的计算机实现方法,包括:跟踪隐藏矩阵的对应的元素中的
A
矩阵的元素的斩波器乘积的总和,其中所述斩波器乘积包括在被施加到所述
A
矩阵之前和之后来自权重矩阵的对应的元素的激活值和误差值乘以斩波器值;当所述总和之一的总和达到阈值时,触发所述权重矩阵的所述对应的元素的更新
。8.
根据权利要求7所述的方法,其中,所述斩波器值包括选自包括正一和负一的组的值
。9.
根据权利要求8所述的方法,其中,在正一值和负一值之间翻转所述状态的概率是用户定义的
。10.
根据权利要求7所述的方法,其中,进行数字地跟踪所述总和
。11.
一种深度神经网络
(DNN)
,包括:
A
矩阵,包括将导电行线与导电列线之间的交叉点分开的电阻处理单元
(RPU)
设备,由此所述
RPU
设备包括所述
DNN
中的神经元之间的加权连接的经处理的梯度;权重矩阵,包括将导电行线与导电列线之间的交叉点分开的
RPU
设备,由此所述
RPU
设备包括所述
DNN
中的神经元之间的加权连接;斩波器,被配置为将来自所述权重矩阵的激活值和误差值在被施加到所述
A
矩阵之前乘以斩波器值,并将来自所述
A
矩阵的输出向量乘以所述斩波器值以产生斩波器乘积;以及计算机存储装置,被配置为存储隐藏矩阵,所述隐藏矩阵包括所述权重矩阵
W
中的每个
RPU
设备的
H
值,其中所述
H
值包括所述斩波器乘积的总和
。12.
根据权利要求
11
所述的
DNN
,其中,所述斩波器被分配给从包括所述
A
矩阵的所述列线之一和所述
A
矩阵的所述行线之一的组中的选择
。13.
根据权利要求
11
所述的
DNN
,其中,所述斩波器值以用户定义的概率在正一值和负
一值之间翻转
。14.
一种用于减少阵列中的偏置的计算机程序产品,所述计算机程序产品包括:一个或多个计算机可读存储介质,以及共同存储在所述一个或多个计算机可读存储介质上的程序指令,所述程序指令包括:用于初始化
A
矩阵的元素的程序指令,其中所述元素包括电阻处理...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。