当前位置: 首页 > 专利查询>清华大学专利>正文

基于忆阻器的神经网络的训练方法及其训练装置制造方法及图纸

技术编号:23344901 阅读:52 留言:0更新日期:2020-02-15 04:23
一种基于忆阻器的神经网络的训练方法及其训练装置。该神经网络包括逐一连接的多层神经元层以及在神经元层之间的权重参数,该训练方法包括:训练神经网络的权重参数,并基于训练后的权重参数对忆阻器阵列进行编程,以将训练后的权重参数写入忆阻器阵列中;以及通过调节忆阻器阵列的部分电导值以更新神经网络的至少一层权重参数。该训练方法弥补了忆阻器神经网络的片上训练和片外训练实现方案的不足,从神经网络系统实现角度出发,解决了由于良率问题、非一致性问题、电导漂移以及随机的波动性等器件非理想特性造成的神经网络系统的功能退化,极大地简化了神经网络系统的复杂度,降低了神经网络系统的实现成本。

The training method and device of neural network based on memristor

【技术实现步骤摘要】
基于忆阻器的神经网络的训练方法及其训练装置
本公开的实施例涉及一种基于忆阻器的神经网络的训练方法及其训练装置。
技术介绍
深度神经网络算法的兴起,带来了智能化的信息技术革命。基于各种深度神经网络算法,可以实现图像识别与分割、物体探测以及完成对语音和文本的翻译、生成等处理。使用深度神经网络算法处理不同工作负载是一类以数据为中心的计算,实现该算法的硬件平台需要具有高性能、低功耗的处理能力。然而,传统的实现该算法的硬件平台是基于存储和计算分离的冯诺依曼架构,这种架构在计算时需要数据在存储器件和计算器件之间来回搬移,因此在包含大量参数的深度神经网络的计算过程中,该架构的能效较低。为此,开发一种新型计算硬件来运行深度神经网络算法成为当前亟需解决的问题。
技术实现思路
本公开至少一实施例提供一种基于忆阻器的神经网络的训练方法,所述神经网络包括逐一连接的多层神经元层以及在所述神经元层之间的权重参数,所述训练方法包括:训练所述神经网络的权重参数,并基于训练后的所述权重参数对忆阻器阵列进行编程,以将所述训练后的所述权重参数写入所述忆阻器阵列中;以及通过调节所述忆阻器阵列的至少部分电导值以更新所述神经网络的至少一层权重参数。例如,在本公开至少一实施例提供的训练方法中,训练所述神经网络的权重参数,并基于训练后的所述权重参数对忆阻器阵列进行编程,以将所述训练后的所述权重参数写入所述忆阻器阵列中,包括:在训练所述神经网络的权重参数的过程中,根据所述忆阻器阵列的电导状态的约束,直接获取所述神经网络的量化后的权重参数,将所述量化后的权重参数写入所述忆阻器阵列中。例如,在本公开至少一实施例提供的训练方法方法中,训练所述神经网络的权重参数,并基于训练后的所述权重参数对忆阻器阵列进行编程,以将训练后的所述权重参数写入忆阻器阵列中,包括:基于所述忆阻器阵列的电导状态的约束对所述训练后的权重参数进行量化操作,以获取量化后的权重参数;将所述量化后的权重参数写入所述忆阻器阵列中。例如,在本公开至少一实施例提供的训练方法中,所述量化操作包括均匀量化和非均匀量化。例如,在本公开至少一实施例提供的训练方法中,将所述量化后的权重参数写入所述忆阻器阵列中,包括:基于所述量化后的权重参数获取所述忆阻器阵列的电导状态的目标区间;判断所述忆阻器阵列的各器件的电导状态是否在所述目标区间内;如果否,判断所述忆阻器阵列的各器件的电导状态是否超出所述目标区间;如果是,施加反向脉冲;如果否,施加正向脉冲;如果是,则量化后的权重参数写入所述忆阻器阵列。例如,在本公开至少一实施例提供的训练方法中,通过调节所述忆阻器阵列的部分忆阻器的电导值以更新所述神经网络的至少一层权重参数,包括:通过前向计算操作和反向计算操作对所述忆阻器阵列进行训练;基于所述前向计算操作和所述反向计算操作的结果向所述忆阻器阵列的部分忆阻器施加正向电压或反向电压以更新所述忆阻器阵列的部分忆阻器的电导。例如,在本公开至少一实施例提供的训练方法中,仅对所述忆阻器阵列的至少部分进行所述反向计算操作。例如,在本公开至少一实施例提供的训练方法中,对所述忆阻器阵列逐行进行或逐列进行或整体并行进行所述前向计算操作和所述反向计算操作。例如,在本公开至少一实施例提供的训练方法中,逐行进行或逐列进行更新与所述忆阻器阵列的至少部分忆阻器相对应的权重参数。例如,在本公开至少一实施例提供的训练方法中,所述前向计算操作和所述反向计算操作仅使用部分训练集数据。例如,在本公开至少一实施例提供的训练方法中,通过调节所述忆阻器阵列的至少部分电导值以更新所述神经网络的至少一层权重参数,包括:更新所述神经网络中最后一层或最后多层的权重参数。例如,本公开至少一实施例提供的训练方法还包括:所述忆阻器阵列基于更新后的所述权重参数,计算所述神经网络的输出结果。本公开至少一实施例还提供一种基于忆阻器的神经网络的训练装置,包括:片外训练单元,配置为训练所述神经网络的权重参数,并基于训练后的所述权重参数对忆阻器阵列进行编程,以将所述训练后的所述权重参数写入所述忆阻器阵列中;以及片上训练单元,配置为通过调节所述忆阻器阵列的至少部分电导值以更新所述神经网络的至少一层权重参数。例如,在本公开至少一实施例提供的训练装置中,所述片外训练单元包括输入单元和读写单元,所述片上训练单元包括计算单元、更新单元和输出单元;所述输入单元配置为输入训练后的权重参数;所述读写单元配置为将所述训练后的所述权重参数写入所述忆阻器阵列中;所述计算单元配置为通过前向计算操作和反向计算操作对所述忆阻器阵列进行训练;所述更新单元配置为基于所述前向计算操作和所述反向计算操作的结果向所述忆阻器阵列的至少部分施加正向电压或反向电压以更新所述忆阻器阵列的至少部分对应的权重参数;所述输出单元配置为基于更新后的所述权重参数,计算所述神经网络的输出结果。例如,在本公开至少一实施例提供的训练装置中,所述片外训练单元还包括量化单元,所述量化单元配置为在训练所述神经网络的权重参数的过程中,根据所述忆阻器阵列的电导状态的约束,直接获取所述神经网络的量化后的权重参数,将所述量化后的权重参数写入所述忆阻器阵列中;或,配置为基于所述忆阻器阵列的电导状态的约束对所述训练后的权重参数进行量化操作,以获取量化后的权重参数。例如,在本公开至少一实施例提供的训练装置中,所述计算单元配置为仅对所述忆阻器阵列的至少部分进行所述反向计算操作。例如,在本公开至少一实施例提供的训练装置中,所述计算单元配置为逐行进行或逐列进行或整体并行进行所述前向计算操作、所述反向计算操作。例如,在本公开至少一实施例提供的训练装置中,所述更新单元配置为逐行进行或逐列进行更新操作。例如,在本公开至少一实施例提供的训练装置中,所述片上训练单元还配置为更新所述神经网络中最后一层或多层的权重参数。附图说明为了更清楚地说明本公开实施例的技术方案,下面将对实施例的附图作简单地介绍,显而易见地,下面描述中的附图仅仅涉及本公开的一些实施例,而非对本公开的限制。图1为一种神经网络的结构示意图;图2为一种忆阻器阵列的结构示意图;图3为本公开至少一实施例提供的一种训练方法的流程图;图4为图3所述的训练方法的示意图;图5为本公开至少一实施例提供的一种训练方法的一个示例的流程图;图6为本公开至少一实施例提供的一种在32个电导状态下的忆阻器的累积概率示意图;图7为本公开至少一实施例提供的一种训练方法的另一个示例的流程图;图8为本公开至少一实施例提供的一种权重参数分布的示意图;图9为本公开至少一实施例提供的一种将权重参数写入忆阻器阵列的流程图;图10为本公开至少一实施例提供的一种训练方法的又一个示例的流程图;图11A为本公开至少一实施例提供的一种前向计算操作的示意图;图11B为本公开至少一实施例提供的一种反向计算操作的示意图;图11C为本公开至少一实施本文档来自技高网...

【技术保护点】
1.一种基于忆阻器的神经网络的训练方法,所述神经网络包括逐一连接的多层神经元层以及在所述神经元层之间的权重参数,所述训练方法包括:/n训练所述神经网络的权重参数,并基于训练后的所述权重参数对忆阻器阵列进行编程,以将所述训练后的所述权重参数写入所述忆阻器阵列中;以及/n通过调节所述忆阻器阵列的至少部分电导值以更新所述神经网络的至少一层权重参数。/n

【技术特征摘要】
1.一种基于忆阻器的神经网络的训练方法,所述神经网络包括逐一连接的多层神经元层以及在所述神经元层之间的权重参数,所述训练方法包括:
训练所述神经网络的权重参数,并基于训练后的所述权重参数对忆阻器阵列进行编程,以将所述训练后的所述权重参数写入所述忆阻器阵列中;以及
通过调节所述忆阻器阵列的至少部分电导值以更新所述神经网络的至少一层权重参数。


2.根据权利要求1所述的训练方法,其中,训练所述神经网络的权重参数,并基于训练后的所述权重参数对忆阻器阵列进行编程,以将所述训练后的所述权重参数写入所述忆阻器阵列中,包括:
在训练所述神经网络的权重参数的过程中,根据所述忆阻器阵列的电导状态的约束,直接获取所述神经网络的量化后的权重参数,将所述量化后的权重参数写入所述忆阻器阵列中。


3.根据权利要求1所述的训练方法,其中,训练所述神经网络的权重参数,并基于训练后的所述权重参数对忆阻器阵列进行编程,以将训练后的所述权重参数写入忆阻器阵列中,包括:
基于所述忆阻器阵列的电导状态的约束对所述训练后的权重参数进行量化操作,以获取量化后的权重参数;
将所述量化后的权重参数写入所述忆阻器阵列中。


4.根据权利要求3所述的训练方法,其中,所述量化操作包括均匀量化和非均匀量化。


5.根据权利要求2-4任一所述的训练方法,其中,将所述量化后...

【专利技术属性】
技术研发人员:吴华强姚鹏高滨张清天钱鹤
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1