一种用于执行全连接层神经网络训练的装置和方法制造方法及图纸

技术编号：20426475 阅读：21 留言：0更新日期：2019-02-23 08:56

本发明专利技术提供了一种用于执行人工神经网络全连接层反向训练的装置，包括指令存储单元、控制器单元、数据访问单元、互连模块、主运算模块、以及多个从运算模块。使用该装置可以实现人工神经网络全连接层的反向训练。对于每一层来说，首先对输入梯度向量进行加权求和计算出本层的输出梯度向量。该输出梯度向量乘以下一层在正向运算时的激活函数的导数值可以得到下一层的输入梯度向量。将输入梯度向量与正向运算时的输入神经元对位相乘得到本层权值的梯度，然后可以根据所得到的本层权值的梯度来更新本层的权值。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于执行全连接层神经网络训练的装置和方法
本专利技术总体上涉及人工神经网络，具体地涉及一种用于执行人工神经网络全连接层的反向训练的装置和方法。
技术介绍
人工神经网络被广泛应用于模式识别，图像处理，函数逼近和优化计算等领域，人工网络在近年来由于其较高的识别准确度和较好的可并行性，受到学术界和工业界越来越广泛的关注。人工神经网络全连接层是一种常见的人工神经网络类型，就像大脑里的神经网络一样，人工神经网络全连接层由一些互相连接的节点组成，如图1所示，每个圆圈表示一个神经元，每个箭头表示两个神经元之间的连接又被称为权值，所有的输入与输出之间互相都有连接。神经元的计算公式可以简单的描述成：其中，x表示所有和输出神经元相连接的输入神经元，w表示x和输出神经元之间对应的权值，b是一个常数。f(x)是一个非线性函数，通常称作激活函数。一种支持人工神经网络全连接层反向训练的已知方法是使用通用处理器。该方法通过使用通用寄存器堆和通用功能部件执行通用指令来支持上述算法。该方法的缺点之一是单个通用处理器的运算性能较低，无法满足通常的人工神经网络全连接层反向训练的性能需求。而多个通用处理器并行执行时，通用处理器之间相互通信又成为了性能瓶颈。另外，通用处理器需要把人工神经网络全连接层反向运算译码成一长列运算及访存指令序列，处理器前端译码带来了较大的功耗开销。另一种支持人工神经网络全连接层反向训练的已知方法是使用图形处理器(GPU)。该方法通过使用通用寄存器堆和通用流处理单元执行通用SIMD指令来支持上述算法。由于GPU是专门用来执行图形图像运算以及科学计算的设备，没有对人工神经...

【技术保护点】
1.一种用于执行人工神经网络全连接层反向训练的装置，所述装置用于执行人工神经网络全连接层反向训练的指令；所述装置包括指令存储单元、控制器单元、直接内存访问单元、互连模块、主运算模块、从运算模块，其中：直接内存访问单元，用于执行数据的读写操作，从外部存储空间读取指令；指令缓存单元，用于缓存指令；控制器单元，用于从指令存储单元读取指令，并将该指令译码成控制互连模块、主运算模块、以及所述从运算模块行为的控制信号；所述互连模块，用于连接主运算模块和从运算模块；主运算模块，用于依据该控制信号将上一层的输出神经元梯度向量乘以本层激活函数导数得到输入神经元梯度向量，通过互连模块向从运算模块传输本层的输入神经元梯度向量；从运算模块，用于计算输入神经元梯度向量与权值矩阵中该从运算模块对应列的乘积，得到本层输出神经元梯度向量部分和；互连模块，用于依据从运算模块的输出神经元梯度向量部分和得到本层的输出神经元梯度向量；主运算模块，在下一层的计算过程中，利用本层的输出神经元梯度向量完成后续计算；从运算模块，还用于将输入神经元梯度向量与该从运算模块对应的输入神经元数据计算得到本层的权值梯度；主运算模块，用于对本层...

【技术特征摘要】
1.一种用于执行人工神经网络全连接层反向训练的装置，所述装置用于执行人工神经网络全连接层反向训练的指令；所述装置包括指令存储单元、控制器单元、直接内存访问单元、互连模块、主运算模块、从运算模块，其中：直接内存访问单元，用于执行数据的读写操作，从外部存储空间读取指令；指令缓存单元，用于缓存指令；控制器单元，用于从指令存储单元读取指令，并将该指令译码成控制互连模块、主运算模块、以及所述从运算模块行为的控制信号；所述互连模块，用于连接主运算模块和从运算模块；主运算模块，用于依据该控制信号将上一层的输出神经元梯度向量乘以本层激活函数导数得到输入神经元梯度向量，通过互连模块向从运算模块传输本层的输入神经元梯度向量；从运算模块，用于计算输入神经元梯度向量与权值矩阵中该从运算模块对应列的乘积，得到本层输出神经元梯度向量部分和；互连模块，用于依据从运算模块的输出神经元梯度向量部分和得到本层的输出神经元梯度向量；主运算模块，在下一层的计算过程中，利用本层的输出神经元梯度向量完成后续计算；从运算模块，还用于将输入神经元梯度向量与该从运算模块对应的输入神经元数据计算得到本层的权值梯度；主运算模块，用于对本层的权值梯度进行处理得到本层的第二权值梯度，依据第二权值梯度进行本层权值的更新。2.根据权利要求1所述的装置，其特征在于，所述指令包括CONFIG指令、COMPUTE指令、IO指令、NOP指令、JUMP指令和MOVE指令。3.根据权利要求1所述的装置，其特征在于，所述从运算模块为多个，所述互连模块，具体用于将多个从运算模块的输出神经元梯度逐级合并成中间向量。4.根据权利要求3所述的装置，其特征在于，如所互连模块为包括树状结构，所述树状结构为二叉树通路；所述二叉树通路包括：多个节点；其中，每个节点将上游的数据同样地发给下游的两个节点，以及将下游的两个节点返回的数据进行合并后返回给上游的节点。5.根据权利要求1所述的装置，其中，主运算模块，具体用于利用本层的输出神经元梯度向量与反向运算下一层的激活函数求导值对位相乘得到下一层的输入神经元梯度向量。6.根据权利要求4所述的装置，其中，主运算模块包括第一存储单元、第一运算单元、第一数据依赖关系判定单元，其中：第一存储单元，用于缓存主运算模块在计算过程中用到的输入神经元数据和输出数据；第一运算单元，完成主运算模块的各种运算功能；第一数据依赖关系判定单元，用于从第一存储单元读取输入的神经元向量，并通过H数模块发送给从运算模块；以及接收H数模块的中间结果向量，将中间结果向量发送到运算单元。7.根据权利要求4所述的装置，其中，每个从运算模块包括：第二运算单元、第二数据依赖关系判定单元、神经元缓存单元和权值缓存单元，其中：第二数据依赖关系判断单元，用于对神经元缓存单元和权值缓存单元的读写操作，保证对神经元缓存单元和权值缓存单元的读写不存在一致性冲突；神经元缓存单元，用于缓存输入神经元向量数据以及该从运算模块计算得到的输出神经元值；权值缓存单元，用于缓存该从运算模块在计算过程中需要的权值向量；第二运算单元，用于接收控制器单元发出的微指令并进行算数逻辑运算。8.根据权利要求1所述的装置，其中：所述将输入神经元梯度向量与该从运算模块对应的输入神经元数据计算得到本层的权值梯度具体包括：每个从运算模块，用于将输出神经元梯度向量中与该从运算模块相对应的标量数据与输出神经元向量相乘，得到本从运算模块在本层的权值梯度向量。9.根据权利要求8所述的装置，其中：所述对本层的权值梯度进行处理得到本层的第二权值梯度具体包括：在算出所有层的权值更新梯度向量之后，主运算模块，用于计算所有层的权值更新梯度的平方和sumsq_diff,然后对sumsq_diff进行开方得到l2norm_diff；如果l2norm_diff＞clip_gradient，计算缩放因子scale_factor＝clip_gradient/l2norm_diff，第二权值更新梯度＝scale_factor*本层权值更新梯度；其中，clip_gradient为预设设定的正常数。10.根据权利要求9所述的装置，其中，所述依据第二权值梯度进行本层权值的更新具体包括：W’＝η*w+α*(dw+m*dw’)；其中，W’为本层更新后的权值，dw为第二权值梯度、α为指令设置的学习率，m指令设置的动量、η为指令设置的权重衰减系数；dw’为上一次更新权值时的第二权值梯度。11.根据权利要求10所述的装置，其中，每个从运算模块存储w、dw和dw’中与该从运算模块相对应的列向量。12.根据权利要求1所述的装置，其中，计算输出神经元梯度向量的过程为out_gradient＝w*in_gradient，其中权值矩阵w和输入神经元梯度向量in_gradient的矩阵向量乘法可以划分为不相关的并行计算子任务，每个从运算模块计算出输出神经元梯度向量的部分和，所有的部分和在互连模块中完成拼接得到最后的输出神经元梯度向量。13.根据权利要求12所述的装置，其中，计算输出神经元梯度向量时，上一层的输出神经元梯度向量inputgradient乘以对应的激活函数导数得到本层的输入神经元梯度向量in_gradient，再与权值矩阵w相乘得到输出神经元梯度向量。14.根据权利要求13所述的装置，其中，inputgradient是第n+1层的输出神经元梯度向量，该向量首先要与正向运算过程中第n层的导数值相乘，得到第n层的输入神经元梯度向量，该过程在主运算模块中完成，由互连模块发往从运算模块，暂存在从运算模块的神经元存储单元中，然后，输入神经元梯度向量与权值矩阵相乘得到第n层的输出神经元梯度向量，在这个过程中，第i个从运算模块计算输入神经元梯度向量中第i个标量和权值矩阵中列向量的乘积，得到的输出向量在互连模块中进行拼接操作得到最后的输出神经元梯度向量outputgradient。15.一种执行人工神经网络全连接层反向训练指令的方法，其特征在于，所述方法应用于人工神经网络全连接层反向训练...

【专利技术属性】
技术研发人员：郭崎，张士锦，陈云霁，陈天石，
申请(专利权)人：北京中科寒武纪科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人