使用主机传达的合并权重和每层指令的封装通过神经网络加速器进行的多层神经网络处理制造技术

技术编号：24366100 阅读：19 留言：0更新日期：2020-06-03 04:49

在所公开的用于在神经网络系统中进行处理的方法和系统中，主机计算机系统(402)将与神经网络的多个层相关联的多个权重矩阵写入(602)到与神经网络加速器(238)共享的存储器(226)中。主机计算机系统还将多个每层指令组装(610)为指令封装。每个每层指令指定对神经网络的多个层中的相应层的处理以及共享存储器中权重矩阵的相应偏移。主机计算机系统将输入数据和指令封装写入(612，614)到共享存储器。神经网络加速器从共享存储器中读取(702)指令封装，并且处理(702‑712)指令封装的多个每层指令。

Multi layer neural network processing via neural network accelerator using the combination weight communicated by the host and the encapsulation of each layer's instructions

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用主机传达的合并权重和每层指令的封装通过神经网络加速器进行的多层神经网络处理
本公开大体上涉及神经网络处理。
技术介绍
机器学习是使计算系统无需明确编程即可采取行动的科学。传统机器学习包括各种聚类和分类技术，包括K-means聚类、线性和逻辑回归、随机梯度下降、关联规则学习等。深度学习是机器学习中的较新前沿。深度学习是一类机器学习算法，其使用多层非线性处理单元进行特征提取和变换。深度学习算法可以不受监督(例如，模式分析)或受监督(例如，分类)。深度学习算法可以使用人工神经网络(ANN)(在本文中被称为“神经网络”)的各层来实现。一般而言，神经网络是在曲线图中连接的节点(即“神经元”)的集合。神经网络中的节点计算加权输入的总和，并且向总和添加可选偏差。节点的输出是最终总和的函数(称为“激活函数”)。示例激活函数包括S形函数、双曲正切(tanh)函数、整流线性单元(ReLU)函数和恒等函数。神经网络模型通常组织为节点的各层，这些层定义了特定拓扑结构以及对应的权重和偏差。权重和偏差被称为网络参数。一般而言，神经网络包括输入层和输出层，并且可以可选地包括输入层和输出层之间的一个或多个隐藏层。用于深度学习应用的神经网络通常包括许多隐藏层，这导致出现术语“深度神经网络(DNN)”。神经网络的层可以紧密连接(例如，一层中的每个节点都完全连接到上一层中的所有节点)，还可以稀疏连接(例如，一层中的每个节点仅连接到上一层中的节点中的一部分节点)。卷积神经网络(CNN)是一种DNN，其包括一个或多个稀疏连接的层，...

【技术保护点】
1.一种方法，包括：/n通过主机计算机系统将与神经网络的多个层相关联的多个权重矩阵写入与神经网络加速器共享的存储器；/n通过所述主机计算机系统将多个每层指令组装为指令封装，每个每层指令指定对所述神经网络的所述多个层的相应层的处理以及共享的存储器中权重矩阵的相应偏移；/n通过所述主机计算机系统将输入数据和所述指令封装写入所述共享的存储器；/n通过所述神经网络加速器从所述共享的存储器中读取所述指令封装；以及/n通过所述神经网络加速器处理所述指令封装的所述多个每层指令。/n

【技术特征摘要】
【国外来华专利技术】20171017 US 15/785,8001.一种方法，包括：
通过主机计算机系统将与神经网络的多个层相关联的多个权重矩阵写入与神经网络加速器共享的存储器；
通过所述主机计算机系统将多个每层指令组装为指令封装，每个每层指令指定对所述神经网络的所述多个层的相应层的处理以及共享的存储器中权重矩阵的相应偏移；
通过所述主机计算机系统将输入数据和所述指令封装写入所述共享的存储器；
通过所述神经网络加速器从所述共享的存储器中读取所述指令封装；以及
通过所述神经网络加速器处理所述指令封装的所述多个每层指令。

2.根据权利要求1所述的方法，其中所述写入所述多个权重矩阵包括：在所述处理所述多个每层指令之前，将所有所述多个权重矩阵写入所述共享的存储器。

3.根据权利要求1或权利要求2所述的方法，其中所述写入所述多个权重矩阵包括：在所述处理所述多个每层指令之前，将所有所述多个权重矩阵写入所述共享的存储器中的连续地址空间。

4.根据权利要求1至3中任一项所述的方法，还包括：从所述主机计算机系统向所述神经网络加速器传达指示所述权重矩阵在所述共享的存储器中的基址的参数。

5.根据权利要求1至4中任一项所述的方法，其中所述处理所述多个每层指令封装包括：
处理第一每层指令，接着连续处理所述指令封装的第二每层指令；
在处理所述第一每层指令时，从所述共享的存储器的第一部分读取输入数据，并且将输出数据写入所述共享的存储器的第二部分；以及
在处理所述第二每层指令时，从所述共享的存储器的所述第二部分读取输入数据，并且将输出数据写入所述共享的存储器的所述第一部分。

6.根据权利要求1至5中任一项所述的方法，其中所述处理所述多个每层指令封装包括：按照在所述指令封装中出现的次序来处理所述指令封装中的所述多个每层指令。

7.根据权利要求1至6中任一项所述的方法，其中所述处理所述多个每层指令封装包括：针对指令封装中的n个指令在开始执行指令i+1之前，处理完成指令i的执行，并且1≤i≤n。

8.根据权利要求1至7中任一项所述的方法，其中所述处理所述多个每层指令封装包括：针对由所述指令封装定义的状态机，评估有限状态机转换表。

9.一种神经网络处理系统，包括：
共享存储器；
主机计算机系统，耦合到所述共享存储器，其中...

【专利技术属性】
技术研发人员：A·吴，E·德拉耶，E·盖塞米，滕晓，J·泽杰达，吴永军，S·塞特勒，A·西拉萨奥，
申请(专利权)人：赛灵思公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人