【技术实现步骤摘要】
【国外来华专利技术】用于并行和分布式张量计算的神经硬件加速器
本公开的实施例涉及用于并行和分布式张量计算的硬件加速器,并且更具体地,涉及适于为卷积运算提供增加的能量效率和速度的神经网络及其编码。
技术介绍
在机器学习中,卷积神经网络(CNN)是一类多层神经网络,适用于例如分析视觉图像。CNN由输入和输出层以及多个隐藏层组成,其中包括至少一层共同计算卷积运算的人工神经元。人工神经元是一种数学函数,其输出是输入的线性组合的非线性函数。如果一个神经元的输出是另一神经元的输入,则两个神经元相连接。权重是编码一个神经元的输出与另一神经元的输入之间的连接强度的一个标量值。从多个连接的神经核计算适当的总体结果非常困难。因此,在本领域中需要解决前述问题。
技术实现思路
从第一方面来看,本专利技术提供一种用于管理神经网络的系统,该系统包括:多个神经核,多个神经核中的每一个包括至少一个存储器;以及互连多个神经核的网络,其中:多个神经核中的每一个的至少一个存储器包括至少部分权重张量,权重张量包括多个过滤器,每个神经核适于:在本地检 ...
【技术保护点】
1.一种用于管理神经网络的系统,该系统包括:/n多个神经核,多个神经核中的每一个包括至少一个存储器;以及/n以及互连多个神经核的网络,其中:/n多个神经核中的每一个的至少一个存储器包括至少部分权重张量,权重张量包括多个过滤器,每个神经核适于:/n在本地检索或接收部分输入数据张量;/n将部分权重张量应用于部分输入数据张量;/n并在本地存储或通过网络将结果发送到多个神经核中的另一个。/n
【技术特征摘要】
【国外来华专利技术】20180430 US 15/967,4821.一种用于管理神经网络的系统,该系统包括:
多个神经核,多个神经核中的每一个包括至少一个存储器;以及
以及互连多个神经核的网络,其中:
多个神经核中的每一个的至少一个存储器包括至少部分权重张量,权重张量包括多个过滤器,每个神经核适于:
在本地检索或接收部分输入数据张量;
将部分权重张量应用于部分输入数据张量;
并在本地存储或通过网络将结果发送到多个神经核中的另一个。
2.根据权利要求1所述的系统,其中将部分权重张量应用于部分输入数据张量包括计算向量矩阵乘法,然后计算激活函数。
3.根据前述权利要求任一项所述的系统,其中多个神经核被布置成二维阵列。
4.根据前述权利要求任一项所述的系统,其中网络在多个神经核之间提供本地连通性。
5.根据权利要求3所述的系统,其中网络提供阵列内相邻神经核之间的连通性。
6.根据前述权利要求任一项所述的系统,其中在多个神经核中的每一个的所述部分权重张量包括权重张量的块。
7.根据权利要求3所述的系统,其中权重张量根据阵列的物理维度分布在多个神经核之间。
8.根据权利要求7所述的系统,其中权重张量的维度、形状和划分是可配置的。
9.根据权利要求7所述的系统,其中权重张量沿表现本地性的一个或多个维度被划分。
10.根据权利要求9所述的系统,其中一个或多个维度包括空间维度。
11.根据权利要求9所述的系统,其中一个或多个维度包括至少一个特征维度。
12.根据前述权利要求任一项所述的系统,其中权重张量是稀疏的。
13.根据权利要求12所述的系统,其中在将所述部分权重张量应用于所述部分输入数据张量的期间,仅将权重张量的非零值用于计算。
14.根据权利要求12或13所述的系统,存储器仅存储权重张量的非零值。
15.根据前述权利要求任一项所述的系统,其中权重张量对应于卷积过滤器。
16.根据权利要求15所述的系统,其中权重张量沿一个或多个空间维度被划分。
17.根据前述权利要求任一项所述的系统,其中所述结果是中间结果,并且其中:
每个神经核还适于本地存储或通过网络将中间结果发送到多个神经核中的另一个;
每个神经核还适于本地检索或接收中间结果并从中计算最终结果。
18.根据前述权利要求任一项所述的系统,其中在多个神经核中的每一个的权重张量包括权重张量的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。