【技术实现步骤摘要】
【国外来华专利技术】专用神经网络训练芯片
技术介绍
本说明书涉及在硬件中执行神经网络计算。神经网络是机器学习模型,每个模型采用一个或多个模型层来为接收的输入生成例如分类的输出。除了输出层之外,一些神经网络还包括一个或多个隐藏层。每个隐藏层的输出用作网络中的下一层(即,网络的下一个隐藏层或输出层)的输入。网络的每个层根据相应参数集的当前值,从接收的输入生成输出。
技术实现思路
本说明书描述了与专用硬件芯片相关的技术,该专用硬件芯片是针对,特别是训练阶段的机器学习工作负载优化的可编程线性代数加速器。通常,本说明书中描述的主题的一个创新方面可以体现在专用的硬件芯片中。该方面的其他实施例包括记录在一个或多个计算机存储设备上的相应计算机系统,装置和计算机程序,每个计算机系统,装置和计算机程序被配置为执行方法的动作。对于要配置为执行特定操作或动作的一个或多个计算机的系统,意味着系统已在其上安装了软件,固件,硬件或它们的组合,在操作中使系统执行操作或动作。对于要配置为执行特定操作或动作的一个或多个计算机程序,意味着一个或多个程序包括当由数据处理装置执行 ...
【技术保护点】
1.一种用于训练神经网络的专用硬件芯片,其特征在于,所述专用硬件芯片包括:/n标量处理器,被配置为控制所述专用硬件芯片的计算操作;/n矢量处理器,被配置为具有矢量处理单元的二维阵列,所述矢量处理单元全部以单指令、多数据方式执行相同的指令,并且通过所述矢量处理器的加载和存储指令彼此通信;以及/n矩阵乘法单元,被耦合到所述矢量处理器,所述矩阵乘法单元被配置为将至少一个二维矩阵与另一个一维矢量或二维矩阵相乘,以便获得乘法结果。/n
【技术特征摘要】
【国外来华专利技术】20170517 US 62/507,7711.一种用于训练神经网络的专用硬件芯片,其特征在于,所述专用硬件芯片包括:
标量处理器,被配置为控制所述专用硬件芯片的计算操作;
矢量处理器,被配置为具有矢量处理单元的二维阵列,所述矢量处理单元全部以单指令、多数据方式执行相同的指令,并且通过所述矢量处理器的加载和存储指令彼此通信;以及
矩阵乘法单元,被耦合到所述矢量处理器,所述矩阵乘法单元被配置为将至少一个二维矩阵与另一个一维矢量或二维矩阵相乘,以便获得乘法结果。
2.根据权利要求1所述的专用硬件芯片,其特征在于,还包括:
向量存储器,被配置为向所述向量处理器提供快速专用存储器。
3.根据权利要求1所述的专用硬件芯片,其特征在于,还包括:
标量存储器,被配置为向所述标量处理器提供快速专用存储器。
4.根据权利要求1所述的专用硬件芯片,其特征在于,还包括:
转置单元,被配置为进行矩阵的转置操作。
5.根据权利要求1所述的专用硬件芯片,其特征在于,还包括:
归约和置换单元,被配置为进行数的归约,并且对向量阵列的不同通道之间的数进行置换。
6.根据权利要求1所述的专用硬件芯片,其特征在于,还包括:
高带宽存储器,被配置为存储所述专用硬件芯片的数据。<...
【专利技术属性】
技术研发人员:托马斯·诺里,奥利弗·特马姆,安德鲁·埃弗里特·菲尔普,诺曼·保罗·约皮,
申请(专利权)人:谷歌有限责任公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。