加速深度神经网络算法的加速芯片的运算装置及方法制造方法及图纸

技术编号：14891498 阅读：96 留言：0更新日期：2017-03-29 00:16

本发明专利技术提供一种加速深度神经网络算法的加速芯片的运算装置及方法，所述装置包括：向量加法处理器模块，进行向量的加法或减法、和/或深度神经网络算法中的池化层算法的向量化的运算；向量函数值运算器模块，深度神经网络算法中的非线性求值的向量化运算；向量乘加器模块，进行向量的乘加运算；所述三个模块执行可编程指令，互相交互以计算神经网络输出结果以及代表中间层之间神经元作用强度的突触权重变化量；所述三个模块中均设置有中间值存储区域，并对主存储器进行读取与写入操作。由此，能够减少对主存储器的中间值读取和写入次数，降低加速器芯片的能量消耗，避免数据处理过程中的数据缺失和替换问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于神经网络算法领域和计算机硬件领域。更具体地，本专利技术涉及一种加速深度神经网络算法的加速芯片的运算装置及方法。
技术介绍
人工神经网络算法，是20世纪80年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型，按不同的连接方式组成不同的网络。其具有自主学习功能，可通过训练慢慢学会识别和预测；联想存储功能，具有很高算法健壮性；并行度高，具有高速寻找优化解的能力，可针对大数据复杂问题快速找到优化解；可塑性强，可充分逼近任意复杂的非线性关系；具有很强的信息综合能力，能同时处理定量和定性的信息，适用于多信息融合和多媒体技术。近年来，人工神经网络的研究工作不断深入，已经取得了很大的进展，其在图像处理、模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多传统计算机方法难以解决的实际问题，表现出了良好的智能特性，推动着信息处理技术和人工智能不断地发展。神经网络虽然已在诸多领域取得广泛的成功，然而现阶段，大部分神经网络算法是在软件算法层次进行优化，在通用CPU或GPU上搭建运行。鉴于通用处理器相对较低的性能功耗比，高效地实现神经网络算法的方式已成为大家的迫切需求。深度神经网络算法通常包括：卷积层、局部响应归一化层(LRN)、池化(pooling)层、全连接层等几大类层。每层中的数据被称为神经元，不同层之间互联组成一个深度神经网络。池化层作为深度神经网络算法中的一部分，其功能可以理解为神经网络中对前一层的数据进行采样。池化层可分为最大池化(maxpooling)层，即每个输出神经元值是输入...
加速深度神经网络算法的加速芯片的运算装置及方法

【技术保护点】
一种加速深度神经网络算法的加速芯片的运算装置，其特征在于，包括：向量加法处理器模块，用于进行向量的加法或减法、和/或深度神经网络算法中的池化层算法的向量化的运算；向量函数值运算器模块，用于深度神经网络算法中的非线性求值的向量化运算；向量乘加器模块，用于进行向量的乘加运算；被配置为执行可编程指令的所述向量加法处理器模块、向量函数值运算器模块、和向量乘加器模块之间互相交互以计算神经网络中间层网络输出结果以及中间层之间神经元作用强度的突触权重变化量；所述加速深度神经网络算法的加速芯片的运算装置对于平均池化层的结果，是先由向量加法处理器模块计算向量输出中每个神经元所对应的输入累加值，然后用向量乘加器模块乘以平均因子求得；所述加速深度神经网络算法的加速芯片的运算装置对于最大池化层的结果，是由向量加法处理器模块计算向量输出中每个神经元所对应的输入最大值求得；所述加速深度神经网络算法的加速芯片的运算装置对于卷积层以及全连接层的结果，是先使用向量加法处理器模块叠加输出神经元对应的部分和以及偏置，然后再由向量函数值运算器模块求得输出神经元值；所述部分和为通过外界处理器求得后通过总线传输给所述运算装置；所...

【技术特征摘要】
2015.11.17 CN 20151079246301.一种加速深度神经网络算法的加速芯片的运算装置，其特征在于，包括：向量加法处理器模块，用于进行向量的加法或减法、和/或深度神经网络算法中的池化层算法的向量化的运算；向量函数值运算器模块，用于深度神经网络算法中的非线性求值的向量化运算；向量乘加器模块，用于进行向量的乘加运算；被配置为执行可编程指令的所述向量加法处理器模块、向量函数值运算器模块、和向量乘加器模块之间互相交互以计算神经网络中间层网络输出结果以及中间层之间神经元作用强度的突触权重变化量；所述加速深度神经网络算法的加速芯片的运算装置对于平均池化层的结果，是先由向量加法处理器模块计算向量输出中每个神经元所对应的输入累加值，然后用向量乘加器模块乘以平均因子求得；所述加速深度神经网络算法的加速芯片的运算装置对于最大池化层的结果，是由向量加法处理器模块计算向量输出中每个神经元所对应的输入最大值求得；所述加速深度神经网络算法的加速芯片的运算装置对于卷积层以及全连接层的结果，是先使用向量加法处理器模块叠加输出神经元对应的部分和以及偏置，然后再由向量函数值运算器模块求得输出神经元值；所述部分和为通过外界处理器求得后通过总线传输给所述运算装置；所述加速深度神经网络算法的加速芯片的运算装置对于局部响应归一化层的结果，则是先用向量函数值运算器模块求得非线性函数值，然后再与输入层神经元通过向量乘加器模块相乘得到；所述加速深度神经网络算法的加速芯片的运算装置对于突触权重的变化量是通过向量乘加器模块将反向传播求得的残差和对应的输入神经元值相乘以及学习率因子相乘获得，所述反向传播求得的残差是通过外界处理器求得后通过总线传输给所述运算装置；所述加速深度神经网络算法的加速芯片的运算装置通过数据总线与外界处理器进行数据交互；所述向量加法处理器模块、向量函数值运算器模块、和向量乘加器模块中均设置有中间值存储区域，用于存储依照所述指令所计算的向量化的中间值，并对主存储器进行读取与写入操作。2.根据权利要求1所述的加速深度神经网络算法的加速芯片的运算装置，其特征在于，所述向量加法处理器模块、向量函数值运算器模块、和向量乘加器模块生成输出值之后，存储于所述中间值存储区域内所述中间值将被丢弃。3.根据权利要求1所述的加速深度神经网络算法的加速芯片的运算装置，其特征在于，所述向量加法处理器模块、向量函数值运算器模块、和向量乘加器模块的所述中间值存储区域被配置为随机存储器。4.根据权利要求3所述的加速深度神经网络算法的加速芯片的运算装置，其特征在于，所述随机存储器被配置为存储自身产生的来自于每个神经元、突出权重变化量的中间值。5.根据权利要求1所述的加速深度神经网络算法的加速芯片的运算装置，其特征在于，所述向量加法处理器模块、向量函数值运算器模块、和向量乘加器模块通过一个索引访问所述中间值存储区域。6.一种使用权利要求1-5所述加速深度神经网络算法的加速芯片的运算装置进行运算的方法，其特征在于，包括以下步骤：向...

【专利技术属性】
技术研发人员：李震，刘少礼，张士锦，罗韬，钱诚，陈云霁，陈天石，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人