【技术实现步骤摘要】
一种计算装置及板卡
本申请涉及信息处理
,具体涉及一种计算装置及板卡。
技术介绍
随着信息技术的不断发展和人们日益增长的需求,人们对信息及时性的要求越来越高了。目前,终端对信息的获取以及处理均是基于通用处理器获得的。例如通用处理器循环神经网络被广泛应用于语音识别,语言建模,翻译,图片描述等领域,近年来由于其较高的识别准确度和较好的可并行性,受到学术界和工业界越来越广泛的关注。在实践中发现,这种基于通用处理器运行软件程序来处理循环神经网络,但是循环神经网络通过处理器,效率低,功耗高。
技术实现思路
本申请实施例提供了一种计算装置及相关产品,可提升循环神经网络的处理速度,提高效率、节省功耗。第一方面,提供一种计算装置,所述所述计算装置用于执行循环神经网络运算,所述循环神经网络包括:输入层、隐层和输出层,输入层、隐层和输出层包括H个,所述计算装置包括:运算单元以及控制器单元;所述运算单元包括:一个主处理电路和从处理电路;所述计算装置用于执行循环神经网络的第h个隐层计算,所述h个隐层对应的时间为t;所述控制器单元,用于获取第h个隐层的输入数据Xit、第h个隐层的权值W, ...
【技术保护点】
1.一种计算装置,其特征在于,所述计算装置用于执行循环神经网络运算,所述循环神经网络包括:输入层、隐层和输出层,输入层、隐层和输出层包括H个,所述计算装置包括:运算单元以及控制器单元;所述运算单元包括:一个主处理电路和从处理电路;所述计算装置用于执行循环神经网络的第h个隐层计算,所述h个隐层对应的时间为t;所述控制器单元,用于获取第h个隐层的输入数据Xit、第h个隐层的权值W,第h-1个隐层的输出结果Oit-1;所述控制器单元,还用于将输入数据Xit、权值W以及输出结果Oit-1发送给所述主处理电路;所述主处理电路,用于将输入数据Xit拆分成多个输入数据块,将输出结果Oit ...
【技术特征摘要】
1.一种计算装置,其特征在于,所述计算装置用于执行循环神经网络运算,所述循环神经网络包括:输入层、隐层和输出层,输入层、隐层和输出层包括H个,所述计算装置包括:运算单元以及控制器单元;所述运算单元包括:一个主处理电路和从处理电路;所述计算装置用于执行循环神经网络的第h个隐层计算,所述h个隐层对应的时间为t;所述控制器单元,用于获取第h个隐层的输入数据Xit、第h个隐层的权值W,第h-1个隐层的输出结果Oit-1;所述控制器单元,还用于将输入数据Xit、权值W以及输出结果Oit-1发送给所述主处理电路;所述主处理电路,用于将输入数据Xit拆分成多个输入数据块,将输出结果Oit-1拆分成多个输出数据块,将多个输入数据块以及多个输出数据块分发给从处理电路,将所述权值W广播给所述从处理电路;从处理电路,用于将接收到的输入数据块与权值执行乘积运算得到输入中间结果,将接收到的输出数据块与权值执行乘积运算得到输出中间结果,将输入中间结果以及输出中间结果发送给主处理电路;所述主处理电路,还用于将从处理电路的输入中间结果得到部分输出结果,将输出中间结果拼接得到另一部分输出结果,计算部分输出结果和另一部分输出结果的和得到t时刻隐层输出结果。2.根据权利要求1所述的计算装置,其特征在于,所述主处理电路,还用于将隐层的输出结果发送给第h+1隐层。3.根据权利要求1所述的计算装置,其特征在于,所述主处理电路,还用于将该隐层输出结果执行后续运算得到所述循环神经网络运算第h个输出层的输出结果Oit;所述后续处理包括如下操作中的一种或任意组合:偏置操作或激活操作;所述激活操作包括:sigmoid,tanh,relu,softmax或线性激活操作。4.根据权利要求1所述的装置,其特征在于,如所述从处理电路的数量为多个,所述运算单元包括:树型模块,所述树型模块包括:一个根端口和多个支端口,所述树型模块的根端口连接所述主处理电路,所述树型模块的多个支端口分别连接多个从处理电路中的一个从处理电路;所述树型模块,用于转发所述主处理电路与所述多个从处理电路之间的输入数据块、输出数据块、权值以及中间结果。5.根据权利要求1所述的装置,其特征在于,如所述从处理电路的数量为多个,所述运算单元还包括一个或多个分支处理电路,每个分支处理电路连接至少一个从处理电路,所述分支处理电路,用于转发所述主处理电路与所述多个从处理电路之间的输入数据块、输出数据块、权值以及中间结果。6.根据权利要求1所述的装置,其特征在于,如所述从处理电路的数量为多个,所述多个从处理电路呈阵列分布;每个从处理电路与相邻的其他从处理电路连接,所述主处理电路连接所述多个从处理电路中的k个从处理电路,所述k个基础电路为:第1行的n个从处理电路、第m行的n个从处理电路以及第1列的m个从处理电路;所述K个从处理电路,用于在所述主处理电路以及多个从处理电路之间的输入数据块、输出数据块、权值以及中间结果的转发。7.根据权利要求5-6任意一项所述的装置,其特征在于,所述主处理电路,具体用于将多个处理电路发送的输入中间结果进行组合排序得到部分输出结果,将多个处理电路发送的输出中间结果进行组合排序得到另一部分输出结果。8.根据权利要求5-6任意一项所述的装置,其特征在于,所述主处理电路包括:转换处理电路;所述转换处理电路,用于对数据执行转换处理,具体为:将主处理电路接收的输入数据Xit、权值W或输出结果Oit-1执行第一数据结构与第二数据结构之间的互换。9.根据权利要求5或6所述的装置,其特征在于,所述从处理电路包括:乘法处理电路和累加处理电路;所述乘法处理电路,用于对接收到的输入数据块中的元素值与权值中对应位置的元素值执行乘积运算得到乘积结果;接收到的输出数据块中的元素值与权值中对应位置的元素值执行乘积运算得到另一乘积结果;所述累加处理电路,用于对该乘积结果执行累加运算得到该输入中间结果,将该另一乘积结果执行累加运算得到输出中间结果。10.根据权利要求4所述的装置,其特征在于,所述树型模块为n叉树结构,所述n为大于等于2的整数。11.一种循环神经网络运算装置,其特征在于,所述循环神经网络运算装置包括一个或多个如权利要求1-10任一项所述的计算装置,用于从其他处理装置中获取待运算数据和控制信息,并执行指定的循环神经网络运算,将执行结果通过I/O接口传递给其他处理装置;当所述循环神经网络装置包含多个所述计算装置时,所述多个所述计算装置间可以通过特定的结构进行连接并传输数据;其中,多个所述计算装置通过快速外部设备互连总线PCIE总线进行互联并传输数据,以支持更大规模的循环神经网络的运算;多个所述计算装置共享同一控制系统或拥有各自的控制系统;多个所述计算装置共享内存或者拥有各自的内存;多个所述计算装置的互联方式是任意互联拓扑。12.一种组合处理装置,其特征在于,所述组合处理装置包括如权利要求11所述的循环神经网络运算装置,通用互联接口和其他处理装置;所述循环...
【专利技术属性】
技术研发人员:不公告发明人,
申请(专利权)人:北京中科寒武纪科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。