【技术实现步骤摘要】
一种面向神经网络的数据重用指令映射方法、系统及装置
本专利技术涉及计算机体系结构领域,特别是计算机体系结构中数据流体系指令映射的解决方法和系统。
技术介绍
随着E级数据时代的来临,计算芯片需要处理的数据集和数据规模越来越大,多核处理器结构已经成为计算机处理大数据的主流。在多核处理器结构当中,数据集被分配在各个不同的处理器核上,处理器核之间协同工作,将一个大的处理任务切割成为多个小任务,处理单元(PE)以细粒度小规模处理数据,从而完成大数据的任务。然而,由于“摩尔定律”的限制,计算机中“存储墙”所带来的限制越来越大。“存储墙”是指处理器的时钟频率和性能以超乎想象的速度增长但是主存的访问速度主要是DRAM的增长却要缓慢的多,从而造成数据的传输速度远低于数据的处理速度,导致内存带宽“喂不饱”处理器,限制了计算芯片处理数据的性能。为了能够缓解“存储墙”带来的问题,提高计算芯片的处理性能,通常采用的方法是增加数据的复用性,让数据在芯片的片上网络尽可能“呆的时间长一点”,使得每一个处理单元PE(ProcessElement)的源数据或者结果数据可以直接传递给其他的PE,这种方 ...
【技术保护点】
1.一种面向神经网络的数据重用指令映射方法,其特征在于,所述方法包括:步骤1、在处理单元阵列上,每次只映射一层神经元节点的计算;对于第一层神经元节点,每一个处理单元需要完成K个神经元节点的计算,其中,
【技术特征摘要】
2018.07.03 CN 20181071837301.一种面向神经网络的数据重用指令映射方法,其特征在于,所述方法包括:步骤1、在处理单元阵列上,每次只映射一层神经元节点的计算;对于第一层神经元节点,每一个处理单元需要完成K个神经元节点的计算,其中,M为第一层神经元节点的个数,N*N为处理器中处理单元阵列的规模;步骤2、处理单元阵列将需要输入的数据读入到所述处理单元阵列之后,不再读入神经网络的输入数据,处理单元之间的数据流向为环形结构;步骤3、当输入数据流动到处理单元上时,处理单元从内存中读入相应的权值进行乘加计算;当所有所述乘加计算计算完毕之后,激活函数,从而获得第一层隐藏层的结果;步骤4、将所述第一隐藏层的结果作为第二隐藏层的输入,以此类推,直至计算完全部隐藏层的结果。2.根据权利要求1所述的方法,其特征在于,所述步骤1进一步包括,对于每个神经元节点,从内存中读入输入数据、与输入数据对应的权值,进行乘加计算;每个所述神经元节点输入数据和权值的规模为将所述输入数据平均分配在每一个所述处理单元上,其中D为输入层节点的个数。3.根据权利要求1所述的方法,其特征在于,所述步骤2进一步包括,所述处理单元之间的数据流向呈环形结构,每个所述处理单元向其下游的处理单元传递当前处理单元当前持有的输入数据X,并且接受上一个处理单元传入的数据Y;同时,每个处理单元从所述内存中读入所述数据Y的相应的权值,进行乘加计算。4.根据权利要求1所述的方法,其特征在于,所述步骤3进一步包括,对于每一层的神经元节点计算,数据只需要做一次周期性的流动。5.根据权利要求1所述的方法,其特征在于,所述步骤4进一步包括,当一隐藏层计算完毕之后,其计算结果分布式的存储在处理单元阵列...
【专利技术属性】
技术研发人员:欧焱,李易,范东睿,叶笑春,李文明,
申请(专利权)人:北京中科睿芯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。