An array of N processing units. Each processing unit includes an accumulator, an arithmetic unit, a weight input, and a multi task register. The arithmetic unit executes the operation of the first, second and third inputs, and stores the results to the accumulator. The first input sink accumulator outputs. Second input receive weight input. The multitasking buffer has first and second data inputs, outputs, and control inputs. This output is received by the third input and the second data input of the adjacent processing unit multi task register. When the control input selects the second data input, the multitasking buffer operates like a N word rotator. The first / second memory respectively loads the N weight of the W column /D column / data text and provides the first data input to the corresponding weight input / multitasking buffer. Sequencer controls multitasking and memory.
【技术实现步骤摘要】
具有神经存储器与神经处理单元阵列与定序器的神经网络单元
本专利技术涉及一种处理器,特别涉及一种提升人工神经网络的运算效能与效率的处理器。本申请案主张下列的美国临时申请案的国际优先权。这些优先权案的全文并入本案以供参考。本申请案关联于下列同时提出申请的美国申请案。这些关联申请案的全文并入本案以供参考。
技术介绍
近年来,人工神经网络(artificialneuralnetworks,ANN)重新吸引了人们的注意。这些研究通常被称为深度学习(deeplearning)、计算机学习(computerlearning)等类似术语。通用处理器运算能力的提升也推升了人们在数十年后的现在对于人工神经网络的兴趣。人工神经网络近期的应用包括语言与影像辨识等。对于提升人工神经网络的运算效能与效率的需求似乎正在增加。
技术实现思路
有鉴于此,本专利技术提供一种装置。此装置包括一个由N个处理单元(PU)构成的阵列,一第一存储器,一第二存储器与一定序器。各个处理单元包括一累加器,一算术单元,一权重输入与一多任务缓存器。累加器具有一输出。算术单元具有第一,第二与第三输入,算术单元并对其执行一运算以产生一结果储存于累加器。此第一输入接收累加器的输出。权重输入由第二输入接收至算术单元。多任务缓存器具有第一与第二数据输入、一输出与一控制输入,此输出由第三输入接收至算术单元,控制输入控制对于第一与第二数据输入的选择。其中,多任务缓存器的输出并由一相邻处理单元的多任务缓存器的第二数据输入所接收,当控制输入选定第二数据输入时,N个处理单元的多个多任务缓存器集体运作如同一N个文字的旋转器。第一存储器装 ...
【技术保护点】
一种装置,其特征在于,包括:一个由N个处理单元(PU)构成的阵列,各该处理单元包括:一累加器,具有一输出;一算术单元,具有第一,第二与第三输入,并对其执行一运算以产生一结果储存于该累加器,该第一输入接收该累加器的该输出;一权重输入,由该第二输入接收至该算术单元;以及一多任务缓存器,具有第一与第二数据输入、一输出与一控制输入,该输出由该第三输入接收至该算术单元,该控制输入控制对于该第一与第二数据输入的选择;其中,该多任务缓存器的该输出并由一相邻处理单元的该多任务缓存器的该第二数据输入所接收,当该控制输入选定该第二数据输入时,该N个处理单元的该些多任务缓存器集体运作如同一N个文字的旋转器;一第一存储器,装载W列的N个权重文字,并将该W列的其中一列的该N个权重文字提供至该处理单元阵列的该N个处理单元的相对应的该权重输入,该第一存储器并具有一第一地址输入以指定该W列中的一列;一第二存储器,装载D列的N个数据文字,并将该D列的其中一列的该N个数据文字提供至该处理单元阵列的该N个处理单元的该多任务缓存器的相对应的该第一数据输入,该第二存储器并具有一第二地址输入以指定该D列中的一列;以及一定序器,产 ...
【技术特征摘要】
2015.10.08 US 62/239,254;2015.12.02 US 62/262,104;1.一种装置,其特征在于,包括:一个由N个处理单元(PU)构成的阵列,各该处理单元包括:一累加器,具有一输出;一算术单元,具有第一,第二与第三输入,并对其执行一运算以产生一结果储存于该累加器,该第一输入接收该累加器的该输出;一权重输入,由该第二输入接收至该算术单元;以及一多任务缓存器,具有第一与第二数据输入、一输出与一控制输入,该输出由该第三输入接收至该算术单元,该控制输入控制对于该第一与第二数据输入的选择;其中,该多任务缓存器的该输出并由一相邻处理单元的该多任务缓存器的该第二数据输入所接收,当该控制输入选定该第二数据输入时,该N个处理单元的该些多任务缓存器集体运作如同一N个文字的旋转器;一第一存储器,装载W列的N个权重文字,并将该W列的其中一列的该N个权重文字提供至该处理单元阵列的该N个处理单元的相对应的该权重输入,该第一存储器并具有一第一地址输入以指定该W列中的一列;一第二存储器,装载D列的N个数据文字,并将该D列的其中一列的该N个数据文字提供至该处理单元阵列的该N个处理单元的该多任务缓存器的相对应的该第一数据输入,该第二存储器并具有一第二地址输入以指定该D列中的一列;以及一定序器,产生一控制信号提供至该N个处理单元的该多任务缓存器的该控制输入,并且产生第一与第二地址分别提供至该第一与该第二地址输入。2.根据权利要求1所述的装置,其特征在于:一开始,该定序器会:产生该第二地址以指定该D列中的一列;产生该控制信号以选择该N个处理单元的该多任务缓存器的该第一数据输入;以及产生该第一地址以指定该W列中的一开始列;以及随后,对于该开始列后续该W列中的M列的每一列,该定序器会:产生该控制信号以选择该N个处理单元的该多任务缓存器的第二数据输入,而使该N个处理单元的该些多任务缓存器集体运作如同一N个文字的旋转器;以及产生该第一地址以指定该M列中的该列,M是一个正整数。3.根据权利要求2所述的装置,其特征在于,对于该开始列与该M列中的每一列,该算术单元将该第二输入与该第三输入相乘以产生一乘积,并将该乘积与该第一输入相加以产生该结果储存至该累加器。4.根据权利要求1所述的装置,其特征在于,各该处理单元并具有一启动函数单元(AFU),该启动函数单元接收该累加器的该输出并对其执行一启动函数以产生一第二结果,该第二结果的位宽度相同于各该N个数据文字。5.根据权利要求4所述的装置,其特征在于,该定序器产生该第二地址以指定该第二存储器的一列,该N个处理单元将其第二结果写入该第二地址指定的该第二存储器的该列的该N个数据文字中的相对应文字。6.根据权利要求1所述的装置,其特征在于,对于J个时钟周期中的每一个时钟周期,该定序器产生该第二地址以指定该第二存储器的一不同列,该N个处理单元将该累加器的J个文字中的不同文字写入该第二地址指定的该第二存储器的该列的该N个数据文字中的相对应文字,J至少是2。7.根据权利要求1所述的装置,其特征在于,该N个处理单元分成L个群组,各该群组具有J个处理单元,该装置还包括L个启动函数单元(AFU),各该启动函数单元由该L个群组中一相对应群组的该J个处理单元所共享,该L个启动函数单元中的各该启动函数单元接收该相对应群组的该J个处理单元中动态选择的一个处理单元的该累加器的该输出,并对其执行一启动函数以产生一第二结果,该第二结果的位宽度相同于该N个数据文字中的每一个数据文字。8.根据权利要求7所述的装置,其特征在于,还包括:一缓冲器,装载对应于该N个处理单元的N个文字,该缓冲器的该N个文字接收该L个启动函数单元所产生的该第二结果,以因应各该启动函数单元对接收自该相对应N个处理单元的该累加器的该输出执行该启动函数。9.根据权利要求8所述的装置,其特征在于,该缓冲器接收该N个第二结果后,该定序器产生该第二地址以指定该第二存储器的一列供该缓冲器写入该N个第二结果。10.根据权利要求7所述的装置,其特征在于,对于J个时钟周期中的各个时钟周期以及该L个勤组中的各个群组:该定序器选择该群组的该J个处理单元的其中之一,以将其累加器的该输出提供至该L个启动函数单元中的该相对应启动函数单元以产生该第二结果。11.根据权利要求1所述的装置,其特征在于,还包括:一存储器,可利用可由该定序器执行的指令予以程序化。12.根据权利要求1所述的装置,其特征在于,在该算术单元储存该结果的一第一范例于该累加器前,该定序器将该N个处理单元的该累加器清除为零。13.一种运作一装置的方法,其特征在于,该装置具有一个由N个处理单元(PU)构成的阵列,一第一存储器与一第二存储器,该第一存储器装载W列的N个权重文字并具有一第一地址输入以指定该W列中的一列,因此,该第一存储器并将该W列的其中一列的该N个权重文字提供至该处理单元阵列的该N个处理单元的相对应的该权重输入,该第二存储器装载D列的N个数据文字并具有一第二地址输入以指定该D列中的一列,因此,该第二存储器并将该D列的其中一列的该N个数据文字提供至该处理单元阵列的该N个处理单元的该多任务缓存器的相对应的该第一数据输入;以及一定序器,各该N个处理单元具有一累加器,一算术单元,一权重输入与一多任务缓存器,其...
【专利技术属性】
技术研发人员:G·葛兰·亨利,泰瑞·派克斯,
申请(专利权)人:上海兆芯集成电路有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。