人工神经网络处理装置制造方法及图纸

技术编号:17304911 阅读:46 留言:0更新日期:2018-02-18 23:24
本申请公开一种用于运行神经网络的处理器,其包括内存控制器组、片上总线和处理器内核。处理器内核进一步包括:寄存器、指令模块、数据传输控制器、数据写调度单元、缓存池、数据读调度单元和计算模块。该处理器支持多种神经网络算法并且可以显著提高运算效率。

Artificial neural network processing device

The present application discloses a processor for running a neural network, which includes a memory controller group, an on-chip bus, and a processor kernel. The processor core further includes registers, instruction module, data transmission controller, data write scheduling unit, buffer pool, data read and dispatch unit and computing module. The processor supports a variety of neural network algorithms and can significantly improve the operational efficiency.

【技术实现步骤摘要】
人工神经网络处理装置专利
本申请涉及人工神经网络,例如卷积神经网络(CNN)。更具体地,本申请涉及一种用于实现人工神经网络的处理装置。
技术介绍
人工智能近年得到迅速发展,极大地影响了人们的生活。基于人工神经网络,尤其是卷积神经网络(CNN,ConvolutionalNeuralNetwork)的方法在很多应用中、例如在计算机视觉领域中得到广泛使用。图1示出了典型的深度卷积神经网络(CNN)的实施例。如图1所示,典型的CNN由一系列有序运行的层组成。CNN模型的参数被称为“权重”。CNN的第一层读取输入图像,并输出一系列的特征图。下一层读取由上一层产生的特征图,并输出新的特征图。最后,一个分类器输出输入图像可能属于的每一类别的概率。CNN中两种基本层类型包括卷积层(CONV层)和全连层(FC层),在CONV层之后通常有池化层(Pooling层)。例如,对于一个CNN层,表示第j个输入特征图,表示第i个输出特征图,bi表示第i个输出图的偏置项。对于CONV层,nin和nout分别代表输入和输出特征图的数量。对于FC层,nin和nout分别代表输入和输出特征向量的长度。此时,CONV层以本文档来自技高网...
人工神经网络处理装置

【技术保护点】
一种用于运行神经网络的神经网络处理器,包括:内存控制器组,其包括一个或多个内存控制器,每个内存控制器用于访问对应的外部储存芯片,所述外部储存芯片储存神经网络数据和指令;片上总线,用于内存控制器组与处理器内核阵列之间的通信;和处理器内核阵列,所述处理器内核阵列包括一个或多个处理器内核,每个处理器内核进一步包括:寄存器,用于配置神经网络处理器的工作参数和获取神经网络处理器的工作状态;指令模块,用于获取并解析外部储存芯片中的指令并将解析结果传递至数据传输控制器;数据传输控制器,用于基于指令模块的解析结果将神经网络数据写入数据写调度单元,以及将计算模块的计算结果从数据读调度单元写回外部储存芯片;数据写...

【技术特征摘要】
1.一种用于运行神经网络的神经网络处理器,包括:内存控制器组,其包括一个或多个内存控制器,每个内存控制器用于访问对应的外部储存芯片,所述外部储存芯片储存神经网络数据和指令;片上总线,用于内存控制器组与处理器内核阵列之间的通信;和处理器内核阵列,所述处理器内核阵列包括一个或多个处理器内核,每个处理器内核进一步包括:寄存器,用于配置神经网络处理器的工作参数和获取神经网络处理器的工作状态;指令模块,用于获取并解析外部储存芯片中的指令并将解析结果传递至数据传输控制器;数据传输控制器,用于基于指令模块的解析结果将神经网络数据写入数据写调度单元,以及将计算模块的计算结果从数据读调度单元写回外部储存芯片;数据写调度单元,用于将神经网络数据和计算模块的计算结果写入缓存池;缓存池,用于储存神经网络数据和计算模块的计算结果,所述计算结果包括中间计算结果和最终计算结果;数据读调度单元,用于从缓存池读取计算所需的数据和计算模块的计算结果;和计算模块,其包括一个或多个计算单元,用于进行运行神经网络所需的计算。2.根据权利要求1的神经网络处理器,其中,缓存池还包括一个或多个缓存块。3.根据权利要求1的神经网络处理器,其中,数据写调度单元还包括:一个或多个写调度通道,每个写调度通道用于与所述一个或多个计算单元中的对应计算单元的输出连通;和写仲裁单元,用于根据预定规则对所述一个或多个写调度通道进行排队,从而对所述一个或多个计算单元的计算结果的写入进行调度。4.根据权利要求1或3的神经网络处理器,其中,数据读调度单元还包括:一个或多个读调度通道,每个读调度通道用于与所述一个或多个计算单元中的对应计算单元的输入连通;和写仲裁单元,用于根据预定规则对所述一个或多个读调度通道进行排队,从而对所述...

【专利技术属性】
技术研发人员:方绍峡隋凌志于谦王俊斌单羿
申请(专利权)人:北京深鉴科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1