The present invention provides a neural network processing unit and a processing system comprising the processing unit. The processing unit includes a multiplier module, the multiplier module contains multistage structure of pipeline, and for multiplication, neurons and neural network weights to be calculated in the implementation of the multiplication of the neurons and the right values for each level of the multiplier module structure sub operation; from the accumulator module. The control signal of the multiplier module multiplication results are cumulative operation or cumulative results based on the output from the accumulator module. Using the processing unit and processing system of the invention, the calculation efficiency and resource utilization rate of the neural network can be improved.
【技术实现步骤摘要】
神经网络处理单元及包含该处理单元的处理系统
本专利技术涉及深度学习
,尤其涉及一种神经网络处理单元和包含该处理单元的处理系统。
技术介绍
近年来,深度学习技术得到了飞速的发展,在解决高级抽象认知问题,例如图像识别、语音识别、自然语言理解、天气预测、基因表达、内容推荐和智能机器人等领域得到了广泛应用,成为学术界和工业界的研究热点。深度神经网络是人工智能领域具有最高发展水平的感知模型之一,其通过建立模型来模拟人类大脑的神经连接结构,通过多个变换阶段分层对数据特征进行描述,为图像、视频和音频等大规模数据处理任务带来突破性进展。深度神经网络模型是一种运算模型,由大量节点通过网状互连结构构成,这些节点被称为神经元。每两个节点间连接强度都代表通过该连接信号在两个节点间的加权重,即权重,与人类神经网络中的记忆相对应。然而,在现有技术中,神经网络存在处理速度慢,运行功耗大等问题。这是由于深度学习技术依赖于极大的计算量,例如,在训练阶段,需要在海量数据中通过反复迭代计算得到神经网络中的权重数据;在推理阶段,同样需要神经网络在极短的响应时间(通常为毫秒级)内完成对输入数据的运算处理,特别是当神经网络应用于实时系统时,例如,自动驾驶领域。神经网络中涉及的计算主要包括卷积操作、激活操作和池化操作等,其中,卷积操作和池化操作占用了神经网络处理的大部分时间。因此,需要对现有技术进行改进,以提高神经网络中卷积操作和池化操作等的计算效率和对输入数据的响应速度,使神经网络的适用范围更广。
技术实现思路
本专利技术的目的在于克服上述现有技术的缺陷,提供一种基于流水线的神经网络处理单元和包含 ...
【技术保护点】
一种神经网络处理单元,其特征在于,包括:乘法器模块,所述乘法器模块包含构成流水线的多级结构,并用于执行神经网络中待计算的神经元和权值的乘法运算,其中,所述乘法器模块的每一级结构完成所述神经元和权值的乘法运算的子运算;自累加器模块,所述自累加器模块基于控制信号对所述乘法器模块的乘法运算结果进行累加运算或将累加结果输出。
【技术特征摘要】
1.一种神经网络处理单元,其特征在于,包括:乘法器模块,所述乘法器模块包含构成流水线的多级结构,并用于执行神经网络中待计算的神经元和权值的乘法运算,其中,所述乘法器模块的每一级结构完成所述神经元和权值的乘法运算的子运算;自累加器模块,所述自累加器模块基于控制信号对所述乘法器模块的乘法运算结果进行累加运算或将累加结果输出。2.根据权利要求1所述的神经网络处理单元,其特征在于,所述乘法器模块包括:输入级,由数据选通器构成,用于接收所述神经元和权值;多个中间级,排列为二叉树结构,由寄存器和加法器构成,每个中间级用于执行权值和神经元的乘法的子运算并传递中间结果;乘法输出级,用于输出所述神经元和权值的相乘结果。3.根据权利要求1所述的神经网络处理单元,其特征在于,所述自累加器模块包括累加器和第一数据选通器,所述累加器的第一输入端接收所述乘法器模块的输出,所述累加器的输出端通过由所述控制信号控制的所述第一数据选通器与所述累加器的第二输入端连接。4.一种神经网络处理系统,其特征在于,包括:处理单元阵列,由多个根据权利要求1至3中任一项所述的处理单元构成,用于获得卷积层的输出神经元;池化单元,用于对所述卷积层的输出神经元进行池化处理;控制单元,用于控制神经网...
【专利技术属性】
技术研发人员:韩银和,闵丰,许浩博,王颖,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。