用于神经网络的处理器和处理方法技术

技术编号：17111110 阅读：40 留言：0更新日期：2018-01-24 22:47

本发明专利技术提供一种用于神经网络的处理器，该处理器包括：存储单元，其用于存储数据和指令；控制单元，其用于获得保存在所述存储单元的指令并发出控制信号；计算单元，其用于从所述存储单元获得神经网络中的一层的节点值和对应的权重值以获得下一层的节点值，其中，当至少待计算元素之一小于阈值时，该计算单元不执行该计算元素的乘法操作，所述待计算元素包括节点值和权重值。利用本发明专利技术的处理器，能够提高神经网络的计算效率并节省功耗。

Processing and processing methods for neural networks

The present invention provides a method for neural network processor, the processor includes a storage unit for storing data and instructions; the control unit, which was used to get stored in the storage unit of the instruction and sends control signal; calculating unit, for from the storage unit to obtain weights of node layer neural network the value and the value corresponding to the node to obtain the next layer of value, which, when at least one of the elements is less than the threshold calculation, the calculation of multiplication operation unit does not perform the calculation of elements, the elements to be calculated including the node value and weight value. The processor of the invention can improve the computational efficiency of the neural network and save power.

全部详细技术资料下载

【技术实现步骤摘要】
用于神经网络的处理器和处理方法
本专利技术涉及人工智能
，尤其涉及一种应用于神经网络的处理器和处理方法。
技术介绍
人工智能技术在近些年来得到了迅猛的发展，在全世界范围内得到了广泛的关注，无论是工业界还是学术界都开展了人工智能技术的研究工作，目前，人工智能技术已经渗透至视觉感知、语音识别、辅助驾驶、智能家居、交通调度等各个领域。深度学习技术是人工智能技术发展的助推器，深度学习采用深度神经网络的拓扑结构进行训练、优化及推理等，深度神经网络包括卷积神经网络、深度置信网络、循环神经网络等。以图像识别应用为例，经过反复训练、迭代，深度学习算法通过深度神经网络可以自动地获得隐藏的图像的特征数据，并且产生优于传统的基于模式识别分析方法的效果。然而，实现深度学习技术依赖于极大的计算量。在训练阶段，需要在海量数据中通过反复迭代计算得到神经网络中的权重数据；在推理阶段，同样需要神经网络在极短的响应时间(通常为毫秒级)内完成对输入数据的运算处理，这需要所部署的神经网络运算电路(包括CPU、GPU、FPGA和ASIC等)达到每秒千亿次甚至万亿次的计算能力。随着神经网络运算电路的规模越来越大、数据吞吐量越来越高，运行功耗成为一个严重问题。因此，神经网络处理器如何在保证高性能的同时保证高能效，是目前亟待解决的技术问题。
技术实现思路
本专利技术的目的在于克服上述现有技术的缺陷，提供一种神经网络的处理器及处理方法，尤其适用于存在大量接近零的计算元素的稀疏神经网络。根据本专利技术的第一方面，提供了一种用于神经网络的处理器。该处理器包括：存储单元，其用于存储数据和指令；控制单元，其用于...
用于神经网络的处理器和处理方法

【技术保护点】
一种用于神经网络的处理器，包括：存储单元，其用于存储数据和指令；控制单元，其用于获得保存在所述存储单元的指令并发出控制信号；计算单元，其用于从所述存储单元获得神经网络中的一层的节点值和对应的权重值以获得下一层的节点值，其中，当至少待计算元素之一小于阈值时，该计算单元不执行该计算元素的乘法操作，所述待计算元素包括节点值和权重值。

【技术特征摘要】
1.一种用于神经网络的处理器，包括：存储单元，其用于存储数据和指令；控制单元，其用于获得保存在所述存储单元的指令并发出控制信号；计算单元，其用于从所述存储单元获得神经网络中的一层的节点值和对应的权重值以获得下一层的节点值，其中，当至少待计算元素之一小于阈值时，该计算单元不执行该计算元素的乘法操作，所述待计算元素包括节点值和权重值。2.根据权利要求1所述的处理器，其中，所述计算单元包括：乘法单元，用于完成节点值和权重值的乘法操作；加法单元，用于对乘法单元的计算结果进行累加；比较单元，用于将所述计算元素与阈值进行比较，当所述计算元素小于阈值时，该比较单元输出第一控制信号以指示所述乘法单元不执行该计算元素的乘法操作，当所述计算元素大于等于阈值时，该比较单元输出第二控制信号以指示所述乘法单元执行该计算元素的乘法操作。3.根据权利要求2所述的处理器，其中，所述计算单元还包括：数据选择器，其控制端与所述比较单元的输出连接，第一输入端接入零值，第二输入端接入所述乘法单元的输出，当该数据选择...

【专利技术属性】
技术研发人员：韩银和，许浩博，王颖，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人