一种流执行方法及装置制造方法及图纸

技术编号：15640569 阅读：204 留言：0更新日期：2017-06-16 06:45

一种流执行方法及装置，该方法包括：预处理步骤，获得指令描述符流；层优化步骤，优化指令描述符流；以及构建指令流，根据所述优化后的指令描述符流构建指令流。

全部详细技术资料下载

【技术实现步骤摘要】
一种流执行方法及装置
本专利技术涉及人工神经网络
，更具体地涉及一种流执行方法及装置，用于神经网络处理器。
技术介绍
深度学习是机器学习的分支，它试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值(例如一幅图像)可以使用多种方式来表示，如每个像素强度值的向量，或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如，人脸识别或面部表情识别)。至今已有数种深度学习框架，如深度神经网络、卷积神经网络和深度信念网络和递归神经网络已被应用计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。另外，深度学习已成为类似术语，或者说是神经网络的品牌重塑。随着深度学习(神经网络)的大热，神经网络处理器也应运而生，通过专门的内存和运算模块设计，神经网络处理器在进行深度学习运算时可以获得相比较通用处理器几十甚是上百倍的加速比，并且面积更小，功耗更低。为了方便应用神经网络处理器在各种不同网络结构上进行加速运算，如何高效的实现对神经网络处理器的功能重构也是一项非常重要的工作。在传统的神经网络处理器编程接口的编写过程中，为了实现最大限度的原子性和灵活性，接口的基本功能定义都以神经网络运算中的常用原子操作作为基础，例如卷积(Convolution)，池化(Pooling)，激活(Active)等。然而神经网络处理器由于其独特的内部体系结构设计，过于细小的原子操作的简单顺序拼接无法充分发挥它的硬件性能。
技术实现思路
鉴于现有...
一种流执行方法及装置

【技术保护点】
一种流执行方法，其中，包括：预处理步骤(S1)，获得指令描述符流；层优化步骤(S2)，优化指令描述符流；以及构建指令流(S3)，根据所述优化后的指令描述符流构建指令流。

【技术特征摘要】
1.一种流执行方法，其中，包括：预处理步骤(S1)，获得指令描述符流；层优化步骤(S2)，优化指令描述符流；以及构建指令流(S3)，根据所述优化后的指令描述符流构建指令流。2.根据权利要求1所述的流执行方法，其中，所述层优化步骤包括：层消除处理(S21)，消除指令描述符流中的冗余操作；和/或层融合处理(S22)，融合指令描述符流的可融合操作。3.根据权利要求2所述的流执行方法，其中，所述层消除处理(S21)包括：遍历指令描述符流中指令描述符；判断指令描述符是否为冗余操作，若是，则去除冗余操作的指令描述符，否则保留指令描述符；以及输出无冗余操作的指令描述符流。4.根据权利要求2所述的流执行方法，其中，所述层融合处理(S22)包括：遍历指令描述符流中指令描述符；判断指令描述符流代表的网络结构中是否存在可融合的层，若是，则根据网络结构中可融合的层简化指令描述符序，否则保留指令描述符；以及输出无可融合网络结构的指令描述符流。5.根据权利要求1所述的流执行方法，其中，所述...

【专利技术属性】
技术研发人员：陈云霁，李韦，杜子东，郭崎，陈天石，
申请(专利权)人：上海寒武纪信息科技有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人