卷积神经网络优化机构制造技术

技术编号：19321504 阅读：16 留言：0更新日期：2018-11-03 11:27

本发明专利技术涉及卷积神经网络优化机构。公开了一种促进卷积神经网络（CNN）的优化的装置。所述装置包括优化逻辑，所述优化逻辑要接收具有指令列表的CNN模型，并且所述优化逻辑包括通过消除所述指令列表中包括权重值0的分支对所述指令列表进行优化的修剪逻辑。

Convolution neural network optimization mechanism

The invention relates to a convolution neural network optimization mechanism. A device for optimizing the convolution neural network (CNN) is disclosed. The device includes an optimization logic that receives a CNN model with an instruction list, and the optimization logic includes pruning logic that optimizes the instruction list by eliminating branches of the instruction list that include a weight value of 0.

全部详细技术资料下载

【技术实现步骤摘要】
卷积神经网络优化机构
实施例大体上涉及数据处理，并且更具体地涉及经由通用图形处理单元的数据处理。版权通告本专利文档的公开内容的一部分包含受到（版权或掩模作品）保护的材料。（版权或掩模作品）拥有者不反对由任何人对该专利文档或该专利公开内容的摹真复制，由于其出现在专利和商标局专利文件或记录中，但是，（版权或掩模作品）拥有者无论如何都以其他方式保留所有（版权或掩模作品）权利。
技术介绍
当前的并行图形数据处理包括被开发以对图形数据执行特定操作的系统和方法，这些特定操作诸如例如线性内插、镶嵌、栅格化、纹理映射、深度测试等。传统上，图形处理器使用了固定功能计算单元来处理图形数据；然而，最近，图形处理器的多个部分已变得可编程，从而使得这样的处理器能够支持用于处理顶点和片段数据的更广泛种类的操作。为了进一步提高性能，图形处理器通常实现处理技术（诸如，流水线操作），这些处理技术试图贯穿图形流水线的不同部分来并行处理尽可能多的图形数据。具有单指令多线程（SIMT）架构的并行图形处理器被设计成最大化图形流水线中的并行处理量。在SIMT架构中，多组并行线程试图尽可能经常地一起同步执行程序指令，以提高处理效率。用于SIMT架构的软件和硬件的一般性概述可以在ShaneCook的CUDA编程（CUDAProgramming），第3章，第37-51页（2013年）中找到。附图说明为了以能够详细理解本专利技术实施例的以上记载特征的方式，可以通过参考实施例来进行以上简要概括的实施例的更具体的描述，这些实施例中的一些在所附附图中被图示。然而，应当注意，所附附图仅图示了典型实施例，并因此不应被...

【技术保护点】
1.一种促进卷积神经网络（CNN）的优化的装置，包括；图形处理单元，具有执行NN运算的多个执行单元；以及优化逻辑，用于接收具有指令列表的CNN模型，并通过消除所述指令列表中包括第一权重值的分支对所述指令列表进行优化。

【技术特征摘要】
2017.04.17 US 15/4885511.一种促进卷积神经网络（CNN）的优化的装置，包括；图形处理单元，具有执行NN运算的多个执行单元；以及优化逻辑，用于接收具有指令列表的CNN模型，并通过消除所述指令列表中包括第一权重值的分支对所述指令列表进行优化。2.如权利要求1所述的装置，其中所述优化逻辑包括：修剪逻辑，用于通过忽视所述CNN模型中包括第二权重值的分支来对所述指令列表进行优化。3.如权利要求2所述的装置，其中所述修剪逻辑进一步通过消除所述CNN模型中具有所述第一权重值的预定阈值内的权重值的分支来对所述指令列表进行优化。4.如权利要求2所述的装置，其中所述修剪逻辑在接收到所述CNN模型时将所述CNN模型扩充到初等运算中。5.如权利要求4所述的装置，其中所述修剪逻辑压缩经优化的指令列表中的指令的表示。6.如权利要求4所述的装置，其中所述修剪逻辑生成执行经优化的指令列表中的指令的可执行应用。7.如权利要求1所述的装置，其中所述优化逻辑包括：一组量化图元，用于转换浮点数以执行在所述CNN处提供的卷积运算。8.如权利要求7所述的装置，其中所述优化逻辑进一步包括：一组反量化图元，用于转换浮点和整数。9.如权利要求1所述的装置，其中所述优化逻辑包括：窗口处理逻辑，用于消除与先前接收到的卷积窗口相比不包括附加信息的...

【专利技术属性】
技术研发人员：马立伟，E奥尔德艾哈迈德瓦尔，B拉克什马南，BJ阿什鲍格，J金，J博特莱森，MB麦克弗森，K尼利斯，D斯利瓦斯塔瓦，J雷，PT唐，MS斯特里克兰，X陈，姚安邦，T斯派斯曼，A科克，AR阿普，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人