一种卷积神经网络硬件模块部署方法技术

技术编号：18713420 阅读：56 留言：0更新日期：2018-08-21 23:03

本发明专利技术公开一种卷积神经网络硬件模块部署方法,涉及卷积神经网络实现领域；利用卷积神经网络的上层编译器根据目标硬件资源及卷积神经网络模型的数据体量，对卷积神经网络的实现形式进行模拟比较，权衡硬件资源与卷积神经网络速度的要求，确定卷积神经网络各个硬件模块的部署参数，划分各个硬件模块的数量及确定硬件模块间的连接方式，以实现卷积神经网络硬件模块部署。

A convolutional neural network hardware module deployment method

The invention discloses a hardware module deployment method of convolution neural network, which relates to the field of convolution neural network implementation; the upper compiler of convolution neural network simulates and compares the implementation forms of convolution neural network according to the target hardware resources and the volume of data of convolution neural network model, and weighs the hardware resources and convolution. According to the speed requirement of neural network, the deployment parameters of each hardware module of convolutional neural network are determined, the number of each hardware module is divided, and the connection mode between hardware modules is determined.

全部详细技术资料下载

【技术实现步骤摘要】
一种卷积神经网络硬件模块部署方法
本专利技术公开一种卷积神经网络硬件模块部署方法,涉及卷积神经网络实现领域。
技术介绍
卷积神经网络（CNN）是多层感知机（MLP）的一个变种模型。它从生物学概念中演化而来，视觉皮层细胞以某种方法覆盖整个视觉域，就像一些滤波器一样，它们对输入的图像是局部敏感的，因此能够更好地挖掘出自然图像中的目标的空间关系信息。CNN通过加强神经网络中相邻层之间节点的局部连接模式来挖掘自然图像中兴趣目标的空间局部关联信息。CNN的部署方式目前大多为采用X86架构CPU平台+GPU方式作为硬件环境，在实时操作系统中运行如TensorFlow、Caffe等软件框架，模型参数设置好后开始训练及推理过程。在应用端由于资源等限制，往往只能运行体量较小的模型，且模型运行效率较低，识别速度远低于PC端水平。本专利技术公开了一种卷积神经网络硬件模块部署方法，以硬件电路的形式实现某种卷积神经网络模型，通过结合目标硬件资源及神经网络模型体量，权衡资源与速度要求，对硬件模块进行数量分配及连接方式划分，可以充分利用硬件逻辑与存储资源，高效快速完成卷积神经网络每一层的实现部署，及不同结构层之间的转换部署。可灵活实现各种神经硬件结构，且能将前沿研发尽早转化成硬件实现，提升开发效率。
技术实现思路
本专利技术针对现有技术的问题，提供一种卷积神经网络硬件模块部署方法，采用特定结构硬件资源，针对不同神经网络特征，实时部署CNN到应用端，可极大发挥神经网络价值。本专利技术提出的具体方案是：一种卷积神经网络硬件模块部署方法：卷积神经网络的上层编译器根据目标硬件资源及卷积神经网络模型...

【技术保护点】
1.一种卷积神经网络硬件模块部署方法，其特征是卷积神经网络的上层编译器根据目标硬件资源及卷积神经网络模型的数据体量，对卷积神经网络的实现形式进行模拟比较，权衡硬件资源与卷积神经网络速度的要求，确定卷积神经网络各个硬件模块的部署参数，划分各个硬件模块的数量及确定硬件模块间的连接方式，以实现卷积神经网络硬件模块部署。

【技术特征摘要】
1.一种卷积神经网络硬件模块部署方法，其特征是卷积神经网络的上层编译器根据目标硬件资源及卷积神经网络模型的数据体量，对卷积神经网络的实现形式进行模拟比较，权衡硬件资源与卷积神经网络速度的要求，确定卷积神经网络各个硬件模块的部署参数，划分各个硬件模块的数量及确定硬件模块间的连接方式，以实现卷积神经网络硬件模块部署。2.根据权利要求1所述的方法，其特征是所述卷积神经网络的硬件模块包括卷积神经网络的基础模块和由卷积神经网络模型特征决定的特有模块，其中基础模块包括卷积模块，池化模块，累加模块，数据存取模块，指令解析分发模块。3.根据权利要求2所述的方法，其特征是根据目标硬件资源及卷积神经网络模型的数据体量，对卷积神经网络的实现形式进行模拟比较，权衡硬件资源与卷积神经网络速度的要求，确定卷积神经网络的卷积模块基本单元大小、数量，以及是否将卷积模块的基本单元进行组合。4.根据权利要求2或3所述的方法，其特征是根据目标硬件资源及卷积神经网络模型的数据体量，对卷积神经网络的实现形式进行...

【专利技术属性】
技术研发人员：王子彤，姜凯，聂林川，
申请(专利权)人：济南浪潮高新科技投资发展有限公司，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人