一种用于卷积神经网络加速的多层数据分区域联合计算方法技术

技术编号：22077068 阅读：54 留言：0更新日期：2019-09-12 14:36

本发明专利技术提供一种用于卷积神经网络加速的多层数据分区域联合计算方法，包括如下步骤：步骤1，将第一全连接层图像划分为若干个第一全连接层区域，反向推导各第一全连接层区域的图像数据所分别对应的输入图像数据，按照反向推导结果将输入图像划分为若干个与第一全连接层区域一一对应的输入图像区域；步骤2，对各输入图像区域依次进行卷积运算直到各自对应的第一全连接层区域，在对后一个输入图像区域进行卷积运算的过程中，对前一个输入图像区域对应的第一全连接层区域的权值数据进行读取和运算。降低了运算时硬件系统所需的带宽及存储量，平衡了卷积神经网络卷积层与全连接层对硬件资源的需求关系。

A Joint Multilayer Data Subarea Computing Method for Convolutional Neural Network Acceleration

全部详细技术资料下载

【技术实现步骤摘要】
一种用于卷积神经网络加速的多层数据分区域联合计算方法
本专利技术涉及卷积神经网络运算的数据流调度技术，具体涉及一种用于卷积神经网络加速的多层数据分区域联合计算方法。
技术介绍
深度学习是近几年机器学习的一个研究热点，在许多方向都取得了优异的成果。现在，深度学习在许多学科领域都具备越来越重要的作用。然而受限于硬件设备，深度学习的运算速度要慢于传统的人工神经运算网络以及一些其他的机器学习方法。因此在一些需要高性能的计算和电脑运算领域，深度学习的加速显得格外重要。对于深度学习算法的硬件加速，目前通常有三类实现方式，包括多核CPU、GPU和FPGA，它们的共同特点是可以实现高并行度的计算。然而，因为这些方法需求大量的运算硬件并消耗很多能耗，并不适合于移动设备。深度学习神经网络有非常多的分类，比较著名的有卷积神经网络(CNN)以及循环神经网络(RNN)。CNN是一种生物自然视觉认知机制启发而来的神经网络，对于视觉图像的处理有着独特的优势，近几年来，CNN网络已经由最初的LeNet-5逐渐演变出了AlexNet、VGG、GoogLeNet等新的结构。如何灵活、高效地完成各类网络成为当前研究热点。目前常见的加速策略是根据算法架构，设计相应的网络数据流调度，提高数据复用和计算并行度。专用集成电路(ASIC)是针对一种确定算法而设计的电路，速度快，效率高，然而ASIC的面积和资源有限，所以需要通过设计相应的网络数据流调度机制来对资源进行合理的分配利用。Google在设计实现TPU架构过程中，利用脉动阵列对数据流进行调度；美国MIT提出RowSaturation(RS)数据流...

【技术保护点】
1.一种用于卷积神经网络加速的多层数据分区域联合计算方法，其特征在于，包括如下步骤：步骤1，将第一全连接层图像划分为若干个第一全连接层区域，反向推导各第一全连接层区域的图像数据所分别对应的输入图像数据，按照反向推导结果将输入图像划分为若干个与第一全连接层区域一一对应的输入图像区域；步骤2，对各输入图像区域依次进行卷积运算直到各自对应的第一全连接层区域，在对后一个输入图像区域进行卷积运算的过程中，对前一个输入图像区域对应的第一全连接层区域的权值数据进行读取和运算。

【技术特征摘要】
1.一种用于卷积神经网络加速的多层数据分区域联合计算方法，其特征在于，包括如下步骤：步骤1，将第一全连接层图像划分为若干个第一全连接层区域，反向推导各第一全连接层区域的图像数据所分别对应的输入图像数据，按照反向推导结果将输入图像划分为若干个与第一全连接层区域一一对应的输入图像区域；步骤2，对各输入图像区域依次进行卷积运算直到各自对应的第一全连接层区域，在对后一个输入图像区域进行卷积运算的过程中，对前一个输入图像区域对应的第一全连接层区域的权值数据进行读取和运算。2.根据权利要求1所述的用于卷积神经网络加速的多层数据分区域联合计算方法，其特征在于，步骤1中，各第一全连接层区域均为正方形。3.根据权利要求2所述的用于卷积神经网络加速的多层数据分区域联合计算方法，其特征在于，步骤1中，各第一全连接层区域面积相等。4.根据权利要求1所述的用于卷积神经网络加...

【专利技术属性】
技术研发人员：杨晨，张海波，王逸洲，王小力，耿莉，
申请(专利权)人：西安交通大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人